进阶 智能体与工具 5 分钟

智能体技能

让 AI 从“会想”走向“会做”

智能体技能

概述

把“具体怎么做一件事”封装成技能模块,让AI不只会想,还能真的执行。

关键要点

  • 可执行、可复用
  • 标准接口
  • 可治理边界

应用场景

  • 自动化流程
  • 工具调用
  • 业务执行

常见误区

  • 没有边界易失控
  • 依赖工具权限

📚 简单定义

Skills(技能)是 Agent 架构中一种可被模型自动触发的、结构化执行能力单元。 它通过标准化描述,教会大模型如何完成一类具体任务,并由模型自行判断何时使用、如何使用,而不是依赖人为显式调用或一次性的 Prompt。

一个 Skill 往往封装了对 Tools(工具) 的使用方式、执行步骤与约束规范,使 AI 能够将“思考结果”转化为稳定、可复用、可治理的实际行动。 因此,Skills 是 AI 从“只会生成内容”,迈向“能够可靠执行任务”的关键能力层。

🌱 形象类比

如果把 AI 看成一个正在工作的专业人士:

  • LLM = 大脑 负责理解目标、分析问题、制定行动决策
  • Skills = 工作方法与操作手册 告诉大脑:这一类事情应该怎么做、分几步做、用哪些工具做、做到什么标准
  • Tools = 具体工具与设备 真正执行动作的载体,例如 API、脚本、数据库、业务系统接口

在这个过程中:LLM 负责“想”,Skills 负责“怎么做”,Tools 负责“真正去做”。 只有三者协同,AI 才能从“会说话的模型”,进化为“能干活的智能体”。

✨ 发展历史

🟦 早期阶段(2010 年前后) 规则与脚本驱动,能力分散、难以复用。

🟨 Prompt 驱动阶段(2022–2023 年) 通过 Prompt 教模型做事,执行依赖人工,难以治理。

🟩 Agent 化阶段(2024–2025 年) AI 开始自主决策并调用工具,需要可复用执行能力。

🟥 Skills 系统化阶段(2025 年至今) Anthropic 系统提出 Agent Skills 概念,执行能力模块化,由模型自动判断何时、如何使用。

✨ 常见用途

  • 把思考变成行动:将推理结果落地为可执行流程。
  • 封装可复用能力:一次定义,多场景复用。
  • 增强可治理性:执行边界清晰,便于审计与控制。

🔑 关键特征

  • 可执行性:不是回答,而是直接行动。
  • 标准接口:有清晰的输入、输出和调用方式。
  • 可组合:多个 Skills 可形成工作流。
  • 可复用:一次封装,多处调用。
  • 可治理:行为边界清晰,便于审计与控制。

🔧 工作原理(简化版)

1️⃣ 用户目标 / 任务指令

2️⃣ LLM 推理(要做什么?)

3️⃣ 选择合适的 Skill

4️⃣ Skill 调用 Tools 执行(API / 函数 / 系统)

5️⃣ 返回结果 → 进入下一轮推理

🔍 背后逻辑与工作机制

Skills 的核心思想是:把“怎么做事”从模型的即兴推理中拆出来,变成可控、可治理的能力模块。

🔹 Skill 定义:明确描述能力边界与执行规范,例如:查数据库、发邮件、调用搜索引擎、执行脚本、操作业务系统。
🔹 Skill 调用(Tool Calling / Function Calling):由 LLM 决定是否调用 Skill,以及在什么上下文下调用。
🔹 执行与反馈:Skill 内部协调 Tools 完成真实操作,并将结果返回给 Agent。
🔹 安全与治理:Skill 可审计、可限权,避免模型“自由发挥”导致风险。

这种设计让 Agent 系统更可靠、更工程化、更可扩展

🎯 实用记忆小技巧

  • LLM 负责想。
  • Skills 负责怎么做。
  • Tools 负责真正执行。
  • 没有 Skills 的 Agent,只是“会说话”的模型。

🧩 相似概念对比

  • 与 Prompt(提示词): Prompt 影响“怎么想、怎么说”;Skill 决定“怎么做、是否能稳定地做”。
  • 与 Tool(工具): Tool 是能力本身;Skill 是对 Tool 的结构化封装 + 使用规范。
  • 与 Plugin / API: Plugin 和 API 偏系统集成;Skill 偏 Agent 认知层,是“完成一类任务的方法”。
  • 与 Workflow(工作流): Workflow 是固定流程;Skill 是可被模型动态组合的能力积木。

💡 一句话总结: Skills,让人工智能从“会说”进化为“会做”。