智能体技能
让 AI 从“会想”走向“会做”
概述
把“具体怎么做一件事”封装成技能模块,让AI不只会想,还能真的执行。
关键要点
- 可执行、可复用
- 标准接口
- 可治理边界
应用场景
- 自动化流程
- 工具调用
- 业务执行
常见误区
- 没有边界易失控
- 依赖工具权限
📚 简单定义
Skills(技能)是 Agent 架构中一种可被模型自动触发的、结构化执行能力单元。 它通过标准化描述,教会大模型如何完成一类具体任务,并由模型自行判断何时使用、如何使用,而不是依赖人为显式调用或一次性的 Prompt。
一个 Skill 往往封装了对 Tools(工具) 的使用方式、执行步骤与约束规范,使 AI 能够将“思考结果”转化为稳定、可复用、可治理的实际行动。 因此,Skills 是 AI 从“只会生成内容”,迈向“能够可靠执行任务”的关键能力层。
🌱 形象类比
如果把 AI 看成一个正在工作的专业人士:
- LLM = 大脑 负责理解目标、分析问题、制定行动决策
- Skills = 工作方法与操作手册 告诉大脑:这一类事情应该怎么做、分几步做、用哪些工具做、做到什么标准
- Tools = 具体工具与设备 真正执行动作的载体,例如 API、脚本、数据库、业务系统接口
在这个过程中:LLM 负责“想”,Skills 负责“怎么做”,Tools 负责“真正去做”。 只有三者协同,AI 才能从“会说话的模型”,进化为“能干活的智能体”。
✨ 发展历史
🟦 早期阶段(2010 年前后) 规则与脚本驱动,能力分散、难以复用。
🟨 Prompt 驱动阶段(2022–2023 年) 通过 Prompt 教模型做事,执行依赖人工,难以治理。
🟩 Agent 化阶段(2024–2025 年) AI 开始自主决策并调用工具,需要可复用执行能力。
🟥 Skills 系统化阶段(2025 年至今) Anthropic 系统提出 Agent Skills 概念,执行能力模块化,由模型自动判断何时、如何使用。
✨ 常见用途
- 把思考变成行动:将推理结果落地为可执行流程。
- 封装可复用能力:一次定义,多场景复用。
- 增强可治理性:执行边界清晰,便于审计与控制。
🔑 关键特征
- 可执行性:不是回答,而是直接行动。
- 标准接口:有清晰的输入、输出和调用方式。
- 可组合:多个 Skills 可形成工作流。
- 可复用:一次封装,多处调用。
- 可治理:行为边界清晰,便于审计与控制。
🔧 工作原理(简化版)
1️⃣ 用户目标 / 任务指令
↓
2️⃣ LLM 推理(要做什么?)
↓
3️⃣ 选择合适的 Skill
↓
4️⃣ Skill 调用 Tools 执行(API / 函数 / 系统)
↓
5️⃣ 返回结果 → 进入下一轮推理
🔍 背后逻辑与工作机制
Skills 的核心思想是:把“怎么做事”从模型的即兴推理中拆出来,变成可控、可治理的能力模块。
🔹 Skill 定义:明确描述能力边界与执行规范,例如:查数据库、发邮件、调用搜索引擎、执行脚本、操作业务系统。
🔹 Skill 调用(Tool Calling / Function Calling):由 LLM 决定是否调用 Skill,以及在什么上下文下调用。
🔹 执行与反馈:Skill 内部协调 Tools 完成真实操作,并将结果返回给 Agent。
🔹 安全与治理:Skill 可审计、可限权,避免模型“自由发挥”导致风险。
这种设计让 Agent 系统更可靠、更工程化、更可扩展。
🎯 实用记忆小技巧
- LLM 负责想。
- Skills 负责怎么做。
- Tools 负责真正执行。
- 没有 Skills 的 Agent,只是“会说话”的模型。
🧩 相似概念对比
- 与 Prompt(提示词): Prompt 影响“怎么想、怎么说”;Skill 决定“怎么做、是否能稳定地做”。
- 与 Tool(工具): Tool 是能力本身;Skill 是对 Tool 的结构化封装 + 使用规范。
- 与 Plugin / API: Plugin 和 API 偏系统集成;Skill 偏 Agent 认知层,是“完成一类任务的方法”。
- 与 Workflow(工作流): Workflow 是固定流程;Skill 是可被模型动态组合的能力积木。
💡 一句话总结: Skills,让人工智能从“会说”进化为“会做”。