进阶智能体与工具 5 分钟

智能体技能

让 AI 从“会想”走向“会做”

概述

把“具体怎么做一件事”封装成技能模块，让AI不只会想，还能真的执行。

关键要点

可执行、可复用
标准接口
可治理边界

应用场景

自动化流程
工具调用
业务执行

常见误区

没有边界易失控
依赖工具权限

📚 简单定义

Skills（技能）是 Agent 架构中一种可被模型自动触发的、结构化执行能力单元。 它通过标准化描述，教会大模型如何完成一类具体任务，并由模型自行判断何时使用、如何使用，而不是依赖人为显式调用或一次性的 Prompt。

一个 Skill 往往封装了对 Tools（工具） 的使用方式、执行步骤与约束规范，使 AI 能够将“思考结果”转化为稳定、可复用、可治理的实际行动。因此，Skills 是 AI 从“只会生成内容”，迈向“能够可靠执行任务”的关键能力层。

🌱 形象类比

如果把 AI 看成一个正在工作的专业人士：

LLM = 大脑 负责理解目标、分析问题、制定行动决策
Skills = 工作方法与操作手册 告诉大脑：这一类事情应该怎么做、分几步做、用哪些工具做、做到什么标准
Tools = 具体工具与设备 真正执行动作的载体，例如 API、脚本、数据库、业务系统接口

在这个过程中：LLM 负责“想”，Skills 负责“怎么做”，Tools 负责“真正去做”。 只有三者协同，AI 才能从“会说话的模型”，进化为“能干活的智能体”。

✨ 发展历史

🟦 早期阶段（2010 年前后） 规则与脚本驱动，能力分散、难以复用。

🟨 Prompt 驱动阶段（2022–2023 年） 通过 Prompt 教模型做事，执行依赖人工，难以治理。

🟩 Agent 化阶段（2024–2025 年） AI 开始自主决策并调用工具，需要可复用执行能力。

🟥 Skills 系统化阶段（2025 年至今） Anthropic 系统提出 Agent Skills 概念，执行能力模块化，由模型自动判断何时、如何使用。

✨ 常见用途

把思考变成行动：将推理结果落地为可执行流程。
封装可复用能力：一次定义，多场景复用。
增强可治理性：执行边界清晰，便于审计与控制。

🔑 关键特征

可执行性：不是回答，而是直接行动。
标准接口：有清晰的输入、输出和调用方式。
可组合：多个 Skills 可形成工作流。
可复用：一次封装，多处调用。
可治理：行为边界清晰，便于审计与控制。

🔧 工作原理（简化版）

1️⃣ 用户目标 / 任务指令
↓
2️⃣ LLM 推理（要做什么？）
↓
3️⃣ 选择合适的 Skill
↓
4️⃣ Skill 调用 Tools 执行（API / 函数 / 系统）
↓
5️⃣ 返回结果 → 进入下一轮推理

🔍 背后逻辑与工作机制

Skills 的核心思想是：把“怎么做事”从模型的即兴推理中拆出来，变成可控、可治理的能力模块。

🔹 Skill 定义：明确描述能力边界与执行规范，例如：查数据库、发邮件、调用搜索引擎、执行脚本、操作业务系统。
🔹 Skill 调用（Tool Calling / Function Calling）：由 LLM 决定是否调用 Skill，以及在什么上下文下调用。
🔹 执行与反馈：Skill 内部协调 Tools 完成真实操作，并将结果返回给 Agent。
🔹 安全与治理：Skill 可审计、可限权，避免模型“自由发挥”导致风险。

这种设计让 Agent 系统更可靠、更工程化、更可扩展。

🎯 实用记忆小技巧

LLM 负责想。
Skills 负责怎么做。
Tools 负责真正执行。
没有 Skills 的 Agent，只是“会说话”的模型。

🧩 相似概念对比

与 Prompt（提示词）： Prompt 影响“怎么想、怎么说”；Skill 决定“怎么做、是否能稳定地做”。
与 Tool（工具）： Tool 是能力本身；Skill 是对 Tool 的结构化封装 + 使用规范。
与 Plugin / API： Plugin 和 API 偏系统集成；Skill 偏 Agent 认知层，是“完成一类任务的方法”。
与 Workflow（工作流）： Workflow 是固定流程；Skill 是可被模型动态组合的能力积木。

💡 一句话总结： Skills，让人工智能从“会说”进化为“会做”。