学习人工智能(AI) 从一张卡片开始
用学习卡片的方式,帮零基础用户建立 AI 的直觉理解。
不用代码、不用公式,3 分钟理解一个 AI 概念。
今日推荐
今日推荐卡片,快速感受内容形式与表达风格,让你对 AI 更懂一点
让机器拥有"智慧之光"
让机器在规则之外,学会处理复杂世界。
人工智能(AI)
让机器拥有"智慧之光"
📚 简单定义
人工智能(AI,Artificial Intelligence)是一门研究如何让机器展现类似人类智慧与行为的学科。通过感知环境、思考与决策、学习与适应,AI 试图解决复杂问题,协助或替代人类完成任务。
🌱 形象类比
人工智能就像一台“全能学习机”。它能模仿人类的思考方式,看图识字、听声辨人、分析问题,还能快速学习新技能。如果把任务比作考试,AI 就是那个拿着无数复习资料的“学霸”,能更快、更准确地解题。
✨ 发展历史
🟦 起步阶段(1950s–1970s)
1956 年达特茅斯会议提出“人工智能”概念。
🟨 瓶颈期(1970s–1980s)
算力与算法受限,AI 研究进入低谷。
🟩 复兴阶段(1980s–1990s)
反向传播推动神经网络复苏,专家系统应用兴起。
🟥 深度学习崛起(2000s 至今)
算力与大数据推动 AI 在多个领域落地。
🔑 关键特征
- 智能决策:不仅执行指令,还能根据环境和数据作出判断。
- 学习能力:通过机器学习、深度学习不断优化策略。
🔧 工作原理(简化版)
1️⃣ 感知输入(文本、图像、音频等多模态数据)
↓
2️⃣ 理解与分析(识别、理解、预测信息)
↓
3️⃣ 决策与行动(执行指令、调用工具、输出结果)
↓
4️⃣ 反馈与学习(基于结果持续优化模型与策略)
🔍 背后逻辑与工作机制
AI 的核心在于模拟人类的认知过程:
🔹 感知:通过传感器或数据输入获取信息(文本、图像、语音等)
🔹 理解:利用算法和模型对信息进行分析、推理与抽象
🔹 决策:基于分析结果选择并执行行动方案
🔹 学习与改进:借助机器学习 / 深度学习,从经验中持续优化表现
随着算力与算法的不断提升,
AI 已从早期的规则系统,逐步演进为以数据驱动的深度学习体系。
🎯 实用记忆小技巧
- 从泛化到专精:AI 是大伞,机器学习与深度学习是其下的进阶。
- 掌握基础概念:先理解流程、关键技术与应用场景。
🧩 相似概念对比
- 与机器学习(ML): ML 是 AI 的子集,专注让机器从数据中学习规律。
- 与深度学习(DL): DL 是 ML 的子领域,借助深层神经网络自动提取特征,AI 是总目标,DL 是尖端技术。
AI 的"智慧架构"
模仿神经连接方式的学习结构。
神经网络
AI 的"智慧架构"
📚 简单定义: 神经网络(Neural Network, NN)是一种受生物神经系统启发的算法,利用人工神经元模拟人脑的学习过程。通过连接成多层网络,它可以从数据中自动提取特征,完成分类、回归等任务,是机器学习和深度学习的核心技术之一。
🌱 形象类比
想象一个复杂的电话网络,每个电话节点(神经元)接收输入信号(数据),处理后再传递给下一个节点。神经网络就像这样的信号处理系统,通过层层传递和计算,找到输入与输出的最佳关系。
✨ 发展历史
🟦 萌芽阶段(20 世纪 40-50 年代)
1943 年 McCulloch 和 Pitts 提出人工神经元模型。
🟨 理论初探(1950-70 年代)
1958 年感知机问世,但无法处理非线性问题而遇冷。
🟩 复兴阶段(1980-90 年代)
1986 年反向传播算法推动多层神经网络复苏。
🟥 深度学习时代(2000 年至今)
算力与算法突破让神经网络广泛用于图像、语音、NLP 等领域。
🔑 关键特征
- 分层结构:输入层、隐藏层、输出层逐步提取特征。
- 权重与偏置:通过调整连接权重与偏置优化模型。
- 非线性映射:激活函数帮助模型学习复杂关系。
🔧 工作原理(简化版)
1️⃣ 输入数据(如图像或文本)
↓
2️⃣ 输入层:接收数据并传递到隐藏层
↓
3️⃣ 隐藏层:通过权重和激活函数提取特征
↓
4️⃣ 输出层:生成预测结果
↓
5️⃣ 优化:误差反向传播,调整权重
🔍 背后逻辑与工作机制
神经网络通过输入层接收原始数据,隐藏层提取特征,输出层生成结果;借助反向传播算法不断调整权重与偏置,以优化性能,成为解决复杂非线性问题的基础。
🎯 实用记忆小技巧
- 逐层学习:深度学习通过多层结构,从基础到复杂逐步提取特征。
- 自动化特征提取:无需人工干预,模型自行提炼核心模式。
AI 的“智慧引擎”
多层神经网络自动提取特征,驱动现代 AI 的核心动力。
深度学习(DL)
AI 的“智慧引擎”
📚 简单定义: 深度学习(Deep Learning, DL)是机器学习的一个子领域,利用多层神经网络模拟人脑的学习机制。通过层层抽象和特征提取,深度学习能够自动从复杂数据中学习模式,用于解决图像、语音和自然语言等领域的高难度任务。
🌱 形象类比
想象你在看一幅复杂的画作,先从局部颜色(低层特征)观察起,然后分析线条和形状(中层特征),最后理解整个画面的意义(高层特征)。深度学习的多层网络就是这样逐层“看图”,从简单到复杂提取关键信息。
✨ 发展历史
🟦 起步阶段(20 世纪 80-90 年代)
1980 年代 Hinton 提出玻尔兹曼机等概念,但受算力限制发展缓慢。
🟨 理论突破(2006 年)
Hinton 提出深度信念网络(DBN),标志深度学习重新兴起。
🟩 实践成功(2012 年)
AlexNet 在 ImageNet 竞赛中大获成功,深度学习崭露头角。
🟥 全面普及(2012 年至今)
推动自然语言处理、图像生成、自动驾驶等领域的技术突破和应用落地。
🔑 关键特征
- 多层结构:逐层提取数据特征。
- 自动特征提取:无需人工设计特征,模型从数据中自动学习。
- 海量数据 + 高算力:深层网络训练需要大量数据与高性能计算支持。
🔧 工作原理(简化版)
1️⃣ 输入数据(图像 / 文本等)
↓
2️⃣ 卷积层 / 隐藏层:提取低级到高级特征
↓
3️⃣ 分类层:输出预测结果
↓
4️⃣ 优化:反向传播调整权重
↓
5️⃣ 输出结果:分类、回归或生成内容
🔍 背后逻辑与工作机制
深度学习通过多层神经网络逐步分解任务:输入层接收原始数据,隐藏层逐步提取特征,输出层完成分类、回归或生成;反向传播不断调整参数以优化性能,擅长处理非结构化数据如图像、音频和自然语言。
🎯 实用记忆小技巧
- 逐层学习:从基础到复杂逐步提取特征。
- 自动化特征提取:模型自行提炼核心模式。
🧩 相似概念对比
- 与机器学习(ML):传统 ML 需人工特征,DL 依赖多层网络自动学习高级特征。
- 与神经网络(NN):DL 基于 NN 的更深版本,能处理更复杂任务,推动 AI 从“识别”到更强的理解与生成。
智能模型的“定向导航员”
用精心设计的提示词,引导模型输出更贴近预期的内容与风格。
提示工程
智能模型的“定向导航员”
📚 简单定义: 如果预训练和微调让模型拥有知识与能力,那么提示工程就是为模型指明方向的“导航技术”。它通过精心设计输入信息(提示词),引导模型输出更符合预期的答案和风格。模型越强大,提示工程越能让它发挥更精准与更有创意的表现。
🌱 形象类比
像给博学顾问下“任务卡”:不是只说“讲个故事”,而是“用童话风格,给 5 岁孩子讲一个关于友谊和勇气的短故事”。这种精巧的指令设计能让顾问(模型)更准确理解你的要求,给出更贴切的回答。
✨ 常见用途
🔹 定制问答风格:控制语气,如幽默、严肃或科普
🔹 明确写作格式:要求列表、表格或特定叙事结构
🔹 精准信息提取:指定关键词或领域,减少跑题
🔹 内容创作:为写作者提供更有针对性的情节或人设细节
🔹 教育辅助:用不同教学方式解释知识点(如面向儿童的科普)
🔹 数据查询:让模型用表格或列表格式提炼关键信息
🔑 关键特征
- 精确指令:清晰描述内容或格式,避免模糊
- 上下文引导:在提示中提供足够背景,让模型更明白你要什么
- 迭代优化:观察输出结果,反复打磨提示,提升质量
🔧 工作原理(简化版)
1️⃣ 已具备技能的模型(预训练 + 微调)
↓
2️⃣ 提示工程:像给模型定制任务说明书
↓
3️⃣ 模型输出更贴近用户预期的答案或文本
🔍 背后逻辑与工作机制
模型已有能力,但不一定清楚要“做什么、怎么做”。通过精确指令,你把期望传递给模型,让它在庞大语言空间中快速锁定理想的回答路径。
🎯 实用记忆小技巧
- 预训练让模型成“通才”,微调成“专才”,提示工程就是给这位“专才”制定清晰精确的工作说明书。
大模型驱动的“自主行动者”
将目标、规划、工具调用与反馈闭环结合,持续执行任务。
智能体
大模型驱动的“自主行动者”
📚 简单定义: 智能体(Agent)是能够感知环境、做出决策并采取行动以实现特定目标的人工智能系统。当智能体以大模型为“脑”构建时,不仅具备语言理解与生成能力,还能进行任务规划并调用外部工具执行。
🌱 形象类比
把智能体想象成一位“智能管家”:它不仅能回答问题,还能安排日程、预订餐厅、管理邮件,甚至在你不在家时调节设备。依托大模型的理解与决策能力,它能自主完成多种任务。
✨ 发展历史
🟦 早期
基于规则的专家系统,行动僵硬。
🟨 大模型时代
LLM 具备理解与生成能力,能做规划与语言工具调用。
🟩 工具生态
通过插件/函数调用连接数据库、API、浏览器等,实现闭环执行。
🔑 关键特征
- 自主决策:依托大模型分析信息,选择最合适的行动。
- 环境感知与工具执行:通过数据输入感知环境,并调用工具完成操作。
- 目标导向与反馈闭环:围绕目标执行,并根据反馈持续调整。
🔧 工作原理(简化版)
1️⃣ 感知环境与接收目标
↓
2️⃣ 大模型分析信息并制定计划
↓
3️⃣ 执行行动(调用工具)
↓
4️⃣ 反馈与调整,循环优化
🔍 背后逻辑与工作机制
智能体将“理解 + 计划 + 行动”整合:LLM 负责理解与推理,规划器拆解任务,工具层完成具体操作,记忆/日志用于反馈与校正。通过循环迭代来接近目标,但仍需边界与监督。
🎯 实用记忆小技巧
- 典型场景:多步骤自动化、信息收集与整理、客服/运营自动处理。
- 使用要点:明确目标、设定权限与安全约束、持续监控与复盘,防止跑偏或误用资源。
迈向“通用智慧”的未来之路
从“专才”走向“全才”的通用智能愿景。
通用人工智能(AGI)
迈向“通用智慧”的未来之路
📚 简单定义: 通用人工智能(Artificial General Intelligence, AGI)是人工智能的高级形式,旨在让机器具备像人类一样的通用学习与思考能力。与当前专注于单一任务的AI不同,AGI能够自主适应多种任务,并在不同领域展现出灵活的智能水平。
🌱 形象类比
想象一个博学的全能专家,他不仅擅长编程、翻译、下棋,还能快速学习新技能,例如烹饪或修理家电。AGI正是这样的“通才型助手”,在多种任务中展现出通用智慧,而不仅是擅长某一领域的“单项高手”。
✨ 常见用途
- 跨领域应用:从金融分析到环境保护,都能提供高效解决方案。
- 人机协作:与人类一起完成复杂任务,优化工作流程。
- 生活伴侣:在家庭中兼顾家务管理、教育陪伴、情感支持等角色。
🔑 关键特征
- 通用性:可在多种任务中自由切换,而无需针对性训练。
- 自我学习:能通过经验积累优化表现,解决全新问题。
- 自主决策:具备一定的推理与创造能力,应对复杂挑战。
🔧 工作原理(简化版)
1️⃣ 多模态感知(文本、图像、声音…)
↓
2️⃣ 自主学习与知识整合(动态构建知识体系)
↓
3️⃣ 任务推理与决策(跨领域智能应用)
↓
4️⃣ 反馈优化(不断提升通用能力)
🔍 背后逻辑与工作机制
AGI的实现依赖于以下核心技术:
- 跨领域学习:结合机器学习和深度学习,从多模态数据中提取通用特征。
- 记忆与推理:通过强化学习和知识图谱,建立长期记忆和逻辑推理能力。
- 自我优化:利用元学习(meta-learning),让模型通过自我训练提升适应性和效率。
与专用AI相比,AGI追求更高层次的通用性与灵活性,使其具备解决复杂社会问题的潜力。
🎯 实用记忆小技巧
- 通用智能愿景:AGI是从“专才”迈向“全才”的未来方向。
- 技术基础:理解AGI需要掌握多模态学习、强化学习与知识图谱等概念。
🧩 相似概念对比
• 与专用人工智能(Narrow AI):
专用AI专注于单一任务(如语音识别或图像分类);AGI则追求多领域智能化,具备广泛适应能力。
• 与人类智能:
AGI试图模拟人类的全局智能,但仍受限于计算资源和伦理问题。
通用人工智能正以其跨领域、全能化的潜力,引领人类迈向智能技术的全新时代!
让 AI 从“会想”走向“会做”
把“怎么做事”变成可复用的执行能力单元。
智能体技能
让 AI 从“会想”走向“会做”
📚 简单定义:
Skills(技能)是 Agent 架构中一种可被模型自动触发的、结构化执行能力单元。
它通过标准化描述,教会大模型如何完成一类具体任务,并由模型自行判断何时使用、如何使用,而不是依赖人为显式调用或一次性的 Prompt。
一个 Skill 往往封装了对 Tools(工具) 的使用方式、执行步骤与约束规范,使 AI 能够将“思考结果”转化为稳定、可复用、可治理的实际行动。
因此,Skills 是 AI 从“只会生成内容”,迈向“能够可靠执行任务”的关键能力层。
🌱 形象类比
如果把 AI 看成一个正在工作的专业人士:
- LLM = 大脑
负责理解目标、分析问题、制定行动决策 - Skills = 工作方法与操作手册
告诉大脑:这一类事情应该怎么做、分几步做、用哪些工具做、做到什么标准 - Tools = 具体工具与设备
真正执行动作的载体,例如 API、脚本、数据库、业务系统接口
在这个过程中:LLM 负责“想”,Skills 负责“怎么做”,Tools 负责“真正去做”。
只有三者协同,AI 才能从“会说话的模型”,进化为“能干活的智能体”。
✨ 发展历史
🟦 早期阶段(2010 年前后)
规则与脚本驱动,能力分散、难以复用。
🟨 Prompt 驱动阶段(2022–2023 年)
通过 Prompt 教模型做事,执行依赖人工,难以治理。
🟩 Agent 化阶段(2024–2025 年)
AI 开始自主决策并调用工具,需要可复用执行能力。
🟥 Skills 系统化阶段(2025 年至今)
Anthropic 系统提出 Agent Skills 概念,执行能力模块化,由模型自动判断何时、如何使用。
✨ 常见用途
- 把思考变成行动:将推理结果落地为可执行流程。
- 封装可复用能力:一次定义,多场景复用。
- 增强可治理性:执行边界清晰,便于审计与控制。
🔑 关键特征
- 可执行性:不是回答,而是直接行动。
- 标准接口:有清晰的输入、输出和调用方式。
- 可组合:多个 Skills 可形成工作流。
- 可复用:一次封装,多处调用。
- 可治理:行为边界清晰,便于审计与控制。
🔧 工作原理(简化版)
1️⃣ 用户目标 / 任务指令
↓
2️⃣ LLM 推理(要做什么?)
↓
3️⃣ 选择合适的 Skill
↓
4️⃣ Skill 调用 Tools 执行(API / 函数 / 系统)
↓
5️⃣ 返回结果 → 进入下一轮推理
🔍 背后逻辑与工作机制
Skills 的核心思想是:把“怎么做事”从模型的即兴推理中拆出来,变成可控、可治理的能力模块。
🔹 Skill 定义:明确描述能力边界与执行规范,例如:查数据库、发邮件、调用搜索引擎、执行脚本、操作业务系统。
🔹 Skill 调用(Tool Calling / Function Calling):由 LLM 决定是否调用 Skill,以及在什么上下文下调用。
🔹 执行与反馈:Skill 内部协调 Tools 完成真实操作,并将结果返回给 Agent。
🔹 安全与治理:Skill 可审计、可限权,避免模型“自由发挥”导致风险。
这种设计让 Agent 系统更可靠、更工程化、更可扩展。
🎯 实用记忆小技巧
- LLM 负责想。
- Skills 负责怎么做。
- Tools 负责真正执行。
- 没有 Skills 的 Agent,只是“会说话”的模型。
🧩 相似概念对比
- 与 Prompt(提示词):
Prompt 影响“怎么想、怎么说”;Skill 决定“怎么做、是否能稳定地做”。 - 与 Tool(工具):
Tool 是能力本身;Skill 是对 Tool 的结构化封装 + 使用规范。 - 与 Plugin / API:
Plugin 和 API 偏系统集成;Skill 偏 Agent 认知层,是“完成一类任务的方法”。 - 与 Workflow(工作流):
Workflow 是固定流程;Skill 是可被模型动态组合的能力积木。
💡 一句话总结: Skills,让人工智能从“会说”进化为“会做”。
让机器拥有"智慧之光"
让机器在规则之外,学会处理复杂世界。
人工智能(AI)
让机器拥有"智慧之光"
📚 简单定义
人工智能(AI,Artificial Intelligence)是一门研究如何让机器展现类似人类智慧与行为的学科。通过感知环境、思考与决策、学习与适应,AI 试图解决复杂问题,协助或替代人类完成任务。
🌱 形象类比
人工智能就像一台“全能学习机”。它能模仿人类的思考方式,看图识字、听声辨人、分析问题,还能快速学习新技能。如果把任务比作考试,AI 就是那个拿着无数复习资料的“学霸”,能更快、更准确地解题。
✨ 发展历史
🟦 起步阶段(1950s–1970s)
1956 年达特茅斯会议提出“人工智能”概念。
🟨 瓶颈期(1970s–1980s)
算力与算法受限,AI 研究进入低谷。
🟩 复兴阶段(1980s–1990s)
反向传播推动神经网络复苏,专家系统应用兴起。
🟥 深度学习崛起(2000s 至今)
算力与大数据推动 AI 在多个领域落地。
🔑 关键特征
- 智能决策:不仅执行指令,还能根据环境和数据作出判断。
- 学习能力:通过机器学习、深度学习不断优化策略。
🔧 工作原理(简化版)
1️⃣ 感知输入(文本、图像、音频等多模态数据)
↓
2️⃣ 理解与分析(识别、理解、预测信息)
↓
3️⃣ 决策与行动(执行指令、调用工具、输出结果)
↓
4️⃣ 反馈与学习(基于结果持续优化模型与策略)
🔍 背后逻辑与工作机制
AI 的核心在于模拟人类的认知过程:
🔹 感知:通过传感器或数据输入获取信息(文本、图像、语音等)
🔹 理解:利用算法和模型对信息进行分析、推理与抽象
🔹 决策:基于分析结果选择并执行行动方案
🔹 学习与改进:借助机器学习 / 深度学习,从经验中持续优化表现
随着算力与算法的不断提升,
AI 已从早期的规则系统,逐步演进为以数据驱动的深度学习体系。
🎯 实用记忆小技巧
- 从泛化到专精:AI 是大伞,机器学习与深度学习是其下的进阶。
- 掌握基础概念:先理解流程、关键技术与应用场景。
🧩 相似概念对比
- 与机器学习(ML): ML 是 AI 的子集,专注让机器从数据中学习规律。
- 与深度学习(DL): DL 是 ML 的子领域,借助深层神经网络自动提取特征,AI 是总目标,DL 是尖端技术。
AI 的"智慧架构"
模仿神经连接方式的学习结构。
神经网络
AI 的"智慧架构"
📚 简单定义: 神经网络(Neural Network, NN)是一种受生物神经系统启发的算法,利用人工神经元模拟人脑的学习过程。通过连接成多层网络,它可以从数据中自动提取特征,完成分类、回归等任务,是机器学习和深度学习的核心技术之一。
🌱 形象类比
想象一个复杂的电话网络,每个电话节点(神经元)接收输入信号(数据),处理后再传递给下一个节点。神经网络就像这样的信号处理系统,通过层层传递和计算,找到输入与输出的最佳关系。
✨ 发展历史
🟦 萌芽阶段(20 世纪 40-50 年代)
1943 年 McCulloch 和 Pitts 提出人工神经元模型。
🟨 理论初探(1950-70 年代)
1958 年感知机问世,但无法处理非线性问题而遇冷。
🟩 复兴阶段(1980-90 年代)
1986 年反向传播算法推动多层神经网络复苏。
🟥 深度学习时代(2000 年至今)
算力与算法突破让神经网络广泛用于图像、语音、NLP 等领域。
🔑 关键特征
- 分层结构:输入层、隐藏层、输出层逐步提取特征。
- 权重与偏置:通过调整连接权重与偏置优化模型。
- 非线性映射:激活函数帮助模型学习复杂关系。
🔧 工作原理(简化版)
1️⃣ 输入数据(如图像或文本)
↓
2️⃣ 输入层:接收数据并传递到隐藏层
↓
3️⃣ 隐藏层:通过权重和激活函数提取特征
↓
4️⃣ 输出层:生成预测结果
↓
5️⃣ 优化:误差反向传播,调整权重
🔍 背后逻辑与工作机制
神经网络通过输入层接收原始数据,隐藏层提取特征,输出层生成结果;借助反向传播算法不断调整权重与偏置,以优化性能,成为解决复杂非线性问题的基础。
🎯 实用记忆小技巧
- 逐层学习:深度学习通过多层结构,从基础到复杂逐步提取特征。
- 自动化特征提取:无需人工干预,模型自行提炼核心模式。
AI 的“智慧引擎”
多层神经网络自动提取特征,驱动现代 AI 的核心动力。
深度学习(DL)
AI 的“智慧引擎”
📚 简单定义: 深度学习(Deep Learning, DL)是机器学习的一个子领域,利用多层神经网络模拟人脑的学习机制。通过层层抽象和特征提取,深度学习能够自动从复杂数据中学习模式,用于解决图像、语音和自然语言等领域的高难度任务。
🌱 形象类比
想象你在看一幅复杂的画作,先从局部颜色(低层特征)观察起,然后分析线条和形状(中层特征),最后理解整个画面的意义(高层特征)。深度学习的多层网络就是这样逐层“看图”,从简单到复杂提取关键信息。
✨ 发展历史
🟦 起步阶段(20 世纪 80-90 年代)
1980 年代 Hinton 提出玻尔兹曼机等概念,但受算力限制发展缓慢。
🟨 理论突破(2006 年)
Hinton 提出深度信念网络(DBN),标志深度学习重新兴起。
🟩 实践成功(2012 年)
AlexNet 在 ImageNet 竞赛中大获成功,深度学习崭露头角。
🟥 全面普及(2012 年至今)
推动自然语言处理、图像生成、自动驾驶等领域的技术突破和应用落地。
🔑 关键特征
- 多层结构:逐层提取数据特征。
- 自动特征提取:无需人工设计特征,模型从数据中自动学习。
- 海量数据 + 高算力:深层网络训练需要大量数据与高性能计算支持。
🔧 工作原理(简化版)
1️⃣ 输入数据(图像 / 文本等)
↓
2️⃣ 卷积层 / 隐藏层:提取低级到高级特征
↓
3️⃣ 分类层:输出预测结果
↓
4️⃣ 优化:反向传播调整权重
↓
5️⃣ 输出结果:分类、回归或生成内容
🔍 背后逻辑与工作机制
深度学习通过多层神经网络逐步分解任务:输入层接收原始数据,隐藏层逐步提取特征,输出层完成分类、回归或生成;反向传播不断调整参数以优化性能,擅长处理非结构化数据如图像、音频和自然语言。
🎯 实用记忆小技巧
- 逐层学习:从基础到复杂逐步提取特征。
- 自动化特征提取:模型自行提炼核心模式。
🧩 相似概念对比
- 与机器学习(ML):传统 ML 需人工特征,DL 依赖多层网络自动学习高级特征。
- 与神经网络(NN):DL 基于 NN 的更深版本,能处理更复杂任务,推动 AI 从“识别”到更强的理解与生成。
智能模型的“定向导航员”
用精心设计的提示词,引导模型输出更贴近预期的内容与风格。
提示工程
智能模型的“定向导航员”
📚 简单定义: 如果预训练和微调让模型拥有知识与能力,那么提示工程就是为模型指明方向的“导航技术”。它通过精心设计输入信息(提示词),引导模型输出更符合预期的答案和风格。模型越强大,提示工程越能让它发挥更精准与更有创意的表现。
🌱 形象类比
像给博学顾问下“任务卡”:不是只说“讲个故事”,而是“用童话风格,给 5 岁孩子讲一个关于友谊和勇气的短故事”。这种精巧的指令设计能让顾问(模型)更准确理解你的要求,给出更贴切的回答。
✨ 常见用途
🔹 定制问答风格:控制语气,如幽默、严肃或科普
🔹 明确写作格式:要求列表、表格或特定叙事结构
🔹 精准信息提取:指定关键词或领域,减少跑题
🔹 内容创作:为写作者提供更有针对性的情节或人设细节
🔹 教育辅助:用不同教学方式解释知识点(如面向儿童的科普)
🔹 数据查询:让模型用表格或列表格式提炼关键信息
🔑 关键特征
- 精确指令:清晰描述内容或格式,避免模糊
- 上下文引导:在提示中提供足够背景,让模型更明白你要什么
- 迭代优化:观察输出结果,反复打磨提示,提升质量
🔧 工作原理(简化版)
1️⃣ 已具备技能的模型(预训练 + 微调)
↓
2️⃣ 提示工程:像给模型定制任务说明书
↓
3️⃣ 模型输出更贴近用户预期的答案或文本
🔍 背后逻辑与工作机制
模型已有能力,但不一定清楚要“做什么、怎么做”。通过精确指令,你把期望传递给模型,让它在庞大语言空间中快速锁定理想的回答路径。
🎯 实用记忆小技巧
- 预训练让模型成“通才”,微调成“专才”,提示工程就是给这位“专才”制定清晰精确的工作说明书。
大模型驱动的“自主行动者”
将目标、规划、工具调用与反馈闭环结合,持续执行任务。
智能体
大模型驱动的“自主行动者”
📚 简单定义: 智能体(Agent)是能够感知环境、做出决策并采取行动以实现特定目标的人工智能系统。当智能体以大模型为“脑”构建时,不仅具备语言理解与生成能力,还能进行任务规划并调用外部工具执行。
🌱 形象类比
把智能体想象成一位“智能管家”:它不仅能回答问题,还能安排日程、预订餐厅、管理邮件,甚至在你不在家时调节设备。依托大模型的理解与决策能力,它能自主完成多种任务。
✨ 发展历史
🟦 早期
基于规则的专家系统,行动僵硬。
🟨 大模型时代
LLM 具备理解与生成能力,能做规划与语言工具调用。
🟩 工具生态
通过插件/函数调用连接数据库、API、浏览器等,实现闭环执行。
🔑 关键特征
- 自主决策:依托大模型分析信息,选择最合适的行动。
- 环境感知与工具执行:通过数据输入感知环境,并调用工具完成操作。
- 目标导向与反馈闭环:围绕目标执行,并根据反馈持续调整。
🔧 工作原理(简化版)
1️⃣ 感知环境与接收目标
↓
2️⃣ 大模型分析信息并制定计划
↓
3️⃣ 执行行动(调用工具)
↓
4️⃣ 反馈与调整,循环优化
🔍 背后逻辑与工作机制
智能体将“理解 + 计划 + 行动”整合:LLM 负责理解与推理,规划器拆解任务,工具层完成具体操作,记忆/日志用于反馈与校正。通过循环迭代来接近目标,但仍需边界与监督。
🎯 实用记忆小技巧
- 典型场景:多步骤自动化、信息收集与整理、客服/运营自动处理。
- 使用要点:明确目标、设定权限与安全约束、持续监控与复盘,防止跑偏或误用资源。
迈向“通用智慧”的未来之路
从“专才”走向“全才”的通用智能愿景。
通用人工智能(AGI)
迈向“通用智慧”的未来之路
📚 简单定义: 通用人工智能(Artificial General Intelligence, AGI)是人工智能的高级形式,旨在让机器具备像人类一样的通用学习与思考能力。与当前专注于单一任务的AI不同,AGI能够自主适应多种任务,并在不同领域展现出灵活的智能水平。
🌱 形象类比
想象一个博学的全能专家,他不仅擅长编程、翻译、下棋,还能快速学习新技能,例如烹饪或修理家电。AGI正是这样的“通才型助手”,在多种任务中展现出通用智慧,而不仅是擅长某一领域的“单项高手”。
✨ 常见用途
- 跨领域应用:从金融分析到环境保护,都能提供高效解决方案。
- 人机协作:与人类一起完成复杂任务,优化工作流程。
- 生活伴侣:在家庭中兼顾家务管理、教育陪伴、情感支持等角色。
🔑 关键特征
- 通用性:可在多种任务中自由切换,而无需针对性训练。
- 自我学习:能通过经验积累优化表现,解决全新问题。
- 自主决策:具备一定的推理与创造能力,应对复杂挑战。
🔧 工作原理(简化版)
1️⃣ 多模态感知(文本、图像、声音…)
↓
2️⃣ 自主学习与知识整合(动态构建知识体系)
↓
3️⃣ 任务推理与决策(跨领域智能应用)
↓
4️⃣ 反馈优化(不断提升通用能力)
🔍 背后逻辑与工作机制
AGI的实现依赖于以下核心技术:
- 跨领域学习:结合机器学习和深度学习,从多模态数据中提取通用特征。
- 记忆与推理:通过强化学习和知识图谱,建立长期记忆和逻辑推理能力。
- 自我优化:利用元学习(meta-learning),让模型通过自我训练提升适应性和效率。
与专用AI相比,AGI追求更高层次的通用性与灵活性,使其具备解决复杂社会问题的潜力。
🎯 实用记忆小技巧
- 通用智能愿景:AGI是从“专才”迈向“全才”的未来方向。
- 技术基础:理解AGI需要掌握多模态学习、强化学习与知识图谱等概念。
🧩 相似概念对比
• 与专用人工智能(Narrow AI):
专用AI专注于单一任务(如语音识别或图像分类);AGI则追求多领域智能化,具备广泛适应能力。
• 与人类智能:
AGI试图模拟人类的全局智能,但仍受限于计算资源和伦理问题。
通用人工智能正以其跨领域、全能化的潜力,引领人类迈向智能技术的全新时代!
让 AI 从“会想”走向“会做”
把“怎么做事”变成可复用的执行能力单元。
智能体技能
让 AI 从“会想”走向“会做”
📚 简单定义:
Skills(技能)是 Agent 架构中一种可被模型自动触发的、结构化执行能力单元。
它通过标准化描述,教会大模型如何完成一类具体任务,并由模型自行判断何时使用、如何使用,而不是依赖人为显式调用或一次性的 Prompt。
一个 Skill 往往封装了对 Tools(工具) 的使用方式、执行步骤与约束规范,使 AI 能够将“思考结果”转化为稳定、可复用、可治理的实际行动。
因此,Skills 是 AI 从“只会生成内容”,迈向“能够可靠执行任务”的关键能力层。
🌱 形象类比
如果把 AI 看成一个正在工作的专业人士:
- LLM = 大脑
负责理解目标、分析问题、制定行动决策 - Skills = 工作方法与操作手册
告诉大脑:这一类事情应该怎么做、分几步做、用哪些工具做、做到什么标准 - Tools = 具体工具与设备
真正执行动作的载体,例如 API、脚本、数据库、业务系统接口
在这个过程中:LLM 负责“想”,Skills 负责“怎么做”,Tools 负责“真正去做”。
只有三者协同,AI 才能从“会说话的模型”,进化为“能干活的智能体”。
✨ 发展历史
🟦 早期阶段(2010 年前后)
规则与脚本驱动,能力分散、难以复用。
🟨 Prompt 驱动阶段(2022–2023 年)
通过 Prompt 教模型做事,执行依赖人工,难以治理。
🟩 Agent 化阶段(2024–2025 年)
AI 开始自主决策并调用工具,需要可复用执行能力。
🟥 Skills 系统化阶段(2025 年至今)
Anthropic 系统提出 Agent Skills 概念,执行能力模块化,由模型自动判断何时、如何使用。
✨ 常见用途
- 把思考变成行动:将推理结果落地为可执行流程。
- 封装可复用能力:一次定义,多场景复用。
- 增强可治理性:执行边界清晰,便于审计与控制。
🔑 关键特征
- 可执行性:不是回答,而是直接行动。
- 标准接口:有清晰的输入、输出和调用方式。
- 可组合:多个 Skills 可形成工作流。
- 可复用:一次封装,多处调用。
- 可治理:行为边界清晰,便于审计与控制。
🔧 工作原理(简化版)
1️⃣ 用户目标 / 任务指令
↓
2️⃣ LLM 推理(要做什么?)
↓
3️⃣ 选择合适的 Skill
↓
4️⃣ Skill 调用 Tools 执行(API / 函数 / 系统)
↓
5️⃣ 返回结果 → 进入下一轮推理
🔍 背后逻辑与工作机制
Skills 的核心思想是:把“怎么做事”从模型的即兴推理中拆出来,变成可控、可治理的能力模块。
🔹 Skill 定义:明确描述能力边界与执行规范,例如:查数据库、发邮件、调用搜索引擎、执行脚本、操作业务系统。
🔹 Skill 调用(Tool Calling / Function Calling):由 LLM 决定是否调用 Skill,以及在什么上下文下调用。
🔹 执行与反馈:Skill 内部协调 Tools 完成真实操作,并将结果返回给 Agent。
🔹 安全与治理:Skill 可审计、可限权,避免模型“自由发挥”导致风险。
这种设计让 Agent 系统更可靠、更工程化、更可扩展。
🎯 实用记忆小技巧
- LLM 负责想。
- Skills 负责怎么做。
- Tools 负责真正执行。
- 没有 Skills 的 Agent,只是“会说话”的模型。
🧩 相似概念对比
- 与 Prompt(提示词):
Prompt 影响“怎么想、怎么说”;Skill 决定“怎么做、是否能稳定地做”。 - 与 Tool(工具):
Tool 是能力本身;Skill 是对 Tool 的结构化封装 + 使用规范。 - 与 Plugin / API:
Plugin 和 API 偏系统集成;Skill 偏 Agent 认知层,是“完成一类任务的方法”。 - 与 Workflow(工作流):
Workflow 是固定流程;Skill 是可被模型动态组合的能力积木。
💡 一句话总结: Skills,让人工智能从“会说”进化为“会做”。
卡片分类
按主题浏览卡片,快速进入你感兴趣的领域
AI 基础
5 张模型架构
8 张生成模型
3 张学习范式
7 张训练方法
3 张模型效率
6 张提示工程
5 张RAG
1 张智能体与工具
6 张上下文工程
4 张多模态
1 张安全风险
9 张安全防护
9 张伦理治理
7 张未来与总览
3 张AI咖洞察
0 张为什么是 懂点AI?
在 AI 时代,很多人不是不想学,而是不知道从哪里开始。
懂点AI 让你先"感觉懂",再循序渐进。
零术语,零压力
不用记模型和公式,用生活类比把抽象概念变简单。
单点突破
每张卡片只讲一个核心问题,不被信息量淹没。
可翻、可回、可复习
像翻牌一样学习,不强制线性路径,碎片时间也能推进。
懂点AI 解决的不是'更深',而是'先懂'。
怎么学?
不强制线性路径,随时翻卡也能见效
选一张卡片
从你最关心的问题开始,3 分钟读完一张。
带着类比回顾
用类比帮助记忆,形成自己的理解语言。
尝试应用
把卡片内容对照现实场景,验证能做与不能做。
谁会受益?
如果你想跟上 AI,而又不想被术语绊住脚步,这里正适合你
非技术背景
想听懂 AI,但不想被代码和公式劝退。
学生 & 家长
一起建立"AI 到底是什么"的直觉框架。
产品 / 业务 / 管理者
需要理解 AI 能做什么,才能判断机会与边界。
我们的价值观
AI 是工具,不是信仰
让理解先于崇拜,保持独立判断。
理解比速度重要
不急着堆技能,先把底层认知补齐。
人始终在系统之上
AI 赋能人,而不是替代人。
准备好翻开第一张卡片了吗?
零基础也能靠直觉理解,从一个问题开始