2572 字

13 分钟

Agent —— 从Skills、MCP 到子代理的协作范式

2026-02-12

Agent

Materials
你可以点击以下链接来获取 Agent Skills 的资料： ::github(repo=“https-deeplearning-ai/sc-agent-skills-files”)

前言#

在上一篇中，我们理解了 Agent Skills 的三层构造和“渐进式披露”的核心逻辑。但对于像帆帆这样的开发者来说，仅仅会“用”现成的 Skill 是不够的。为了让 Agent 完美契合复杂的课设需求，我们需要学会如何深度定制。

智能体生态系统概述#

在一个成熟的智能体架构中，Skills 并不是孤军奋战的。它需要与 MCP、Tools 和 Subagents 协同工作，形成一套完整的“数字员工”体系。

4.2.png

1.1 核心组件的协同逻辑#

MCP 服务器(Model Context Protocol)：连接智能体与外部系统（如数据库、Google Drive）的管道，提供所需的上下文数据。它解决了“数据在哪里”的问题。
Tools（工具）：提供底层的 原子化 操作能力，如编辑文件或执行命令。工具定义始终存在于上下文窗口中。
Subagents（子代理）：用于多线程和并行处理的特化 AI。它们在独立的上下文中运行,用于实现多线程和并行处理，避免干扰主智能体的思考。
Skills（技能）：用于可重复的主线程工作流。它教导智能体“如何处理”通过 MCP 获取的数据。

1.2 为什么 `Skills` 能省 `Token`？#

与 “始终在线” 的工具（Tools）不同，Skills 是渐进式加载的。

按需加载：只有当对话触发了特定的语义需求时，详细指令才会被装载。
防止记忆缺失：这种机制节省了宝贵的上下文空间（Token），防止 AI 因为预设指令过多而占领“短期记忆”，导致聊到核心逻辑时丢三落四。

命名的艺术：让 AI 一秒“认出”技能#

创建一个 Skill 的第一步不是写代码，而是命名。Skill 的名称和描述是 AI 决定是否加载它的唯一依据。值得一提的是，正是基于严密的逻辑指令与确切的执行步骤，Agent 才能在复杂的数字世界中精准导航。

导航
对 Agent 来说，他就像一个司机，Skill 是一个高德地图，假设说高德地图跟你说距离目的地 $10$ km,我是一个正常人听了都会绝望，我们无从下手，哪个方向？怎么去？这些我们都不能知道，而导航(Skill)只要足够清晰，那么我们就可以得知在什么情况下，转向、加速。

而一个高质量的 Skill 采用一种渐进式披露的手段，确保 Agent 在没一个路口都能得到最精准的指令。

2.1 命名规范与触发逻辑#

alt text

2.1.1 命名规范 (Naming)#

格式要求：采用「动词 + ing」的格式，例如 generating-practice-questions 或 analyzing-time-series。
字符限制：名称最多 64 个字符，且只能包含小写字母、数字和连字符。
语义化：这种动名词形式能清晰表达动作属性，便于 AI 分类和检索。

2.1.2 描述的“灵魂” (Description)#

描述不仅要说“做什么”，更要明确“何时使用”。

关键词策略：在描述中包含特定的关键词。例如，一个营销分析技能的描述应包含“转化漏斗”、“点击效率”等词汇，以显著提高 AI 的命中率。
字数空间：你有 1024 个字符的空间来详细定义输入要求和输出格式。

alt text

2.1.3 可选字段命名#

可选字段	约束条件
license（许可证）	许可证名称或对许可证文件的引用
compatibility（兼容性）	最多 500 个字符，指示环境要求
metadata（元数据）	任意键值对
allowed-tools（允许的工具）	预批准工具的空格分隔列表（实验性功能）

alt text

2.2 Agent 智能体生态组件对比表#

组件维度	MCP (模型上下文协议)	Tools (底层工具)	Skills (专业技能)	Subagents (子代理)
核心定义	连接外部系统与数据的“管道”	执行原子化操作的“硬件”	封装专业知识的“工作流”	执行单一任务的“特化代理”
形象比喻	实时路况/传感器：告诉你外面发生了什么	油门/刹车/扳手：提供基础的操作能力	高德导航/驾驶指南：教你如何处理路况	副驾驶/泊车助手：分担特定的复杂操作
上下文管理	按需引入外部数据上下文	始终存在于上下文窗口中	渐进式加载，语义匹配时才载入	隔离上下文，在独立线程运行
主要价值	解决“数据在哪里”的问题	提供读写文件、运行代码的能力	确保输出可预测、可重复且专业	提升并行处理效率，节省主 Token
典型示例	Google Drive MCP, GitHub MCP	`bash`, `filesystem`, `editor`	练习题生成、时间序列分析	代码审查子代理、翻译子代理

技能文件夹的“特种作战”配置#

一个功能完备的 Skill 绝不仅仅是一个 SKILL.md。为了实现复杂逻辑的解耦，我们需要利用好可选目录：

目录	核心作用	备注
`/scripts`	存放任何编程语言编写的代码逻辑（如数据处理脚本）。	需明确告知 AI 是“执行”还是“阅读”该脚本。
`/references`	存放超过 100 行的重型文档或 API 规范。	建议在文件顶部包含目录（TOC）以便 AI 快速定位。
`/assets`	存放输出模板（如 LaTeX/Markdown 模板）、图像或数据查找表。	实现“知识即配置”，修改模板无需改动核心逻辑。

实战：构建一个“时间序列分析”技能#

假设帆帆需要分析课设中的实验数据（如内存占用率、QPS 波动等）往往需要专业的统计学知识。通过构 analyzing-time-series 技能，我们可以将这些专业逻辑封装，让 Agent 像专家一样按部就班地进行分析。

4.1 运行诊断 (Run diagnostics）#

第一步的核心是利用自动化脚本对原始数据进行质量评估。

执行逻辑：Agent 会调用 python scripts/diagnose.py data.csv。
自动化能力：脚本会自动检测日期列（date-col）和数值列（value-col），并运行平稳性检测（如 ADF 检验）等统计测试。
产物输出：生成 diagnostics.json（供 Agent 或后续脚本读取的结构化指标）和 summary.txt（供人类阅读的初步结论）。

4.2 生成可视化 (Generate plots)#

单纯的代码输出可能不够直观，可视化是检查 Agent 逻辑是否跑偏的关键路标。

执行逻辑：运行 python scripts/visualize.py data.csv，将结果存储于 results/plots/ 目录下。
同步校验：该步骤会生成 $ACF$ （自相关函数）和 $PACF$ （偏自相关函数）图表。
关键点：这些图表必须与第一步的平稳性测试结果保持同步，以确保 Agent 在“导航”过程中没有出现数据误读。

4.3 结果解读 (Report)#

这是最体现 Skill 专业度的一步。Agent 不再是复读数据，而是参考 references/interpretation.md 中的业务标准进行深度解读。

深度追问：Agent 需要回答以下五个核心逻辑问题：

可预测性：数据是否具备预测价值，还是纯粹的随机噪声？
平稳性：是否需要进行差分（Differencing）处理？
季节性：是否存在周期性波动？周期是多少？
趋势性：数据的整体走向是上升还是下降？
转换需求：是否需要进行对数转换或其他预处理来稳定方差？

渐进式披露
逻辑解耦：诊断、绘图、解读相互独立，任何一步报错，Agent 都能精准定位是“路况不对”的数据问题还是“车坏了”的脚本问题。
减少幻觉：幻觉是 AI 凭空编造了一个不存在的函数名、一段历史事实。它是由于 LLM 试图补全概率分布而产生的“文学创作”，通过 /references 提供私域领域知识，强制 AI 优先遵循本地规则，而非模型自带的大规模训练数据。

编排器模式：Subagents 的降维打击#

当一个任务（如“全自动客户洞察分析”）涉及多个数据源时，单个 Skill 可能会力不从心。这时我们需要引入 Subagents（子代理）。

隔离上下文：每个子代理拥有独立的上下文环境，防止信息污染。
并行处理：主智能体作为“编排器（Orchestrator）”，可以同时派出“访谈分析员”和“问卷分析员”两个子代理并行工作。
能力复用：每个子代理可以被赋予特定的 Skill（如 Excel 处理技能），从而精准完成细分任务。

工具链：从本地到云端#

要高效地开发和测试这些技能，帆帆可以使用以下两个利器：

6.1 Claude Desktop：Skill Creator#

这是一个本地迭代入口。通过开启 Capabilities > Skill Creator，你可以将本地修改后的 Skill 立即推送到 Claude Desktop 中进行试跑。

最小闭环测试：挑选官方 Skill -> 复制到本地 ->改一处 Prompt -> 触发 Update -> 输入样例 -> 观察行为。

6.2 Claude Code：技能广场 (Marketplace)#

在 Claude Code 中，你可以通过 /plugin 进入 Marketplace，直接下载 Anthropic 官方提供的 Office 文档处理（docx/xlsx/pdf）等预设技能。

安装命令：输入 /plugin 选择 Add Marketplace，输入 anthropics/skills 即可获取官方技能库。

结语#

从“复读机”到“指挥官”，Agent Skills 的核心在于标准化与解耦。

高质量的 Skill 应该像积木一样：命名的标准化保证了可检索性，结构的解耦保证了可扩展性，而子代理的引入则保证了复杂任务的上限。

而且话又说回来了，会说人话的 Skills 才是 Agent 的核心灵魂，否则只会让它在逻辑的泥潭中南辕北辙。

Agent —— 从Skills、MCP 到子代理的协作范式

https://loners.site/posts/agent-part2/

作者

Mongxin Chan

发布于

2026-02-12

许可协议

CC BY-NC-SA 4.0

Agent —— 从 Gemini 网页版再到 Gemini CLI标准化流程

前言#

智能体生态系统概述#

1.1 核心组件的协同逻辑#

1.2 为什么 Skills 能省 Token？#

命名的艺术：让 AI 一秒“认出”技能#

2.1 命名规范与触发逻辑#

2.1.1 命名规范 (Naming)#

2.1.2 描述的“灵魂” (Description)#

2.1.3 可选字段命名#

2.2 Agent 智能体生态组件对比表#

技能文件夹的“特种作战”配置#

实战：构建一个“时间序列分析”技能#

4.1 运行诊断 (Run diagnostics）#

4.2 生成可视化 (Generate plots)#

4.3 结果解读 (Report)#

编排器模式：Subagents 的降维打击#

工具链：从本地到云端#

6.1 Claude Desktop：Skill Creator#

6.2 Claude Code：技能广场 (Marketplace)#

结语#

1.2 为什么 `Skills` 能省 `Token`？#