从入门到生产的完整学习路径,共 5 个模块 17 篇文章
目标:理解 Agent 的最小可行架构
学习 Agent 的核心概念、ReAct 模式、Tool Use 和 Planning,建立 Agent 心智模型
目标:让 Agent 具备"行动能力"
掌握并行工具调用、嵌套调用、错误处理,学习工具设计原则和能力模块化
并行 / 嵌套 / 错误处理
AI Agent 的未来是模型能够无缝地跨数百或数千个工具工作。一个集成 git 操作、文件操作、包管理器、测试框架和部署管道的 IDE 助手。
4Agent 工具设计原则
Model Context Protocol (MCP) 可以为 LLM Agent 提供数百个工具来解决现实世界的任务。但我们如何使这些工具最大限度地发挥作用?
5显式推理控制
随着我们继续增强 Claude 的复杂问题解决能力,我们发现了一种特别有效的方法:一个"think"工具,在复杂任务期间为结构化思考创建专用空间。
6Skills 抽象与复用
随着模型能力的提升,我们现在可以构建与完整计算环境交互的通用 Agent。例如,Claude Code 可以使用本地代码执行和文件系统完成跨领域的复杂任务。
7Skills + MCP Server 扩展 Agent
当我们去年发布 Model Context Protocol (MCP) 时,我们看到开发者构建了令人惊叹的本地服务器,让 Claude 可以访问从文件系统到数据库的一切。
目标:解决长任务的"记忆与注意力"问题
学习上下文结构设计、上下文感知 RAG,确保长对话的稳定性和检索为任务服务
目标:Agent 系统化
掌握长任务执行框架、中断恢复、状态持久化,以及多 Agent 协作架构和角色分工
长任务执行框架
随着 AI agent 变得更加强大,开发者越来越多地要求它们承担需要数小时甚至数天工作的复杂任务。然而,让 agent 在多个 context window 之间持续取得进展仍然是一个开放问题。
11多 Agent 协作架构
Claude 现在拥有 Research 功能,允许它在网络、Google Workspace 和任何集成中进行搜索以完成复杂任务。这个多 Agent 系统从原型到生产的过程让我们学到了关于系统架构的关键经验。
12Agent 执行环境
Model Context Protocol (MCP) 是一个用于将 AI Agent 连接到外部系统的开放标准。将 Agent 连接到工具和数据传统上需要为每个配对进行自定义集成。
目标:可上线、可规模化
学习 Agent 评测方法论、沙箱与权限隔离、生产实践经验,以及真实事故复盘
Agent 评测方法论
好的评估帮助团队更自信地发布 AI agent。没有它们,很容易陷入被动循环——只在生产环境中发现问题,修复一个故障又产生其他问题。
14沙箱与权限隔离
在 Claude Code 中,Claude 与您一起编写、测试和调试代码,导航您的代码库、编辑多个文件并运行命令来验证其工作。给予 Claude 如此多的访问权限可能会引入风险。
15Coding Agent 工程经验
我们最近发布了 Claude Code,一个用于 agentic 编码的命令行工具。Claude Code 作为研究项目开发,为 Anthropic 的工程师和研究人员提供了一种更原生的方式来将 Claude 整合到他们的编码工作流程中。
16真实事故复盘
在 8 月至 9 月初期间,三个基础设施 bug 间歇性地降低了 Claude 的响应质量。我们现已解决这些问题,并希望解释发生了什么。
17Anthropic 内部真实使用方式
我们最新的模型,升级版 Claude 3.5 Sonnet,在软件工程评估 SWE-bench Verified 上达到了 49%,超过了之前最先进模型的 45%。这篇文章解释了我们围绕该模型构建的"Agent"。