Anthropic Agent 构建博客 - 中文版 | 水码

🚀

模块一：Agent 基础架构

入门篇

目标：理解 Agent 的最小可行架构
学习 Agent 的核心概念、ReAct 模式、Tool Use 和 Planning，建立 Agent 心智模型

1

构建高效的 AI Agent

Agent 架构入门：ReAct / Tool Use / Planning

在过去一年中，我们与数十个跨行业构建大型语言模型（LLM）Agent 的团队合作。最成功的实现并没有使用复杂的框架或专门的库，而是使用简单、可组合的模式进行构建。

AI Agent Agent 心智模型

2

使用 Claude Agent SDK 构建 Agent

用 SDK 构建第一个 Agent

去年，我们与客户分享了构建有效 agent 的经验教训。从那时起，我们发布了 Claude Code，这是一个我们最初为支持 Anthropic 的开发者生产力而构建的 agentic 编码解决方案。

Agent SDK 快速上手实践

🛠️

模块二：工具与能力扩展

进阶篇

目标：让 Agent 具备"行动能力"
掌握并行工具调用、嵌套调用、错误处理，学习工具设计原则和能力模块化

3

在 Claude Developer Platform 上引入高级工具使用

并行 / 嵌套 / 错误处理

AI Agent 的未来是模型能够无缝地跨数百或数千个工具工作。一个集成 git 操作、文件操作、包管理器、测试框架和部署管道的 IDE 助手。

Tool Use 复杂工具调用

4

为 AI Agent 编写高效工具——使用 AI Agent

Agent 工具设计原则

Model Context Protocol (MCP) 可以为 LLM Agent 提供数百个工具来解决现实世界的任务。但我们如何使这些工具最大限度地发挥作用？

Tools 工具 = 能力上限

5

"think"工具：让 Claude 停下来思考

显式推理控制

随着我们继续增强 Claude 的复杂问题解决能力，我们发现了一种特别有效的方法：一个"think"工具，在复杂任务期间为结构化思考创建专用空间。

Think Tool 复杂决策稳定性

6

用 Agent Skills 为 Agent 装备现实世界能力

Skills 抽象与复用

随着模型能力的提升，我们现在可以构建与完整计算环境交互的通用 Agent。例如，Claude Code 可以使用本地代码执行和文件系统完成跨领域的复杂任务。

Agent Skills 能力模块化

7

Claude Desktop Extensions：一键式 MCP 服务器安装

Skills + MCP Server 扩展 Agent

当我们去年发布 Model Context Protocol (MCP) 时，我们看到开发者构建了令人惊叹的本地服务器，让 Claude 可以访问从文件系统到数据库的一切。

MCP 能力扩展的系统级方案

🧠

模块三：上下文与记忆管理

核心篇

目标：解决长任务的"记忆与注意力"问题
学习上下文结构设计、上下文感知 RAG，确保长对话的稳定性和检索为任务服务

8

AI Agent 的有效 Context 工程

上下文结构设计

在应用 AI 领域，经过几年的 prompt engineering 成为关注焦点后，一个新术语已经崭露头角：context engineering。使用语言模型进行构建越来越不再是关于为提示找到正确的词语和短语。

Context Engineering 长对话稳定性

9

AI 系统中的 Contextual Retrieval（上下文检索）

上下文感知 RAG

为了让 AI 模型在特定场景中发挥作用，它通常需要访问背景知识。开发者通常使用 Retrieval-Augmented Generation（RAG）来增强 AI 模型的知识。

RAG 检索为任务服务

⚡

模块四：长任务与多 Agent

高级篇

目标：Agent 系统化
掌握长任务执行框架、中断恢复、状态持久化，以及多 Agent 协作架构和角色分工

10

长时间运行 Agent 的有效 Harness

长任务执行框架

随着 AI agent 变得更加强大，开发者越来越多地要求它们承担需要数小时甚至数天工作的复杂任务。然而，让 agent 在多个 context window 之间持续取得进展仍然是一个开放问题。

Long-running 中断恢复 / 状态持久化

11

我们如何构建多 Agent 研究系统

多 Agent 协作架构

Claude 现在拥有 Research 功能，允许它在网络、Google Workspace 和任何集成中进行搜索以完成复杂任务。这个多 Agent 系统从原型到生产的过程让我们学到了关于系统架构的关键经验。

Multi-Agent 角色分工

12

使用 MCP 进行代码执行：构建更高效的 AI Agent

Agent 执行环境

Model Context Protocol (MCP) 是一个用于将 AI Agent 连接到外部系统的开放标准。将 Agent 连接到工具和数据传统上需要为每个配对进行自定义集成。

MCP 安全高效执行

🏭

模块五：安全、评测与工程化

生产篇

目标：可上线、可规模化
学习 Agent 评测方法论、沙箱与权限隔离、生产实践经验，以及真实事故复盘

13

揭秘 AI Agent 的 Eval

Agent 评测方法论

好的评估帮助团队更自信地发布 AI agent。没有它们，很容易陷入被动循环——只在生产环境中发现问题，修复一个故障又产生其他问题。

Evals 可衡量

14

用沙箱使 Claude Code 更安全和自主

沙箱与权限隔离

在 Claude Code 中，Claude 与您一起编写、测试和调试代码，导航您的代码库、编辑多个文件并运行命令来验证其工作。给予 Claude 如此多的访问权限可能会引入风险。

Sandboxing 安全边界

15

Claude Code 最佳实践

Coding Agent 工程经验

我们最近发布了 Claude Code，一个用于 agentic 编码的命令行工具。Claude Code 作为研究项目开发，为 Anthropic 的工程师和研究人员提供了一种更原生的方式来将 Claude 整合到他们的编码工作流程中。

Claude Code 生产实践

16

三个近期问题的事后分析

真实事故复盘

在 8 月至 9 月初期间，三个基础设施 bug 间歇性地降低了 Claude 的响应质量。我们现已解决这些问题，并希望解释发生了什么。

Infrastructure 避坑指南

17

Claude SWE-Bench 性能

Anthropic 内部真实使用方式

我们最新的模型，升级版 Claude 3.5 Sonnet，在软件工程评估 SWE-bench Verified 上达到了 49%，超过了之前最先进模型的 45%。这篇文章解释了我们围绕该模型构建的"Agent"。

SWE-Bench 组织级 Agent 落地经验