
两本关于 Harness Engineering 的书。它们追问同一个工程问题:一个会写代码的模型进了终端、仓库、权限系统和团队流程,系统凭什么还能保持边界、连续性和后果控制。
English index terms: Harness Engineering, Claude Code guide, Claude Code vs Codex, AI coding agent, control plane, query loop, agent recovery, agent verification, local governance, approval policy.
第一本是 book1-claude-code:Harness Engineering:Claude Code 设计指南
第二本是 book2-comparing:Claude Code 和 Codex 的 Harness 设计哲学
这两本书不打算把源码拆成零件逐条讲解。它们关心的是 harness 怎样组织约束与执行,怎样把一个本质上不稳定的模型,收束进可持续运行的工程秩序里。
这里讨论的是控制结构。Prompt 分层、Query Loop、权限判定、上下文治理、失败恢复、多 agent 验证、本地规则和团队制度,合在一起才构成 harness 的器官系统。工程里最怕的事,不是模型偶尔犯傻,而是系统对后果毫无准备。
About AgentWay
AgentWay 是这套内容的实践落点。两本书负责把 Harness 的控制结构讲清楚;agentway.dev 负责把这些判断继续压到学习路径、练习、项目和 agent PoC 上。
它更像这两本书的后半程:先用书把问题看明白,再去 AgentWay 把理解变成动作。你可以先免费注册,从基础路径开始;如果要进入更完整的进阶路线、练习和项目,再往更深的版本走。
核心判断
Harness Engineering 讨论的是约束结构怎样组织执行。
一个会写代码的模型进入真实工程环境以后,主要问题不再是回答质量,而是行为后果。
Prompt、工具、权限、状态、恢复、验证和制度,不是外围配件,而是同一套控制结构的不同器官。
比较不同 agent 系统,重点不该是功能表,而该是秩序被安放在哪一层。
一个团队如果不能把个人经验沉淀成可复用制度,就很难把 agent 变成稳定系统。
两本书,各自把问题逼到哪里
第一本:Claude Code 设计指南
第一本书拿 Claude Code 当观察对象,重点放在运行时骨架上。它关心的是,一套系统为什么最终必须长出控制面、Query Loop、工具权限、上下文治理、恢复路径、多 agent 验证和团队制度这些结构。
如果你更关心这些问题,建议先读第一本:
为什么 Harness Engineering 不是 Prompt Engineering 的放大版
Prompt 为什么本质上是控制面,而不是聊天输入框
模型犯错为什么应该被视为运行时常态,而不是异常事件
多 Agent 和验证机制为什么不能混成一团
团队怎么把个人经验固化成可复用的工程制度
第二本:Claude Code 与 Codex 比较书
第二本书把 Claude Code 和 Codex 放在一起,关注的是两套 harness 各自把秩序安放在哪一层。有人更从运行时纪律出发,有人更从结构化控制层出发;系统都能运转,权力分配方式却并不一样。
如果你更关心选型、架构判断或自己做系统时该学谁,建议读第二本:
Claude Code 和 Codex 在控制面设计上最大的分歧是什么
Query Loop、Thread、Rollout、State 的职责边界怎么对齐来看
权限、沙箱、策略语言各自承担什么治理角色
技能、Hook、本地规则怎样把“组织习惯”写进系统
如果要自己做 harness,应该先学谁、先学哪一层
建议阅读路径
如果你想先建立完整框架,先读第一本,再读第二本。
如果你已经熟悉 agent coding 工具,想直接看架构分歧和选型判断,可以先读第二本。
如果你只关心结论,可以直接看第一本的“第 9 章 十条原则”和第二本的“第 7 章 殊途同归,还是各表一枝”。
前面这些段落讲的是主张,下面这份目录讲的是证据链。Harness 这种题目,最怕只剩口号,不见结构,所以两本书的章节顺序都尽量保留为一条完整的推理路径。
Table Of Contents

Book 1
封面与导读
序言 Harness、终端与工程约束
第 1 章 为什么 Harness Engineering 不是 Prompt Engineering 的大号别名
第 2 章 Prompt 不是输入框,而是控制面
第 3 章 Query Loop:Agent 不是在答题,而是在持续接管工作流
第 4 章 工具、权限与中断:怎样让模型动手,但不让它乱动手
第 5 章 上下文、记忆与压缩:怎样让系统长期工作而不是越聊越糊
第 6 章 错误与恢复:模型犯错不是异常,而是运行时常态
第 7 章 多 Agent 与验证:不要让系统自己给自己当裁判
第 8 章 团队落地:把个人技巧变成组织能力
第 9 章 十条原则:如何判断一个 AI 编程系统是不是工程系统
附录 A 检查清单
附录 B 图稿说明
附录 C 源码地图

Book 2
封面与导读
阅读地图:如何理解第一本书与这本比较书
序言 两套 Harness,不必假装是同一匹马的附件
第 1 章 为什么要把 Claude Code 和 Codex 放在一起看
第 2 章 两种控制面:Prompt 拼装与 Instruction Fragment
第 3 章 心跳放在哪:Query Loop 对照 Thread、Rollout 与 State
第 4 章 工具、沙箱与策略语言:谁来阻止模型动手太快
第 5 章 技能、Hook 与本地规则:系统如何学会守乡约
第 6 章 委派、验证与持久状态:谁来防止系统自己给自己打高分
第 7 章 殊途同归,还是各表一枝
第 8 章 如果你要自己做:该向谁学,先学什么
附录 A 源码地图:这套比较主要依据哪些文件
附录 B 检查清单:如何判断你的 Harness 更像 Claude Code、Codex,还是半成品
数据小贩