Harness Engineering 学习指南

June 19, 2026 · View on GitHub

中文 | English

License: MIT Articles Translations

Harness Engineering 学习指南

一个从概念理解到独立实践的 Harness Engineering 深度学习档案

前言

这是一个不断生长的学习项目。Harness Engineering(驭缰工程)是 OpenAI 在 2026 年 2 月提出的工程范式:工程师不再写代码,而是设计环境、明确意图、构建反馈回路,让 AI 智能体可靠地完成工作。

人类掌舵,智能体执行。

本仓库记录了从阅读原文、拆解概念、形成思考、动手实践到输出作品的完整学习过程。希望对同样关注 AI 工程化的朋友有所帮助。

来源:OpenAI — Harness Engineering: Harnessing Codex in an Agent-First World

注意: 以下经验分享并非普遍适用,请在具体实践中结合场景,辩证采纳。

⚡ 一句话理解

传统工程:人类写代码 → 机器执行代码
Harness Engineering:人类设计约束 → 智能体写代码 → 机器执行代码

核心转变:工程师的产出从代码变成了约束系统——AGENTS.md、架构规则、自定义 linter、反馈回路。

🧭 六大核心概念

1. 仓库即记录系统 — 不在仓库里的东西,对智能体不存在

Slack 讨论、Google Docs、脑子里的知识 = 对智能体不可见。一切决策、规范、计划都必须以版本化工件提交到仓库。

→ 详见 concepts/01-repo-as-source-of-truth.md

2. 地图而非手册 — AGENTS.md 是目录页,不是百科全书

~100 行的入口文件,指向更深层的文档。渐进式披露:智能体从小入口点开始,被指导下一步该看什么。巨型指令文件的三个死因:挤占上下文、无法维护、无法机械验证。

→ 详见 concepts/00-overview.md

3. 机械化执行 — 文档会腐烂,lint 规则不会

自定义 linter + 结构测试 = 不变量的守护者。lint 错误信息里内嵌修复指令,智能体可以自我纠正。在中央层面强制执行边界,在本地层面允许自主权。

→ 详见 concepts/02-mechanical-enforcement.md

4. 智能体可读性 — 优先为智能体的推理能力优化

选"无聊"技术(API 稳定、训练集覆盖好)。有时重新实现子集比包装不透明的上游行为更划算。让应用可以按 git worktree 启动。

→ 详见 concepts/04-agent-readability.md

5. 吞吐量改变合并理念 — 纠错成本低,等待成本高

PR 生命周期很短。测试偶发失败通过后续重跑解决。在智能体吞吐量远超人类注意力的系统中,这通常是正确的选择。

→ 详见 concepts/05-throughput-changes-merge.md

6. 熵管理 = 垃圾回收 — 技术债是高息贷款

智能体会复现仓库中已有的模式——包括坏模式。将"黄金规则"编码进仓库,定期后台任务扫描偏差、更新质量评分、发起重构 PR。

→ 详见 concepts/03-entropy-and-garbage-collection.md

🔑 关键数据点

指标数据
团队规模3 人 → 7 人
时间跨度5 个月
代码量~100 万行
PR 数量~1,500 个
人均日 PR3.5 个(扩展后仍在增长)
单次运行时长6+ 小时(通常在人类睡眠时间)
效率估算手工编写的 ~1/10 时间

📂 仓库结构

harness-engineering/
├── README.md              ← 你在这里
├── AGENTS.md              ← 仓库导航入口(给智能体看的)

├── concepts/              # Phase 1:概念笔记(8 篇)
│   ├── 00-overview.md     #   六大核心概念总览
│   ├── 01-repo-as-...     #   仓库即记录系统
│   ├── 02-mechanical-...  #   机械化执行
│   ├── 03-entropy-...     #   熵管理与垃圾回收
│   ├── 04-agent-...       #   智能体可读性
│   ├── 05-throughput-...  #   吞吐量改变合并理念
│   ├── 06-harness-...     #   Harness 精确定义(Fowler 控制论扩展)
│   └── 07-spec-as-product.md #   约束即产品(Symphony 延伸)

├── thinking/              # Phase 2:独立思考与质疑(8 篇)
├── practice/              # Phase 3:小项目实验(1 个 Ralph Demo)
├── feedback/              # Phase 4:踩坑与迭代心得(1 篇)
├── works/                 # Phase 5:可展示的作品(13 篇翻译 + 1 篇原创)
├── tools/                 # 工具具像化:降低 6 维复杂度的杠杆库
├── prompts/               # 验证有效的提示词积累
└── references/            # 外部资源索引(20 篇文章深度摘要)

每个子目录都有自己的 AGENTS.md,说明该目录的用途和写作约定。这本身就是原文「渐进式披露」的实践。

🚀 学习路线

  • Phase 1:理解核心概念 — 8 篇概念笔记,覆盖 OpenAI 六大概念 + Fowler 控制论扩展 + Symphony 约束即产品
  • Phase 2:形成自己的观点 — 8 篇独立思考(持续中)
  • Phase 3:选一个小项目实践 — Ralph Demo 完成(321 秒,$0.31)
  • Phase 4:记录反馈迭代 — 1 篇(持续中)
  • Phase 5:输出可展示的作品 — 13 篇专业翻译 + 1 篇原创综合分析

📚 研究资料库

跨三条知识脉络 20 篇文章 + 3 篇延伸阅读:

脉络覆盖核心视角
AI 时代的 Harness Engineering17 篇OpenAI → Fowler → Anthropic → LangChain → Stanford → Claude Code 逆向
云原生 Harness.io2 篇CI/CD 平台架构(同名不同义的参照)
效率悖论与能力进化1 篇YDD 系统性拆解:约束理论 + Spec/Rule/Skill
延伸阅读3 篇Mitchell Hashimoto、Context Engineering、人机协作

详见 references/articles.md — 每篇文章含核心论点、关键数据、跨文章关联的深度摘要。

📖 翻译作品

13 篇核心文章的中文翻译(点击展开)
作品原作者来源
渴望了八年,用 AI 三个月造出来Lalit Maganti个人博客
Inside the Scaffold 论文Benjamin RombautHuawei / arXiv
Meta-Harness 论文Yoonho Lee 等Stanford / arXiv
Harness Engineering 正式版Birgitta BöckelerMartin Fowler
Harness Engineering 备忘录Birgitta BöckelerMartin Fowler
Encoding Team StandardsRahul GargMartin Fowler
Feedback FlywheelRahul GargMartin Fowler
Scaling Managed AgentsLance Martin 等Anthropic
Agent Evaluation ChecklistLangChain 团队LangChain
Agent-driven DevelopmentTyler McGoffinGitHub
Continual LearningHarrison ChaseLangChain
Codex 编排开源规范 SymphonyKotliarskyi 等OpenAI
Claude Code 架构(逆向工程版)Vikash RungtaSubstack

🔗 相关项目与资源

原始来源

资源说明
OpenAI 原文(中文)Harness Engineering 的完整阐述

Ralph 系列 — Harness Engineering 的实战框架

「Ralph Wiggum 循环」是 Harness Engineering 的核心实现模式:让智能体在循环中自主工作直到任务完成。

项目Stars说明
snarktank/ralph13.6k原版 Ralph:bash 脚本反复启动 AI,每次迭代清空上下文,直到 PRD 全部完成。6 条核心信条(Fresh Context、Backpressure、Plan Is Disposable 等)
ralph-orchestrator2.3kRust 进化版:Hat 角色系统 + 事件驱动协调 + 多后端(Claude/Kiro/Gemini/Codex)+ 背压门控 + 持久化记忆
bmad-ralph2BMAD 方法论 + Ralph:并行 Claude Code worktree + 三层自愈(retry → restart → diagnose)+ SQLite 状态机

Ralph 六条信条(与 Harness Engineering 的映射)

Ralph 信条Harness Engineering 对应概念
Fresh Context Is Reliability智能体可读性 — 每次迭代重新读取
Backpressure Over Prescription机械化执行 — 不规定怎么做,但门控拒绝坏结果
The Plan Is Disposable熵管理 — 重新生成的成本只是一次 planning loop
Disk Is State, Git Is Memory仓库即记录系统 — 文件是交接机制
Steer With Signals, Not Scripts人类掌舵 — 加路标,不加脚本
Let Ralph Ralph智能体执行 — 坐在循环上,不坐在循环里

社区与延伸

资源说明
vibe-coding-cn中文 Vibe Coding 社区指南
Mitchell Hashimoto: Engineer the Harness"Harness" 概念的另一个起源

🛠️ 开发须知

仓库自带一致性检查脚本 scripts/check-consistency.sh,守护数量类漂移,覆盖七层校验:

  • C1-C2references/articles.md$ 文章数 + 下游 4 处引用(\text{README} \times 2 \text{badges}、$prompts/deep-research-tracker.md 头部、references/AGENTS.md 概览)
  • C3concepts/ / thinking/ / feedback/ 三个目录的 *.md 实际数与 README "X 篇" 声明一致
  • C4works/*-translation.md 文件数与各处翻译计数声明一致(badges、表格摘要、Phase 5 注释、AGENTS 快照、表格行数)
  • C5 — README 结构树的 concepts/ 子树列出每一个 concepts/*.md 文件
  • C6 — `references/articles.md$ 末尾"不计入 \text{N} 篇"的 \text{N} 与 \text{C1} 权威值一致
  • \text{C7} — 三脉络(脉络一/二/三)的 \text{per}-\text{track} 计数在 4 处下游声明(\text{READMEs} 资料库表 \times 2、$references/AGENTS.md 三脉络小标题、prompts/deep-research-tracker.md` 三脉络明细)保持一致

首次 clone 后启用 pre-commit hook:

git config core.hooksPath .githooks

启用后,每次 commit 涉及 README、AGENTS.mdreferences/articles.mdreferences/AGENTS.mdprompts/deep-research-tracker.md、或 concepts/ / thinking/ / feedback/ / works/ 中的 *.md 时会自动跑检查;不涉及则不打扰。

手动跑: bash scripts/check-consistency.sh

CI 兜底: 即使本地未启用 hook,GitHub Actions(.github/workflows/consistency.yml)会在每次 push / PR 触及受控文件时跑同一脚本。本地 hook 是开发期反馈,CI 才是真正的合并门。

详情见根 AGENTS.md 的"机械化检查"段。

🤝 参与贡献

欢迎通过 Issue 和 PR 参与:

  • 补充概念笔记(concepts/ 中还有待补充的概念)
  • 分享你的独立思考(thinking/
  • 贡献实践案例(practice/
  • 推荐相关资源(references/

📞 联系方式

渠道链接
GitHub@deusyu
Telegram@DeusThink
Telegram 交流群@talkdeusyu
Telegram 频道@lovedesuyu
Emailrainman.deus@gmail.com

Star History

如果这个项目对您有帮助,请考虑为其点亮一颗 Star ⭐!

Star History Chart

💛 赞助支持

如果这份学习档案为你节省了时间,欢迎赞助我的开源工作——你的支持让它持续更新、保持免费与开放。

Sponsor

📄 License

MIT