十字路口Crossing podcast

探秘 Claude Code,搞懂 Agent Harness|对谈来新璐

0:00
47:45
Retroceder 15 segundos
Avanzar 15 segundos

🚥 为什么说 Agent 的上限来自 Harness?当我们讨论 Harness 时,我们究竟在讨论什么?

不久前,Claude Code 源代码泄露,许多 Agent Harness 的关键模块得以完整呈现,成了一份极佳的教学标本。而在技术高速变化的红利期,主动理解新技术往往能带来很高的认知增量。

因此,本周「十字路口」邀请到来新璐,一起聊聊 Agent Harness。新璐是 ShareAI 开源社区发起人,他撰写维护的《Learn Claude Code》教程在 GitHub 上获得超过 50k Star。

在本期内容中,我们把 Agent Harness 从概念词拆解成工程语言,介绍它的三层框架:会跑(执行层)→ 跑久(状态层)→ 跑稳(治理层)。同时,我们也梳理了 Claude Code 中值得借鉴的多个机制:更多 context、更少 control 的思路、“零上下文管理”的哲学、长程任务的接力式交接策略,以及让 Agent 越用越聪明的“做梦”式记忆维护与迭代机制等

新璐作为典型的一人公司,刚完成数百万美金融资;他也分享了自己对 OPC 的独特观点,甚至认为“未来只有 0 人公司,没有 1 人公司”,颇具启发。

🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书哔哩哔哩Youtube 等平台。

📒 文字版已发布于 @十字路口Crossing 公众号。

🟢 00:49 快问快答:年龄、毕业院校、MBTI、星座、一句话介绍公司、融资情况、团队规模、创业前经历

🟢 01:52 模型以外都是 Harness

机甲、大脑、机器人、智商120——Harness 到底是什么

  • 模型以外都是 Harness

  • Agent 上限由 Harness 决定吗?

  • 模型智商已在 120–170 之间;Agent Harness 像机甲——不提升智力,但极大扩展能力

🟢 02:47 GitHub 50k star,是怎么来的?

这个Agent教程,其实不只是写给别人看的——它本来是新璐自己整理的"造 Agent 心法"。

  • 9 个月前动笔,出发点是"把 Claude Code 套网页壳就能得到一个强大 Agent 产品"的简单直觉

  • 开源社区当时流行 LangChain、LangGraph等 prompt pipeline 做法开发“伪Agent”,是一场派系之争——"Prompt Flow-Driven vs Agent Native-Driven"

  • LangChain 过时了吗?

🟢 04:02 Bash is all you need

Claude 推出 Manager Agents 之后,大家还需要自己搭 Harness 吗?

  • 就像 Next.js出现后大家不再关心底层运行原理,两三年后 Agent Harness 也会收敛为开箱即用

  • 但现在是技术周期红利窗口——不懂 Agent Harness,做出来的Agent产品"缺乏灵魂"

  • 今天的 PM 和过去的 PM,指的根本不是同一种人

🟢 07:04 Harness 三层拆解

用两周时间、多 Agent 协作,从零写出一个 C 编译器——这个经典案例背后,到底走了哪三层?

  • 第一层:执行能力层 ——文件增删读写、浏览器、语言解释器;配错权限后果是什么?

  • 第二层:上下文与状态层 ——system prompt、skills、memory,以及上下文窗口满了之后 Agent 如何"接力交棒"

  • 第三层:治理与编排层 —— 数百上千 Agents 如何组织协作?测试 Agent 为什么不能同时拥有修改代码的权限?

🟢 12:05 KB 的 K 系列Agent工具链

他们公司叫 Komputer Blue,代号KB,目标是构建By Agents & For Agents的整套开源Infra

  • Komputer:用 TypeScript 重写 Unix 文件系统和 bash,给 Agent 一个"熟悉的生活环境";支持 WebAssembly 时切换WASM实现;

  • Kruntime:Agent Runtime 层,提供让人类开发 Agent 的接口,以及Agent 派生 Agent的接口

  • Kwatch:Agent 观测层,分析 Agent 任务在哪里卡住,反向指导 Agent 设计迭代

  • Krl:把 Agent 在 Runtime 上沉淀的轨迹数据拿来强化学习或做上下文层的自迭代

🟢 13:55 vs. AWS AgentCore、阿里云 AgentBay

云服务厂商当然也想做这一层

  • K 系列 Agent 工具链的核心理念:在离用户更近的场景运行 Agent,任何能跑 JavaScript 的场景都能用——浏览器、插件、App、Electron、小程序、纯静态网页、全栈 SaaS

  • 差异化:把Claw-Agent的运行时轻量到由纯数据结构模拟的 KB 级Unix虚拟计算机环境,而不是把 Linux 和浏览器全塞进去

  • 新璐认为要让 Agent 工作好的方法是给每个 Agent 一台专用计算机,一般通过虚机提供,但大多 Agent 完成的大部分工作不需要真的 Linux虚机(且成本高昂),像编译器、浏览器这类重工具原本就不该放进给每个 Agent 的虚机环境

🟢 17:38 Memory 的流派

  • 完全结构化(知识图谱 + 向量搜索):精细存储的知识结构,支持 pipeline 知识推理,rule-based,新璐不喜欢

  • 半结构化(Unix Files + Markdown + Agent 驱动更新):Claude Code 和小龙虾都是这样做的;Claude Code 中的 auto-dream 机制:每隔一天触发后台 Agent 对最近会话做"重放",纠错、合并、更新记忆——就像做梦

  • 模型内化 —— 距真正生产落地还需要~ 3 年时间,且记忆难批量提取 & 无损转移,容易被单边模型提供商绑定

🟢 22:49 共识与非共识

  • 共识:CLI is all you need——"Bash is all you need" 这句话是新璐 9 个月前写在开源仓库里的标语,现在成了行业共识

  • 非共识:大部分23年 ~ 25年诞生的主流开源 Agent 框架仍在用 PromptPipe + Node Graph的老路线 —— 就像齿轮与传送带编织的流水线

  • Unix 从 1971 年就存在,LLM预训练语料中 Linux 命令有数十亿条sample;MCP 提出才两年,预训练占比不到 0.1%——这解释了为什么 CLI 工具的任务完成率比 MCP 高,并且 shell 具备对CLI命令的可组合性 & 二次编程空间

🟢 26:33 Claude Code 源码泄露:最大的惊喜是什么

让所有人看到了一件事:这家公司在"上下文管理"上做了多少别人没有做的工程工作

  • 上下文压缩策略:工具 output 何时删、窗口满到什么阈值开始交接、下一个 Agent 初始化时加载什么

  • Fork Agent 机制:每轮结束触发 turn stop hook,Fork 一个 Agent 复用 KV cache 做记忆更新

  • 记忆文件格式和 skill 保持同一套哲学:前三行 YAML,先读 description 而非全文

  • 新璐的结论:"好的 Harness 要和模型的inference逻辑自洽,和Agent模型进步方向正交"

🟢 34:05 好 Harness 的标准

  • 不好的:随意裁剪上下文,导致 KV cache 频繁失效,重计算开销

  • 不好的:用 Prompt Graph硬控每一步决策——模型越强越被束缚

  • 好的公式:好的context space + 好的action space + less prompt control

  • Anthropic 从25年初率先从问答模型转向 Agent 模型训练,领先其他厂商半年

🟢 38:52 新璐看好的三个创业方向

  • 第一:Agent Harness工具链(新璐自己在做)

  • 第二:Agent 组网——不是给 Agent 发 IM/Mail,而是混合云端/端侧的全设备组网;现有 Tailscale 不够 Agent Native,需要高通量上下文交换,以及更多控制能力

  • 第三:Agent模型集约训练、推理基础设施——Tinker(Thinking Machines Lab,OpenAI 前 CTO 创业方向)的路线:集约化高效训练 + LoRA 热插拔推理,让更多企业 & 个人都能以较低成本获得个性化且更适合各自任务场景的Agent模型

🟢 44:09 Agent 未来暴论

"我觉得以后很多的公司都是理财产品 —— 由有经验的人类 Team搭建这些公司、甚至由AI直接生成公司,然后自运转"

  • 阶段:单 Agent → Agent 蜂群 → Agent 自管理 & 协调更多 Agent → Agent 开始创造、发明

  • OPC “1人公司“不本质, 0PC “0人公司”是未来趋势

  • 真格基金和十字路口的 Token Grant 资助的 YoYo Agent

  • 未来的画面:从口袋里掏出一张卡,"这张卡里跑了 5 个由Agent组成的公司,每年给我创造几十亿收入"

欢迎订阅「十字路口」:

🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。

🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。

👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻Koji 的网站

👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

Otros episodios de "十字路口Crossing"