Skip to content

一个下午,从会议录音到可运行项目

2026/02/17

下午两点,三个人开了个视频会。

销售培训顾问带着一线 BD 团队的真实痛点,工程师搭档带着技术直觉,我带着一个模糊的想法:做一个 AI 销售教练。

会开了一个半小时。录音 29KB。散了。

晚上十点,我回头看了一眼项目目录:73 个源文件,52 个开发 spec,15 个规划文档,26 个知识库原料,一份 24KB 的项目宪法。Monorepo 跑通,类型定义完备,LLM 抽象层三个 Provider,RAG 服务骨架就位,数据库迁移脚本写好,移动端四个 Tab 页壳子搭完。

4天之后,项目完整交付:2716 个测试全绿,105,000 行代码。

中间没有招人。没有排期会。没有 Jira。

只有我,一个终端,一群 Agent。


会议结束后的第一件事,不是写代码

录音转写丢进 Obsidian。三分钟出摘要,行动项、风险、金句,全部结构化。

然后我做了一件看起来很慢、实际上决定了一切的事:写文档。

不是那种走过场的文档。是真的把产品想清楚的文档。

先写 PRD。MVP 三个功能——话术生成、异议训练、客情管理。不碰 GPS 签到,不碰陈列拍照,不碰订单管理。客户说得对:「它一定要超越通用 AI,否则我干嘛付钱给你。」差异点不在通用对话能力,在行业知识深度加客情记忆加销售流程嵌入。

然后是三层知识蒸馏。LAYER1 销售方法论——拜访流程、异议处理框架、生意分析模型。LAYER2 竞品分析——传统 SFA 的坑在哪、头部品牌的智能方案亮点在哪、我们的定位在哪。LAYER3 业务模板——数据模型、知识库配置、评估体系。

再然后是 System Prompt 草稿。16KB。角色锁定、围栏机制、异议分类框架、拒绝模板。

最后是开发 Checklist。10 个任务,SQL 表设计,API 清单,里程碑排期。

这些东西加起来大概 120KB。全部是给 Agent 看的。


真正的生产力不是写代码快,是想清楚快

Karpathy 说了一个词叫 agentic engineering。从 vibe coding 进化来的。意思是你不再自己写代码,你像工程主管一样管理一队 AI Agent。

这个说法是对的,但少了一个前提。

Agent 不会替你想清楚。Agent 只会把你想清楚的东西变成代码。你想得越清楚,Agent 产出越精准。你想得越模糊,Agent 越会「帮你补齐」——补出来的通常叫灾难。

所以真正的瓶颈从来不是「AI 能不能写代码」。

是「你能不能在写第一行代码之前,把产品规格、技术架构、类型定义、围栏规则全部想清楚」。

以前「想清楚」和「写出来」的时间比大概是 1:5。你花一天想,花一周写。

现在反过来了。5:1。我花了大半个下午想清楚、写文档、做知识蒸馏。Agent 把这些变成 73 个源文件,花了不到两个小时。

想清楚就是产出。文档就是代码的前体。


Agent Team:不是一个更聪明的 Agent,是一支队伍

以前我用 Claude Code 是单 Agent 模式。一次一个任务,串行执行。够用,但有上限——复杂项目里,上下文爆掉是常态。

Agent Teams 是另一回事。

一个 lead agent 拆任务、分配、协调。其他 agent 各自领一块,并行干活。前端一个,后端一个,RAG 服务一个,类型定义一个。它们共享代码库,但各自有独立的 context。完成后向 lead 汇报,lead 做集成。

听起来像什么?像一个真实的开发团队。有 tech lead,有前端工程师,有后端工程师,有 infra。区别是这些「人」不需要开会、不需要对齐、不需要等排期、不需要年终绩效。

我之前做 PKU 光华 MBA 课程知识榨取的时候用过类似的模式——6 个 Agent 协作,一个抓数据,三个蒸馏,一个审计,我做调度。53 门课,两周干完,产出 173 个 Concept。

这次 SFA 项目更快。因为我学会了一件事:给 Agent 的不是任务描述,是项目宪法。


项目宪法:Agent 的操作系统

CLAUDE.md。24KB。不是 README,是宪法。

里面写了什么:

你是谁——这个项目的架构师。Deadline 是下个月,这不是建议,是物理约束。

代码该长什么样——函数不超过 20 行,文件不超过 800 行,三层以上缩进即设计错误。SSE 流式输出用标准 EventSource 格式。API 响应用统一 envelope。类型导入用 type import。

文档系统怎么运转——GEB 分形文档协议。三层:L1 是项目宪法,L2 是模块说明,L3 是文件头注释。每个源文件的头部必须写清楚 INPUT、OUTPUT、POS。代码变了文档没变,视为未完成。

质量门禁怎么过——每个 Milestone 完成时跑 Phase Gate。Lint 零 error,类型检查通过,测试全绿,新文件必须有 L3 头部。

这份宪法不是写给人看的。是写给 Agent 看的。Agent 读了这 24KB,就知道该怎么写代码、怎么组织文件、怎么命名变量、出错了怎么处理、什么时候该停下来问我。

给 Agent 一份好的宪法,相当于给新员工做了三天 onboarding。区别是 Agent 真的会遵守。


52 个 Spec:把一个模糊的想法拆成 Agent 能执行的原子任务

有了宪法,还需要任务书。

我把整个项目拆成 52 个 spec。从 001-environment-setup 到 052-final-delivery。每 4 个功能 spec 中间穿插一个 tech-debt spec——这个节奏很重要,它让技术债不会累积到最后一刻才爆。

每个 spec 是一个独立的可执行单元:目标是什么,验收标准是什么,依赖哪些前置 spec,预估工时多少。

Agent 不需要看全貌。它只需要拿到当前 spec,读一遍宪法,然后执行。执行完,下一个。

这就是 agentic engineering 的核心:你不写代码,你写 spec。Spec 写得好,Agent 的产出就好。Spec 写得烂,Agent 会很努力地写出一堆精致的垃圾。


工程师的角色变了

以前的分工:产品经理写 PRD,工程师从零开始写代码。

现在:我用 Agent Team 把 PRD 变成了可运行的 monorepo。工程师拿到手,架构定了,类型定了,抽象层定了,迁移脚本写好了,spec 拆好了。

他的工作从「从零搭建」变成了「填充业务逻辑、打磨 UI、补测试、做 code review」。

说白了,从 builder 变成了 reviewer。

这不是贬低。这是效率最高的分工。工程师最舒服的状态,是拿到一个架构清晰、类型完备、文档齐全的项目,直接写核心功能。不用猜需求,不用定架构,不用处理那些「本来应该在开工前就想清楚但没人想」的事情。

Agent Team 干的就是那些「本来应该想清楚但没人想」的部分。因为想清楚太烦了。大部分团队选择边做边想。边做边想的结果就是重构三次。


真正的范式转移

不是 AI 替代工程师。

是人类的产出形态变了。

以前:产品经理产出 PRD(Word),工程师产出代码(IDE),设计师产出原型(Figma)。三种产出,三种工具,三次翻译。

现在:我产出的是一套「Agent 可执行的指令资产」——宪法、知识库、spec、类型定义、围栏规则。Agent Team 把这些指令资产变成代码。一次翻译。

工程师的核心能力从「写代码」变成了「写宪法」。

这话听起来很抽象。具象一点:如果你的 CLAUDE.md 写得足够好,你可以把它交给任何一个 Agent,它都能在你的项目里写出风格一致、架构一致、质量一致的代码。

宪法就是品味的编码。品味不可教,但可以编码。编码之后,就可以复制。


从 vibe coding 到 agentic engineering

Karpathy 画了一条线:

vibe coding → agentic coding → agentic engineering

vibe coding 是你对着 AI 说「帮我做个 app」,它做出来的东西你自己不完全理解,但能跑。

agentic coding 是你给 AI 一个明确任务,它自主执行,遇到问题自己解决。

agentic engineering 是你管理一队 AI Agent,像 tech lead 管理开发团队一样。分配任务、定义接口、设置质量门禁、做 code review。

我今天做的事情,就是第三个。

而且我发现一个有趣的对称:我以前做 HR,研究组织——怎么设计架构才不内耗、信息怎么传递才不失真、组织能力怎么建立。

现在我把同一套东西用在 Agent Team 上。角色分离、文档协作、质量门禁、人类裁决。

组织学没变。只是组织成员从人变成了 Agent。


一句话

会上有人说了一句话:

「轻量的开始,强行起飞。」

说的是产品策略。

我把它当成了工程方法论。

一个下午。从会议录音到可运行项目。一个人,一个终端,一群 Agent。

写完了,上了。

J叔

J叔

一个下午,从会议录音到可运行项目 | J叔内参