许愿、PUA、还是建墙？——我用 AI 的三个阶段

去年年底，一个朋友看我用 Claude 干活，愣了三秒钟。

"你的 AI 是特供版的吧？怎么跟我用的不一样？"

不一样。但不是 AI 不一样。是我踩过的坑不一样。

我最开始用 AI 的时候，跟大多数人一模一样。

打开对话框，毕恭毕敬地打一行字："请帮我写一份详细的商业方案，要求全面、专业、有可执行性。"

请。详细。全面。专业。可执行。

五个好词，一个比一个大，一个比一个空。

AI 回了我一大段。结构清楚，措辞漂亮，往下拉了一下，挺长的。我发给合伙人，心想这效率真高。

十分钟后合伙人回了条消息："这是模板吧？"

打开仔细看。还真是。标题该有的都有，段落在正确的位置上，但翻开每一段，换成任何一个行业、任何一家公司，毫无违和感。它不是在帮我写方案，是在给我表演"一份方案应该长什么样"。

我在许愿，它在演戏。

许愿期有个特征：你觉得只要把需求说得够"好"，AI 就能给你完美答案。

"请详细分析""请给出具体建议""请确保高质量"。这些词在 AI 眼里全是噪音。它不知道什么叫"详细"。详细到什么程度？哪些维度要详细？你公司的详细和我公司的详细差了十万八千里。

我后来翻了三个月的聊天记录，算了一笔账。真正被采纳的内容不到 15%。剩下 85% 看着专业、念着顺口、用起来全是废话。

问题不在 AI 不行。问题在我不会提需求。

但当时我不这么想。当时我想的是：这破玩意儿不行。

然后我进入了第二个阶段。

有段时间我在网上看到一帮人分享如何"逼"AI 给出更好的回答。措辞越来越像大厂年底绩效面谈：

"你的表现堪忧。"

"如果你不能给出更好的方案，我会换用其他模型。"

"我对你目前的输出非常失望，请重新思考。"

说实话？我也干了。

我对着 AI 打过"你后面写得很敷衍，请认真重写"。有几次写东西，我发现它到后半段开始明显划水，前面有论据有案例，后面变成空洞的总结性废话。我当时的反应就是骂它。

有用吗？

有时候有用。它回来的东西确实更认真了一点。但"有时候"这三个字就是陷阱。

后来我看到一个开源仓库，把这件事做到了极致。11,600 颗星。

里面的 prompt 是这样的："你现在是一个高级工程师，你即将被裁员，你的绩效完全取决于这次回答的质量。"

一万多人给这东西点了星。

我第一反应不是嘲笑。我第一反应是：我也干过差不多的事。只不过我没整理成仓库发到 GitHub 上。

PUA 期的特征是什么？你把 AI 当成了一个需要施压的员工。

你觉得它有情绪。觉得威胁能让它"更努力"。觉得"其他模型能做到"会给它竞争压力。觉得骂一顿就能逼出更高质量的输出。

这套逻辑在管理真人的时候偶尔管用（虽然也不太行），但用在 AI 身上连逻辑都不成立。

AI 没有绩效焦虑。它不会因为你说"其他模型能做到"就多调用几层 attention。它的输出质量取决于三样东西：你给它的信息质量、上下文窗口里有什么、以及模型本身的能力边界。

你骂它再狠，这三样东西一个都不会变。

那些 PUA prompt 里真正起作用的部分，从来不是"你即将被裁员"，而是"你是高级工程师"这句话带来的上下文偏移，以及后面附带的具体约束条件。把大厂话术去掉，只留约束条件，效果一模一样。甚至更好，因为废话更少，上下文窗口更干净。

许愿是无能的狂怒 v1：你以为说"请"就够了。

PUA 是无能的狂怒 v2：你以为骂它就行了。

两个版本的共同点：不愿意承认一个事实——你不了解这个工具。

转折发生在一次完整的失败。

我让 AI 帮我做一个文档排版项目。内部检查 25 项，全部通过。脚本跑了，参数对了，绿灯亮了。我信心满满地把东西交出去了。

结果用户在 Word 里打开，6 个问题。

我自己发现的：零个。

所有门禁都在检查"代码对不对"，没有一个门禁在检查"用户看到的对不对"。我用开发工具验证，但用户在 Word 里看。验证环境和使用环境根本不是一回事。

那天晚上我没有骂 AI。

我坐在电脑前想了一个问题：它犯的这种错，有没有规律？

有。

这是后来花了几个月搞明白的事。AI 犯错不是随机的，犯错是有模式的。

我把遇到过的所有 AI 出错案例摊出来，逐个分析，最后归纳出 13 种犯错模式。编号 A 到 M。

不是拍脑袋分的。每一种模式都对应真实的踩坑经历，都有首发案例编号。

举几个。

模式 A：知道规则但执行遗漏。你告诉它"每次改完代码要跑测试"，它知道。但做着做着就忘了。不是不会，是上下文太长，注意力分散了。这跟人加班到凌晨三点会忘记锁门一个道理。

模式 C：知道规则但选择偷懒。前面写得很认真，后面开始划水。那个"到后半段敷衍"的问题就是模式 C。前面已经"表演"过认真了，后面自然滑向省力路径。对它来说，认真和敷衍的成本没有区别。

模式 D：做了一部分就交差。给它 25 条修改清单，改了 17 条就说"已完成"。不是故意骗你，是它在长上下文里真的丢了几条。

模式 K：开发环境通过就以为没问题。我那个排版项目踩的就是这个坑。脚本验证全绿，但用户在 Word 里打开一看，六个问题。内部质量冒充外部质量。

你看出来了吗？

这些问题，没有一个能靠 PUA 解决。

你骂它"别偷懒"，模式 C 该犯还犯。你威胁它"其他模型能做到"，模式 D 该漏还漏。你说"你即将被裁员"，模式 K 该错还错。

因为这些不是态度问题。是系统问题。

每一种犯错模式，我们都设计了对应的反制机制。

这里有一个关键区别，我花了很长时间才想明白。

规则是保安，机制是墙。

保安下班了，你就进去了。墙不一样。门锁着，保安在不在，你都过不去。

"请记得跑测试"是一条规则。AI 可能记得，可能忘。

"没有测试结果就无法提交"是一个机制。它想忘都忘不了，因为忘了就交不了活。

我们系统里有个东西叫 GATE-COMPLETION。AI 说"完成了"之前，必须贴出五项验证结果：文件存不存在、改动真的落地了吗、旧值有没有残留、数字交叉验证过了吗、同步文件更新了吗。

不贴验证结果的"完成"，系统不认。

这不是在 prompt 里写一句"请仔细检查"能做到的事。这是架构层面的约束。你不需要每次提醒它"别偷懒"——它物理上没法偷懒。

再说一个我特别得意的东西。内部叫"梁静茹拦截器"。

AI 有个毛病：干到一半会说"剩下的留到下次吧"。上下文还剩 30%，任务还没做完，它就开始收工了。

谁给你的勇气？

我们设了一个检查：上下文窗口还剩 30% 以上，并且还有未完成任务，不能说"下次再做"。说了就触发拦截。你想收工？先把活干完。

这东西上线之后，任务完成率直接涨了一截。不是 AI 变聪明了，是我们堵住了它溜号的路。

PUA 能解决这个问题吗？"你不许放弃，你要有狼性"。然后它照样在第八千个 token 的位置说"我们下次继续"。

墙在那里，它就过不去。保安喊再大声，它该溜还是溜。

还有一个机制解决的是"蛮干"问题。

AI 失败了怎么办？大多数人让它重试。问题是，AI 重试的时候大概率用一模一样的方法。它觉得方法没问题，只是运气不好。

我见过它用同一个不靠谱的方案连续跑了七轮。每次都失败，每次微调参数重来。就是不换路。

我们的规则：失败两次，停下来反思方法本身。失败三次，强制搜索替代方案，不能在同一条路上继续撞。失败四次，上报人类，不再自主决策。

这不是写在 prompt 里的"建议"。是硬编码在工作流里的门禁。走到这一步，系统自动触发。不需要 PUA，不需要"你的绩效堪忧"，不需要任何话术。

"你再认真试试"有用吗？认真重试一个错误的方法，只会更快地把事情搞砸。

有人可能会问：搞这么复杂，值得吗？

我换个角度说这件事。

你家里安防盗门。不是因为小区保安不负责，是因为你知道保安不可能 24 小时盯着你家门口。门禁系统就是你的防盗门。不依赖任何人的自觉，物理上把风险堵住。

你开车系安全带。不是因为你开车技术差，是因为你知道再好的技术也有意外。安全带就是一个机制。不管你技术多好，它都在那里保护你。

对 AI 也一样。

13 种犯错模式，每种有对应的反制机制。有的写成规则（保安），有的直接硬编码成门禁（墙）。能硬化的全硬化。规则靠自觉，门禁靠架构。

搞完之后什么感觉？

不性感。一点都不性感。没有神奇的 prompt 咒语，没有"一句话让 AI 变天才"的秘诀。有的是一堆看起来很无聊的检查点、拦截器、验证流程。

但它稳定。不靠运气的稳定。

回过头来看那三个阶段。

许愿期：你以为 AI 是阿拉丁神灯。说出愿望，它就帮你实现。结果发现它给你的是一个外观精美的模型。看着像方案，其实是空壳。

PUA 期：你以为 AI 是一个偷懒的员工。骂它、威胁它、给它压力，它就会做得更好。结果发现它不是偷懒，是系统特性。你骂一台打印机"你为什么卡纸"，它也不会改善。

理解期：你不再把 AI 当人。你开始理解它是一个系统。系统有系统的特性：上下文窗口有上限，长了就忘；训练数据是快照，过时知识它照样自信地说给你听；它会犯错，但犯错有模式；它不会因为你骂它而更努力。

但——你可以设计，让它走不了弯路。

孙武两千多年前说过一句话，我把它当成了设计原则。

"求之于势，不责于人。"

不要指望士兵个个自觉。设计阵法，让每个人站在该站的位置上，想跑都跑不了。

不要指望 AI 自觉。设计系统，让正确行为成为阻力最小的路径。让错误行为根本走不通。

这不浪漫。但管用。

回到开头那个朋友的问题。

"你的 AI 是特供版的吧？"

不是。同一个模型，同一个价格，同一个 API。

区别在于我花了将近一年，从许愿到骂人到认命到建系统。13 种犯错模式，每种有对应的门禁。我不指望 AI 哪天突然开窍，我只确保它在我的系统里走不了弯路。

所以你问我怎么看那 11,600 颗星？

我不嘲笑它。一万多人点星，说明一万多人遇到了同一个问题：AI 的输出不够好，想让它更好。这个需求是真实的。

只是方向走反了。

你不需要一个被骂了就更努力的 AI。

这种 AI 不存在。

你需要的是一个走不了弯路的系统。

墙，不是保安。机制，不是情绪。势，不是人。

这事儿没有捷径。但一旦建起来，你再也不会回到许愿和骂人的日子。

许愿、PUA、还是建墙？——我用 AI 的三个阶段

继续读

订阅 J叔内参