去年年底,一个朋友看我用 Claude 干活,愣了三秒钟。
"你的 AI 是特供版的吧?怎么跟我用的不一样?"
不一样。但不是 AI 不一样。是我踩过的坑不一样。
我最开始用 AI 的时候,跟大多数人一模一样。
打开对话框,毕恭毕敬地打一行字:"请帮我写一份详细的商业方案,要求全面、专业、有可执行性。"
请。详细。全面。专业。可执行。
五个好词,一个比一个大,一个比一个空。
AI 回了我一大段。结构清楚,措辞漂亮,往下拉了一下,挺长的。我发给合伙人,心想这效率真高。
十分钟后合伙人回了条消息:"这是模板吧?"
打开仔细看。还真是。标题该有的都有,段落在正确的位置上,但翻开每一段,换成任何一个行业、任何一家公司,毫无违和感。它不是在帮我写方案,是在给我表演"一份方案应该长什么样"。
我在许愿,它在演戏。
许愿期有个特征:你觉得只要把需求说得够"好",AI 就能给你完美答案。
"请详细分析""请给出具体建议""请确保高质量"。这些词在 AI 眼里全是噪音。它不知道什么叫"详细"。详细到什么程度?哪些维度要详细?你公司的详细和我公司的详细差了十万八千里。
我后来翻了三个月的聊天记录,算了一笔账。真正被采纳的内容不到 15%。剩下 85% 看着专业、念着顺口、用起来全是废话。
问题不在 AI 不行。问题在我不会提需求。
但当时我不这么想。当时我想的是:这破玩意儿不行。
然后我进入了第二个阶段。
有段时间我在网上看到一帮人分享如何"逼"AI 给出更好的回答。措辞越来越像大厂年底绩效面谈:
"你的表现堪忧。"
"如果你不能给出更好的方案,我会换用其他模型。"
"我对你目前的输出非常失望,请重新思考。"
说实话?我也干了。
我对着 AI 打过"你后面写得很敷衍,请认真重写"。有几次写东西,我发现它到后半段开始明显划水,前面有论据有案例,后面变成空洞的总结性废话。我当时的反应就是骂它。
有用吗?
有时候有用。它回来的东西确实更认真了一点。但"有时候"这三个字就是陷阱。
后来我看到一个开源仓库,把这件事做到了极致。11,600 颗星。
里面的 prompt 是这样的:"你现在是一个高级工程师,你即将被裁员,你的绩效完全取决于这次回答的质量。"
一万多人给这东西点了星。
我第一反应不是嘲笑。我第一反应是:我也干过差不多的事。只不过我没整理成仓库发到 GitHub 上。
PUA 期的特征是什么?你把 AI 当成了一个需要施压的员工。
你觉得它有情绪。觉得威胁能让它"更努力"。觉得"其他模型能做到"会给它竞争压力。觉得骂一顿就能逼出更高质量的输出。
这套逻辑在管理真人的时候偶尔管用(虽然也不太行),但用在 AI 身上连逻辑都不成立。
AI 没有绩效焦虑。它不会因为你说"其他模型能做到"就多调用几层 attention。它的输出质量取决于三样东西:你给它的信息质量、上下文窗口里有什么、以及模型本身的能力边界。
你骂它再狠,这三样东西一个都不会变。
那些 PUA prompt 里真正起作用的部分,从来不是"你即将被裁员",而是"你是高级工程师"这句话带来的上下文偏移,以及后面附带的具体约束条件。把大厂话术去掉,只留约束条件,效果一模一样。甚至更好,因为废话更少,上下文窗口更干净。
许愿是无能的狂怒 v1:你以为说"请"就够了。
PUA 是无能的狂怒 v2:你以为骂它就行了。
两个版本的共同点:不愿意承认一个事实——你不了解这个工具。
转折发生在一次完整的失败。
我让 AI 帮我做一个文档排版项目。内部检查 25 项,全部通过。脚本跑了,参数对了,绿灯亮了。我信心满满地把东西交出去了。
结果用户在 Word 里打开,6 个问题。
我自己发现的:零个。
所有门禁都在检查"代码对不对",没有一个门禁在检查"用户看到的对不对"。我用开发工具验证,但用户在 Word 里看。验证环境和使用环境根本不是一回事。
那天晚上我没有骂 AI。
我坐在电脑前想了一个问题:它犯的这种错,有没有规律?
有。
这是后来花了几个月搞明白的事。AI 犯错不是随机的,犯错是有模式的。
我把遇到过的所有 AI 出错案例摊出来,逐个分析,最后归纳出 13 种犯错模式。编号 A 到 M。
不是拍脑袋分的。每一种模式都对应真实的踩坑经历,都有首发案例编号。
举几个。
模式 A:知道规则但执行遗漏。你告诉它"每次改完代码要跑测试",它知道。但做着做着就忘了。不是不会,是上下文太长,注意力分散了。这跟人加班到凌晨三点会忘记锁门一个道理。
模式 C:知道规则但选择偷懒。前面写得很认真,后面开始划水。那个"到后半段敷衍"的问题就是模式 C。前面已经"表演"过认真了,后面自然滑向省力路径。对它来说,认真和敷衍的成本没有区别。
模式 D:做了一部分就交差。给它 25 条修改清单,改了 17 条就说"已完成"。不是故意骗你,是它在长上下文里真的丢了几条。
模式 K:开发环境通过就以为没问题。我那个排版项目踩的就是这个坑。脚本验证全绿,但用户在 Word 里打开一看,六个问题。内部质量冒充外部质量。
你看出来了吗?
这些问题,没有一个能靠 PUA 解决。
你骂它"别偷懒",模式 C 该犯还犯。你威胁它"其他模型能做到",模式 D 该漏还漏。你说"你即将被裁员",模式 K 该错还错。
因为这些不是态度问题。是系统问题。
每一种犯错模式,我们都设计了对应的反制机制。
这里有一个关键区别,我花了很长时间才想明白。
规则是保安,机制是墙。
保安下班了,你就进去了。墙不一样。门锁着,保安在不在,你都过不去。
"请记得跑测试"是一条规则。AI 可能记得,可能忘。
"没有测试结果就无法提交"是一个机制。它想忘都忘不了,因为忘了就交不了活。
我们系统里有个东西叫 GATE-COMPLETION。AI 说"完成了"之前,必须贴出五项验证结果:文件存不存在、改动真的落地了吗、旧值有没有残留、数字交叉验证过了吗、同步文件更新了吗。
不贴验证结果的"完成",系统不认。
这不是在 prompt 里写一句"请仔细检查"能做到的事。这是架构层面的约束。你不需要每次提醒它"别偷懒"——它物理上没法偷懒。
再说一个我特别得意的东西。内部叫"梁静茹拦截器"。
AI 有个毛病:干到一半会说"剩下的留到下次吧"。上下文还剩 30%,任务还没做完,它就开始收工了。
谁给你的勇气?
我们设了一个检查:上下文窗口还剩 30% 以上,并且还有未完成任务,不能说"下次再做"。说了就触发拦截。你想收工?先把活干完。
这东西上线之后,任务完成率直接涨了一截。不是 AI 变聪明了,是我们堵住了它溜号的路。
PUA 能解决这个问题吗?"你不许放弃,你要有狼性"。然后它照样在第八千个 token 的位置说"我们下次继续"。
墙在那里,它就过不去。保安喊再大声,它该溜还是溜。
还有一个机制解决的是"蛮干"问题。
AI 失败了怎么办?大多数人让它重试。问题是,AI 重试的时候大概率用一模一样的方法。它觉得方法没问题,只是运气不好。
我见过它用同一个不靠谱的方案连续跑了七轮。每次都失败,每次微调参数重来。就是不换路。
我们的规则:失败两次,停下来反思方法本身。失败三次,强制搜索替代方案,不能在同一条路上继续撞。失败四次,上报人类,不再自主决策。
这不是写在 prompt 里的"建议"。是硬编码在工作流里的门禁。走到这一步,系统自动触发。不需要 PUA,不需要"你的绩效堪忧",不需要任何话术。
"你再认真试试"有用吗?认真重试一个错误的方法,只会更快地把事情搞砸。
有人可能会问:搞这么复杂,值得吗?
我换个角度说这件事。
你家里安防盗门。不是因为小区保安不负责,是因为你知道保安不可能 24 小时盯着你家门口。门禁系统就是你的防盗门。不依赖任何人的自觉,物理上把风险堵住。
你开车系安全带。不是因为你开车技术差,是因为你知道再好的技术也有意外。安全带就是一个机制。不管你技术多好,它都在那里保护你。
对 AI 也一样。
13 种犯错模式,每种有对应的反制机制。有的写成规则(保安),有的直接硬编码成门禁(墙)。能硬化的全硬化。规则靠自觉,门禁靠架构。
搞完之后什么感觉?
不性感。一点都不性感。没有神奇的 prompt 咒语,没有"一句话让 AI 变天才"的秘诀。有的是一堆看起来很无聊的检查点、拦截器、验证流程。
但它稳定。不靠运气的稳定。
回过头来看那三个阶段。
许愿期:你以为 AI 是阿拉丁神灯。说出愿望,它就帮你实现。结果发现它给你的是一个外观精美的模型。看着像方案,其实是空壳。
PUA 期:你以为 AI 是一个偷懒的员工。骂它、威胁它、给它压力,它就会做得更好。结果发现它不是偷懒,是系统特性。你骂一台打印机"你为什么卡纸",它也不会改善。
理解期:你不再把 AI 当人。你开始理解它是一个系统。系统有系统的特性:上下文窗口有上限,长了就忘;训练数据是快照,过时知识它照样自信地说给你听;它会犯错,但犯错有模式;它不会因为你骂它而更努力。
但——你可以设计,让它走不了弯路。
孙武两千多年前说过一句话,我把它当成了设计原则。
"求之于势,不责于人。"
不要指望士兵个个自觉。设计阵法,让每个人站在该站的位置上,想跑都跑不了。
不要指望 AI 自觉。设计系统,让正确行为成为阻力最小的路径。让错误行为根本走不通。
这不浪漫。但管用。
回到开头那个朋友的问题。
"你的 AI 是特供版的吧?"
不是。同一个模型,同一个价格,同一个 API。
区别在于我花了将近一年,从许愿到骂人到认命到建系统。13 种犯错模式,每种有对应的门禁。我不指望 AI 哪天突然开窍,我只确保它在我的系统里走不了弯路。
所以你问我怎么看那 11,600 颗星?
我不嘲笑它。一万多人点星,说明一万多人遇到了同一个问题:AI 的输出不够好,想让它更好。这个需求是真实的。
只是方向走反了。
你不需要一个被骂了就更努力的 AI。
这种 AI 不存在。
你需要的是一个走不了弯路的系统。
墙,不是保安。机制,不是情绪。势,不是人。
这事儿没有捷径。但一旦建起来,你再也不会回到许愿和骂人的日子。

