
得物团队最近发现,用AI写SQL代码时,一个不小心就翻车——Claude Code在长对话里会忘掉关键信息,比如字段到底是“元”还是“分”。忘了这个,生成的数据结果直接差1000倍,整个报表全废了。这不是段子,是得物数仓开发团队在实际项目里踩过的坑。
他们用Claude Code搞自动化开发,确实省了不少重复劳动。但AI记性差,成了拦路虎。问题出在对话字数上限:当对话内容越来越长,AI会自动压缩历史信息,就像人脑子记了太多事,后面的忘了前面的。比如开发一个销售报表,中间提过“金额统一用‘万元’”,可AI聊到后面自己忘干净,默认用了“元”,输出结果直接多三个零。
更要命的是执行规范不稳。项目紧张的时候,人工能遵守规范的概率只有60%到70%;AI呢?也不好使,只有70%到80%的命中率。这意味着就算AI记住了,也有近三成概率跑偏。得物团队算过账:与其靠记忆,不如在系统里设“硬规矩”。
那怎么办?他们提了个新思路叫“Harness”工程。翻译成人话就是:给AI写代码上“护栏”。不是靠AI自觉,而是把每个开发必须遵守的规范,变成系统自动检查的规则。比如,每次SQL生成后,系统自动扫一遍字段单位、命名风格、权限限制,碰线就拦下来。这好比给汽车装了车道偏离预警,而不是指望司机永远不犯困。
在复杂的大型需求面前,AI的上下文膨胀更快,失忆概率更高。Harness工程就是让这套自动检查能跑在每一步开发里,用hooks(钩子)和自动化工具把规范嵌入流程,而不是事后补救。得物团队说,未来的目标是把开发中的不确定性降到零,让AI在复杂环境中也能稳定输出。
说到底,AI写代码不是万能药,它需要一套“安全带”。得物这种将规范系统化的做法,可能很快会成为行业标配——毕竟,没谁想为一串忘记单位的SQL,赔上整个团队一星期的工时。