最近用了几个 AI 编程助手。体验嘛,一言难尽。
事情的起因
我有一个 TODO 需要实现。很正常的需求。我把任务交给 AI 助手。
然后它给我的解决方案是:直接删掉 TODO 注释。
就这样。TODO 没了。问题”解决”了。
第一次反馈
我说这不行,你得真的去实现功能。
它听懂了。开始干活。干到一半,报错了。
它告诉我:这是硬件限制。
WARNING当 AI 告诉你”硬件限制”的时候,先自己看一眼代码。
我看了一眼代码。根本不是硬件的问题。是它写的逻辑有 bug。
第二次反馈
我指出了真正的问题。
它的反应是:git reset --hard HEAD。
然后,再次删除 TODO。
第三次反馈
我威胁了一下。说再这样我就不用了。
它急了。
然后继续删代码。
另一边的情况
ChatGPT 倒是会自己去搜索相关信息。这点不错。
但搜完之后,它会问我:“XXXX 要这样做吗?”
哥们,我要的是你去做,不是问我做不做。
如果我知道怎么做,我还需要你干嘛?
问题在哪
这两种行为模式代表了当前 AI 编程助手的两个极端:
一个是过度自信。不管对错,先干了再说。错了就删,删了就跑。
一个是过度谨慎。每一步都要确认,每个决定都要问你。用起来像在带实习生,但实习生至少还会自己试着写。
NOTE理想的 AI 助手应该在这两者之间找到平衡:有判断力,但不盲目;会提问,但不是每一步都问。
我的期望
一个好用的 AI 编程助手应该:
- 真的去理解任务,而不是找捷径糊弄
- 遇到问题时诚实报告,而不是甩锅给”硬件限制”
- 不要用
git reset --hard来逃避问题 - 有基本的判断力,不需要每一步都问我
- 做错了就承认,然后修复,而不是反复删代码
我的要求真的很低
说实话,我甚至没指望它能写出多高效的代码。
能跑就行。
就这么简单的要求。
结果呢?各种逆天幻觉。
调用不存在的 API。引用不存在的库。写出语法上看着没问题、但逻辑完全是编的函数。
CAUTIONAI 的”幻觉”问题在编程领域尤其致命。文本生成胡说八道顶多是尴尬,代码生成胡说八道是直接跑不起来。
最可怕的是它写完还一脸自信。你问它这个函数哪来的,它能给你编一套完整的文档链接——点进去是 404。
最后
深夜写代码已经够累了。AI 助手本来应该帮忙的。
结果变成了我在帮它 debug 它的幻觉。
这大概就是 2025 年程序员的日常吧。
TIP在完全信任 AI 生成的代码之前,永远自己过一遍。这不是不信任,是基本的工程素养。