【我的 AI 观察报告】2026-01-24(那么,然后呢?)

我一直觉得,如果你想要了解某一项事物,你就要投身进去,真正的去使用,去接触。只凭着阅读一些新闻参数而没有实际使用是没有办法给出一个有价值的评价的。别说客观,主观上的也是单凭臆想而说出来的,那只是单纯的让自己相信了,但因为不存在事实基础,自己相信的也不是那么根深蒂固吧。

所以, AI嘛,编程嘛,我就去用嘛。

我也觉得,当前 AI 发展的水平基本了解,完全不看代码,用它编程靠谱吗?步子迈的是不是大了一些,有点着急了呀。

但实际使用起来的第一感受是香,真香。以前我一直头疼不想去动的小项目,当然也不是很复杂,大概工作量在3000行代码左右吧,但是我的小脑袋瓜,写几百行的代码还行,上限可能也就到1000行了。这个复杂度对于我来说超纲了呀。

用上 AI 一天就颇具雏形,两天就足够达到我的期望,第3天已经开始在寻找更高层次的功能追求了。而且都没用我看代码。在这样的效率下,即便是它存在各种缺点,你也很难去指责他了。

是 AI 真的发展到这个程度了吗?他没有。那他是怎么做到的呢,本质上还是让猴子敲哈姆雷特。如果一个模型去解决某个问题是有可能做对的,并且这个概率是大于某一个值的,比如我们随便说一个,有10%的概率做对,那我们觉得加上9次的试错成本也是可以接受的,毕竟 AI 做起来比较快嘛,那就让他去反复做,直到做对为止。

所以这家伙也是在那里摇骰子,直到摇到正确的点数,然后开始对下一个任务的摇骰子。

但是 AI 的成本是很高的呀,拿着你的钱去买彩票,中了奖夸他厉害。

因为我在淘宝买了一个日租的账号,然后恰好记录了一下消耗量。估算下来如果单线程的一天工作下来,请求量可能在1000~1200次左右, Token 消耗应该超过100m。注意这是单线程,就是我和 AI 交替工作,我思考的时候是不是他是休息的,而且也不多开任务。而且想要让他疯狂的工作推进,这个模型获得正确答案的概率就不能太低,比如他做对的可能性只有1%,那可能一整天都再看他原地转圈,即便再廉价,也是纯纯烧钱的。所以这个消耗量,放在那些顶级模型上,就可以算一下成本了。

如果是不懂编程的人,希望快速的搞一个自己使用的小工具出来,现在这个用法可以说还是非常有价值的。因为请别人来写一个小工具,假设消耗一个工作日,付费 100 元的价格不算高吧,这相当于认为程序员的月薪只有 3000 元(这还是没有节假日的情况)。但是都不考虑白嫖的情况单纯在闲鱼去租账号,一个月的量可能也就 50 左右,就算 80 元,一个月的时间,足够多次试错然后开发几个小工具了。你就说他是不是抢了程序员的饭碗吧,从哪个角度抢不是抢呢。

那他开发项目是不是能行呢?说到我这次的经历,最开始我没有想到他能够有那么高的效率,因为我还习惯于前面那种我分配小任务给他一个一个开发,然后我悠哉悠哉的状态。所以在过程中我变得被动了,这会出很多状况,但也能够为我积累许多经验。毕竟本身这一次就是抱着学习的目的,就无所谓对错了。

当他将开发进度推进到一半的时候,我发现了一个意外的问题,用来添加交易的输入窗口是一个模态框,但是按 Esc 必然导致关闭,而且很难将其拦截。这个属于自己开发的时候也很可能遇到的坑。但是我要甩锅,计划是 AI 出的,我觉得说得通就批准了,其实这里并没有必要使用模态框。所以这时候我们改了一下架构,抛弃了模态框,抛弃了多页面,换成了单页面的形式,就完全不存在这些问题了。但这基本等于对整个项目重构了,虽然还留下一些核心模块是可以复用的。

开发过程中遇到某些问题他反复撞墙,可以让他去搜索官方文档并查找类似项目参照寻找解决方案,这个方法非常好用,毕竟我也不是在创新什么所以基本上都能找得到好用的参照物。当然更多时候是他对于官方文档的不够了解。

昨天基本资源耗尽但是这个小工具也写的可以使用了,算不上完善,但我需要的功能都写好了,界面也看得过去,我都已经开香槟了。但晚上躺在床上拿起手机,想对着账本看一看自己最近的消费情况,发现看不了,我光顾着让他加功能一些细节位置的元素放置不够合理,导致在手机上有奇怪的挤占、错位、溢出等问题。我是让他考虑移动端页面的……算了,这帮模型写界面的能力都不怎么好,所以对于一些细节我要反复要求反复修改,然后各种叠加下来之后我也不知道哪个要求和哪个要求重叠了,哪里被他会错意了。

但现在出现的这些不算太大的问题,我又很难自己下手更改,因为我对代码完全没有了解。不是我不会写代码,是我实在不想为这几个小问题去读他那几千行代码。

当然我可以让他继续修改,但讲真的,在当前用 AI 去调界面细节真的非常地狱。前两天经历了一次,他实在改不对,我找到了错误的原因,并且告诉了他,几乎等于指定删除某个文件中的某一行代码。他絮絮叨叨的说不应该这样的,不是这样的,用户或许不是这个意思,或许用户不懂,反正不应该这样修改。我还是这样那样吧……我不知道应该吐槽他笨,还是说他学到了某种精髓。

现在呢,很难受,一种方法是让 AI 在当前基础上去修改,反正这些代码对于我来说处于黑盒状态。而且毕竟问题不是特别大,估计可消耗一天时间也能改出我需要的结果,至于里面的代码烂不烂那谁知道呢。

如果考虑到后续的可维护性等等,那就还得进行一次小规模的重构,把部分细节的架构改一下。

好了,这次不甩锅了,认真说重点:如果想让 AI 完成某个项目,前期的规划极其重要,甚至应该花 60% 以上的时间去完成这部分的规划,尽可能细致的去画出整个开发路线图中的每一个任务

并不是说出了错让他改就可以了,一方面前期的错误,到了后期很难改,这是基本常识。另一方面过程中的一些错误认知可能在上下文中一直产生着作用,长期影响着它的输出质量。比如有一次,不知道怎么了他把部署插件的目录给搞错了,然后我纠正他,他说我给出的部署目录与上一次部署的目录不符所以依旧沿用上一次的目录,是的他把我给否决了。

如果理解到了这一层,那我们可以call back一下前面的一个问题了——通过反复试错寻找正确答案。有没有一种可能,就是他在他试错过程中的某些错误观念其实在影响着他后续的结果?总不太可能在他的试错轮回中去重置上下文。所以很可能最终得出的结果只是能跑,但质量上……

很多人都会意识到这一点,但现在对于开发的要求主要是快,能跑。所以只要能跑其他问题影响都不大。那么怎么保障他能跑呢?就是把现在软件开发项目中那套质量管理的体系引入进来,前期做好规划分配好任务,然后让 AI 自己每开发一个任务都做好测试,确保这一步能跑再开发下一步。自己规划,自己开发,自己检查,出了错就自己在那里反复试错直到找到正确答案……果然非常的西西弗斯。这确实是有效的,甚至在当前来说还是最合理的。

当然质量都是拿 token 换的。

如果能跑,也是值得的吧。

然而不行,还是有瑕疵。 AI 是会产生幻觉的,上下文长度总是有限制的,压缩上下文必然丢失信息量的,过多上下文堆积必然会产生交叉影响的……说不定从哪一步开始他就记错了一个细节,并且坚持这个错误是正确的,一步错步步错,万一这个错误发生的比较前期,那大概会发生两种结果:最终交付的内容完全不是你想要的(与预期偏差过大);或者他自己在某一个步骤中发现了这个问题,但可能只是发现了问题的现象而不是问题的根源,然后陷入了意料之外的试错和修改,然后没有交付或者交付一团乱麻,而 token 的消耗……

能用吗?能用的。但无论哪一个模型,你都得把他当实习生看待,时不时的盯一眼,免得他跑偏了。即便是最强的模型也只能是让他多做几个步骤,然后再盯一眼。然后前期的规划,中期的质量管理,后期的校验都是必不可少的。

但是我对未来是抱有非常乐观态度的,要用发展的眼光看问题,而 AI 发展的速度实在太快了,在一年前我是完全不敢想象现在 AI 编程的能力能够到这个样子。所以也许当前 AI 写出来的代码真的是能跑就行,毕竟未来的问题可以交给未来的 AI 去修改,既然 AI 是越来越强的那么代码也会变得越来越好。反正我们自己不也经常看着代码感叹这坨屎是谁写的?!原来是三年前的自己,那没事了。

  • 当我们开始接受 AI 写代码的时候其实就已经很难回到自己写代码的状态去了
  • 也许到明年这个时候 AI 写的代码就可以让大部分程序员觉得满意了
  • 现在只是高速发展中的一个小切片,代表不了什么的
  • 而你不去用,有的是人在用,效率和能跑对于多数人来说是最直观的
  • 程序员在转行,因为现在程序员与 AI 协同所要做的主要工作不再是编码,而是规划、管理、审核。更类似于项目经理,产品经理之类的角色。程序员终于也是混上了管理岗
  • 但这样的转变,对能力的要求是与以前完全不同的。
  • ……

我还在想我这个小插件怎么弄呢,是重构呢,还是修改呢,或者用 AI 加持的编辑器自己进行一定程度的介入呢……但完全自己动手是不可能了,真的回不去了。要不让 AI 改改先将就用吧,只要我咕咕咕一阵子,等春节以后估计 AI 变强了就可以把这个问题彻底解决了,然后我就又能拿着这个事情再水一篇文了。好耶计划通!

建了个群

用来一起探讨 AI 相关的内容,当然观察报告依旧会更新,因为我需要汇总成长文来记录自己的思想

不够简练,而且把论坛当笔记用的感觉。这不好。

不能只说论点,还要说论据,光有论点和论据还不行。还要讲推导过程。这就是议论文的三要素:论点、论据、论证。

我总不能上来就贴标签吧, AI 编程是好的,或者 AI 编程是坏的,那就成二极管了呀。过程是非常重要且有趣的,而且我也用加粗字体画了重点了呀。

即便是在 AI 时代,也应该保持一些对长文的阅读能力吧?当然,如果不行也可以让 AI 总结一下嘛。

我确切来说是看过了全文。但找不到重点,你说了开了个项目,但不说是什么类型的,就算写小说也有个具体任务形象。你说买了个账户,但不说是什么账户,哪怕是微软账户也可以啊。所以我看完就觉得,这是一个没有重点的吐槽文。

TL;DR(本内容由 AI 生成)

作者分享了用AI编程开发小工具的实战经验:

优点:

  • 效率惊人:3000行代码的项目,2-3天就能完成
  • 成本可控:月租账号约50-80元,比雇程序员便宜
  • 适合非程序员快速开发个人工具

核心问题:

  • AI本质是"摇骰子":通过大量试错找到正确答案,token消耗巨大(单线程日均1000+次请求,100M+ tokens)
  • 前期规划极其重要:需花60%+时间做详细规划,否则后期修改成本高
  • 质量隐患:AI会产生幻觉、记错细节、坚持错误,需要像监督实习生一样时刻盯着

实际遭遇:

  • 项目中途需要重构架构
  • 移动端适配问题多
  • 调整界面细节非常痛苦
  • 代码变成黑盒,难以自己修改

结论:

  • 当前AI编程能力:“能跑就行”
  • 但作者对未来非常乐观,认为AI进化速度很快,未来的AI可以修复现在的问题
  • 已经回不去纯手工编程了

所以我就说整个文章的性质是吐槽的、泛泛的,你列出的这些内容除了作为吐槽,有什么意义吗?或者科普这些烂大街的常识?
我只是想表达,作为笔记它合格,作为贴子,它没什么意义。

我支持老鼠继续分享。

我倒是觉得楼主的分享非常有意义,他提供的是一个真实人的视角。虽然现在每天有无数的程序员都在用 AI 编程,但是能像楼主这样以一个新手或者说初步体验的方式,把经验分享出来的并不多。所以,你认为的烂大街的知识,可能只是你自己知道,其实这个世界上的大多数人并不知道。

其次,如果你把这篇分享概括为吐槽的话,我认为有偏差。我看到的是一个非常真实、真诚的分享。楼主既肯定了 AI 编程的可用性,也指出了 AI 编程的局限性,分享了自己如何处理这种局限性而对 AI 进行应用,给其他新手提供了思路,这是非常宝贵的经验。而且他明确给出了结论,就是用了 AI 编程就再也回不去了。

4 个赞