【我的 AI 观察报告】2025-12-31 (付费编程时代)

感觉其实也在做类似的事情,只是今天决定把这件事情当做一个系列去写,记录ai的变化也记录我思想的转变。当然内容零零碎碎的,而且也不一定正确,只能算是我当前认知的一种切片。

误打误撞的组合

最近讲过几次的故事,但是还是讲一下吧。

目前各种 AI 编辑器给的免费额度基本都是比较少的,顶多也就是够每个月简单测试一下,但凡要用它写一个功能都是不够用的。但是我想实现一个想法,而恰巧我看到 Kimi 的账户里有赠送的 15 元。把 AI 接入编辑器的方法还是挺多的,我选择对我来说最简单的直接把它填入了 Cline,因为这个插件本来就在我的编辑器里。

模型我不会选,那就选一个看起来比较新的 Kimi-0905。

然后我列出了我想写的这个插件的需求,丢给它我就去干别的了。因为我的项目只有一个空白文件夹,我没什么可担心的。一般来说现在这些编辑器的自动化,也会限制命令的使用,对于危险命令,比如删除文件,它是需要人授权的。

耗时不算太多,插件写好了,它已经调试到可以正确编译了。而且确实实现了我要求的所有功能。

如果只是想写一个网页小工具,他能够一下子写成功,我觉得是预期之内的。但写一个插件的复杂度显然要比这个高多了,即便我要实现的功能并不复杂。所以没有见识的我还是被震撼到了。

然后我开始给他提出各种修改需求增加功能……这个过程中,它可能没有完成功能,它可能改来改去效果在原地转圈。但基本上都能保证正确编译,而且可以运行。这在我以前使用的 AI 编程工具中是很难做到的。以至于我认为现在 AI 进步的是如此之快,已经能够即便做不好事情也不把事情搞砸了。

但额度消耗的是非常快的,15 块钱的额度大概也就用了一个晚上吧,晚上横竖睡不着,又在闲鱼买了 15 块钱的额度,然后第 2 天上午两三个小时又消耗光了。但他依然完美地回应了我的期待,即便后来代码开始变得复杂,我提的功能也开始逐渐的……不走脑子,他还是把我要求的功能基本都写出来了。

后来因为没有了额度,我测试在其他工具下使用相同的模型,也注册了 Cline 的账户,然后他赠送了 0.5 刀的额度,我在里面尝试使用 Claude-sonnet-4.5,都没有办法达到相同的效果。我使用 Kimi-k2-thinking 效果也不行。这时候我才知道最初的组合是怎样的价值。

只可惜后来我和人说起,他们居然都出奇的一致:

  • Kimi 就是一坨……
  • 你用过 Claude Code 吗?

我……现在编程的人都不讲理性思考了吗?为什么没尝试过就要先否定呢?我不理解,但我选择闭嘴。

阅读代码

当然这个项目终究是被我写乱了,我认为是 AI 写的不好,我决定手动重构。

阅读代码,看不下去了呢!相同的功能在不同文件中有重复定义的函数,有些功能明明已经提供了内部 api,但它却使用比较笨的方法去实现。

但写着写着,我发现 80% 的函数我都是从它的代码里复制过来的……

再仔细想一想,产生重复定义的原因是我不断的在追加需求,有时候前后需求是冲突的或者重复的。这就好像工作中领导总是在拍脑门出主意,我们也只能忙着各处打补丁,最后写出一堆屎山代码。

所以写着写着,我觉得也许问题出在我自己身上。如果我能一次性将需求完善的写好交给它,说不定能够获得一个挺不错的结果。

而且因为上面我所讲到他的完成能力,让我对问题开始不那么慎重的思考,我只是提出需求而不思考这些需求应该如何去实现,如果这个需求本身是不合理的,而它实现出来的效果又不符合我的预期,拉扯几轮之后得到一堆屎山代码,这应该也算一个合理的结果。

使用方法

所以工具终究是工具,工具确实是在不断强大,但工具强大不等于可以随心所欲,更了解它的特性才能够更好的加以利用。

所以现在想写好代码的重点是如何合理细致严谨的提出需求。从写代码到写需求这是一个非常重要的转变。

而事后追加需求永远都不是好办法。

工具的场景适用性

似乎每次聊到 AI 编程大家都对国内的各种模型嗤之以鼻。我觉得也没必要吧,假设他们真的是差劲的,可是也不是我们所有的场景都需要高端的。小学生做数学题时即便使用计算器也没必要弄一个科学计算器吧?

比如这几天我在使用 Trae CN,里面都是国内的模型,但是我是在手动重构,我把他们当做高级的代码补全,这就很好用啊,而且反应速度相当快。写代码都不会反对自动补全吧,那更快更智能的自动补全当然也没有理由反对啊,在这个场景下它是足够用的。

重构中我希望更细致的掌控每一个细节让他们都符合我的想象,而不简单的是能跑就行,因为有时候我也挺强迫症的。这时候我可以控制它的生成只局限于某一个函数之内,写一个函数一二十行代码总出不了什么大问题了,而且因为代码量少这样准确度会更高。而好处是它可以结合整个项目的内容去书写这个函数。我所要做的只是在他写好之后去阅读,以保证这个函数确实符合我的想象。

所以把它的应用控制在合理的范围内这是很重要的。正确的使用方法能够更好地体现工具的价值。而单纯依靠工具的强大,容易让人忘记自己存在的价值。

关于隐含条件的思考

当我们提出一个需求的时候,永远不可能描述的面面俱到,也就是永远存在隐含条件,但我们假设对方是了解这些隐含条件的,这可能是一个常识,一个解决这个问题的基础知识,几个条件综合以后的必然结果……

但事实上我们很难确定对方是否在思路上和我们足够对齐,和人交流是如此,和 AI 交流也是如此。有时候我们很宽泛的提出一个问题,但是 AI 很认真的去考虑了相关的各个方面,最后给出一个超出我们预期的答案。但是在编程中,我们提出整个项目的需求,这时候未涉及到的需要双方共鸣的细节就非常多了,有一些 AI 会做的超出我们的预期,而有一些则可能完全相反。好的方面容易被我们忽视而坏的方面常常又被我们放大。而且在数量叠加以后这种感觉更加明显。

所以又回到了应该如何去提需求,足够全面,严谨,不出疏漏。又如何把 AI 每次的生成量控制在理想的范围内。

付费编程

当然也不得不承认,有一些模型的效果就是断崖式的领先。好像除了价格贵也没什么毛病。

以前想要编程有一台旧电脑也就够了,不好用就不好用吧,但这不是主要因素,至少它不会影响我编程的水平。但现在想要编程先得给 AI 付费,而有没有 AI 对最终代码的效果可能真的影响很大。

以前我和大佬之间的差距只是我们个人水平的差距,而以后可能单纯是双方经济实力的差距。当然这种说法很偏激了。但还是,令我感慨了许久。

付费也是认可的,毕竟完全理解 AI 超高的算力消耗成本是很高的。但现在你追我赶此起彼伏的时代,在任何一家模型的身上也不敢过多下注。在这家买了一年,三个月以后发现他被超越了,甚至是毫无争议的被超越了,而后面的 9 个月里他都没能赶超,那这钱付的就很尴尬了呀。

发展太快了

现在国内的这些模型如果放在年初,那写代码能力算是非常强了吧,当然我们都不会知足的,最好连需求都不用我提……当然那时候我就该非常焦虑——我自己究竟有什么用呢。

发展终究还是太快了呀!比如年初的机器人跳舞和年末的机器人跳舞。这可不到 365 天啊。现在看新闻慢一点儿都担心立刻被时代淘汰掉。

虽然我在认真地讨论着应该如何写提示词,但其实很多 AI 工具中已经自带提示词优化功能了,如果借助这样的功能在实际生成之前先优化几轮提示词,应该也能够获得挺不错的效果了。只是我确实太懒了呀——我也不知道我想要什么,反正你先做出来给我看看呗……终究是活成了自己讨厌的样子。

懒就懒吧

说着是手动重构代码,还不是从 AI 生成的代码里搬了一大堆,然后需要自己写的时候打着练习书写提示词的旗号,让 AI 帮我生成我需要的函数。

当初学会使用编辑器的自动完成之后我就再也回不去了,很多单词我都是不会拼写的,但是我基本都记得前三个字母。

现在学会了让 AI 帮我写代码,我觉得我肯定是又回不去自己手敲代码的时代了。

用好AI需要有一定的工程思维,做好一个项目需要有产品思维,AI辅助让很多人能够更加专注在业务逻辑上,快速写出一个原型,效率是极大提升的。

从开始学习编程到真的独立完成一个项目,自己提出需求,设计,编写代码,测试,需要太多的知识和技能了,轻易就能劝退一个人,上手写hello world也好,写贪吃蛇也好,对很多人来说真得很无聊,AI在一定程度上补足了短板,抹平学习曲线。

目前AI最火的是出前端,还有一些经典的东西,写“样板”代码非常厉害,但深入到底层一点,就很吃力了,深水区还得靠人,给终端用户用的东西用AI做省事,给程序员用的东西主要还是靠人,相当于后者给前者擦屁股了,所以编程只会变得更加“纯粹”,古法程序员也不会被AI取代,只是工作内容有变化。

AI的发展和移动互联网一样,从技术迭代速度来看,比移动互联网还要离谱,创造了一个新的时代。

这是比较具有代表性的:

  • 你说他不会吧,他代码中用对了很多 API
  • 你说他会吧,有些明摆着的 API,他又坚决不去用
  • 你说他不会吧,你问他,他还门儿清

……

写的对不对呢?也对;能不能跑呢,也能跑。当然,缺点也显而易见,就是代码长,而代码一长,它的控制能力就开始下降。

但因为这些就否定他,好像也不太合适,因为有时候我也会这么写,当某些 API 稳定性存疑,而一旦它出现问题,会导致整个项目不可用的时候,我可能就会自己去写,这事儿又很合理。众所周知,所谓的 AI 写代码,未必是他真的能够理解这些代码,而是他通过参考大量数据之后“抄”出来的这些代码。所以你猜这些习惯的背后,会不会有某些人的深层考虑呢。

经过几天对插件的重构,与 AI 之间有了更好的磨合,所以更新一下最近的思路。

他是一个实习生

以前呢是我自己干活,一切都要亲力亲为,这肯定是辛苦的。现在有一个实习生来帮忙,而且是一个比较乖巧不会顶嘴的实习生,有一定干活能力,也有一点思考能力。这样的条件下,他肯定是对我有帮助的。

但如果真的是一个实习生,我们也肯定不会希望他能够一下子接手所有事情并都做得很好。总要逐步测试一下他的能力,然后让他做他能力范围之内的事情。无论如何,他做一些我就可以少做一些。

但是换成 AI 我们就常常忽略了这一点,尤其是某一次他把事情做得很好的时候,我们会直接把所有的期望值拉到这个位置。

然而他终究只是一个实习生,不可能每件事情都做到我们心坎里,甚至他会出很多错。所以如何让它发挥他可可以发挥出的最大价值,这是我们应该深刻思考的问题。

它就是自动补全

我觉得在当前阶段下,把它说成一个程序员,或者说一个编程助手,可能都会带来一些误导。它就是自动补全的,只是比传统的自动补全更强一些,当然现在更强了,你可以通过输入注释来提示他补全,也可以输入提示词来让他补全,它可以在当前位置补全,也可以跨文件补全,甚至还可以补全需要的文件。

虽然写的很多,但依旧是补全。

我们要时刻坐在驾驶位置上,紧盯着他的操作,及时纠偏。这就好像从走路换到了骑电动车,它能让你行进的更快了,甚至你不需要做多少对外输出了。但它不是自动驾驶,更不是无人驾驶,驾驶的职责依旧完全的落在了你自己的身上。不能因为某一段时间你不需要做任何操作,他就在笔直的行进,而以为它具备了自动驾驶的能力。

我想反驳,但是不知道怎么举例子好
现在复杂的项目还是人工干预占大部分,ai的不确定性太大了
而且最关键的一点,ai它有疑问不会反驳,你的需求中明显有漏洞它还是不会问清楚,而是只会默默的回答你。。

鼓吹ai从chatgpt出现的第一天开始就有一堆公众营销号开始说了(chatgpt一轮,deepseek一轮)
事实上怎么进步宣传也好,什么新版本也好,还是输出结果不稳定

对于ai使用场景:
简单的不需要ai基本思路直接写,复杂点的喂ai它又输出不稳定,复杂点的最终基本上还是要人工干预人工理解人工书写。。
所以使用的场景定位有点尴尬。。
对于我来说,目前它只能被当成是一种备用的搜索引擎和简易单文件级的生成器

ps: 这个自己回复自己怎么取消?不小心选错了

我觉得这是对使用方法上的认知差异。

刚出来就说他能够完成整个项目,必然是不现实的。

现在等 AI 基本可以独立完成小项目了,当然,这要限定:非常大众的语言、框架、需求。这样的场景是存在的:比如不懂编程的用户可能需要特定场景下的简易工具,这在以前是一个很麻烦的问题,要么求助,要么自己先学编程。但是为了一个小需求去求助和学编程可能投入产出比有点儿不划算。但现在确实可能一轮问答解决问题。

放到正经的编程场景里,肯定要自己去掌控整个方向,但你可以和他探讨计划,当然,他不会反驳,但你为什么要丢给他一个有预设答案的话题呢?

可以圈定每一次问题的影响范围,比如说:先说明思路,但不要修改代码;只在当前文件内进行修改,不要修改其他文件;只修改当前函数;……

当我需要新建一个非常常见的功能模块儿时,我会向他描述需求,然后让他直接写出来,几十上百行,一般情况下问题都不大,当然,我会逐行阅读审查。但这总比我自己写要快的。因为这样简单的代码读懂并不难,但是自己写的时候有一些细节我需要去查找(总会有记不清的地方)。这样效率就提升了很多。而这在我看来,也是一种自动补全。

而且真的要等它发展完备再用吗?我还是想抓紧成为 AI 的驾驶员。

嗨嗨 对于想体验强大ai编程功能,但资金不是特别充裕的学生党,鼠老师可以提供一些建议吗

首先各家的免费额度都可以白嫖一下,一些 AI 编辑器或者插件大概都有一个初始额度,或者每月免费额度,虽然不多但也能够简单体验一下。然后各家大模型注册可能有赠送的额度,还有api聚合站中转站等也有一些赠送额度。

Trae CN 目前是免费的,国内的其他编辑器我没看过,也许也有免费的。

谷歌家的反重力(Google Antigravity)编辑器说是免费的但是有一定额度限制轻度使用应该问题不太大,但是需要修改账号关联的国家地区。然后还可以上车 Google ai Pro的家庭版,反正就是元旦前小青蛙喊着开车的那个,应该还有一些人有空余的车位,这个算下来一年100块钱多一点价钱还是很划算的。至少比买各种会员的价钱要便宜多了。但是呢,也不要做这100块钱用一年的预期,毕竟现在各种模型你追我赶的,说不定三个月以后你就瞧不上他的模型了。

然后也可以去闲鱼看一看,带额度的api key,或者各家账号都有出售,有的确实能够便宜一点,但是要注意安全,各种意义上的。

谢谢鼠老师 •̀ω•́ʔ✧