【我的 AI 观察报告】2026-01-10(新的接触与猜想)

近日体验

最近又试用了一些工具,Claude Code 配置起来有点麻烦,我就没有弄它。OpenCode 用起来各种顺畅。

然后我又非常倔强的选用了 Kimi-k2-0905。体验还是不错的,也不是说写出来的东西多好但起码整体上是顺畅的。或者说可能达到了及格的门槛。然后半天时间,大概 15 元的 token 又被我用光了。不过这次用的是精光,直接把余额干到了 0。

当然最后也只是尝试用它写写小说,纯粹瞎折腾,然后就换到了 Trae,依然是相同的模型,依然是相同的工作,然后差距一下子就显现出来了,即便是排队的 SOLO 模式也不行。但具体原因我分析不好,但我感觉不像是降智,有点儿像单次对话的上下文长度不够导致的轮次过多,注意力不集中。

我的感悟

于是花钱和不花钱的差距就体现出来了,看着别人每个月几百上千刀的在上面花钱,我是真的好羡慕啊!

上面说到的 token 还是我在闲鱼便宜买来的。可即便按照这样 bug 级的便宜价格,算下来一年也得几百块钱,比国内各种互联网服务的年费会员应该都贵了。

啧啧,每天搓手手看看在哪里能弄点免费的 token 来用。

一些猜想

当然现在 AI 的编程水平还不算完美,甚至也不算可靠吧,但大概也能说是初具雏形。在很多情况下确实可以做到不需要自己动手去碰代码了。因为一旦他能够完成 80%,你就会期望努力一下让他把那 20% 也做了;而不是他都替我完成了 80% 剩下 20% 我自己动手就好了。因为你会非常迅速的开始习惯自己不去动手。当然在现阶段下这可能并不是一个很合理的习惯,但长远来看这是一个必然的最终结果。

可能你们还记得,我不能在电脑前面坐的时间太长,那如果能在手机上写代码,对我来说应该是非常方便的。

然后我就在想如果我在 NAS 上跑 OpenCode ,然后在手机上控制,这不就实现了吗。反正我也不动手自己去写代码,只是发出指令,所以手机的屏幕虽然小一点,也问题不大。但是我那个 NAS 的性能稍微差一点儿。

可是接着往下想,我这台笔记本的用途是什么呢?专业就是买来写代码的嘛,所以把它当做服务器来用就行了,它上面跑服务,然后手机控制。看起来这十分可行。

同样的逻辑只适用于写代码吗?显然不是,感觉很多电脑上的工作有 AI 介入以后基本上人类的角色都会逐渐转变为发出指令验收成果。而发出指令和验收成果所需要的屏幕和输入设备都可以更简单一些,比如用手机。

所以未来的家庭电脑会不会更加向家庭服务器方向转变,我觉得这种可能性是非常大的。毕竟以前家里面一台电脑也可能是为了登录一些在手机上无法操作的网站,比如网银。但现在这些都可以在手机上操作了,电脑的功能似乎只剩下了游戏和工作。

在工作方面,感觉这些年大家的工作方式会发生一次巨大且全面的变革,这有点像从纸质办公向计算机办公的转变。

想一想应该有人同时经历这两场巨大的技术变革,也是挺令人唏嘘的,现在技术发展的速度真是太快了。

能说什么呢

抓紧学习呗,刚弄懂了 MCP,还不怎么会配置,现在忽然一股脑的又都开始折腾 Skills……在我的理解中,这些不都是预设提示词吗,只是换了一个形式,换了一个格式,怎么就变成革新了。

但反正就是革新,反正就得跟着更新。他们不需要你的理解和认可,反正车轮在前进,不跟也得跟。

这两年我在用五笔打字,算会吗?大概是的。但就是速度非常慢,因为有语音输入法了,为什么我还要敲字母让自己得腱鞘炎呢,而且本来打的就慢,我肯定会不由自主的去选择更轻松的方式,否则一个字一个字敲这么多内容,怕是都得耽误中午吃饭。

我感觉我打字也快不了,这不 AI 语音输入法也开始逐渐出来了,测试了一下本地部署的语音识别大模型,效果也挺好的。

怕不是未来打字这项技术也会被称为非遗吧。

2 个赞

其实人类验收这一点就挺抽象的,现在ai也会自动运行来确认正常不正常,但是他为什么不自己生成测试计划,自己测试gui实际效果,模拟点击有没有预期功能会不会崩溃来够成闭环呢?

我觉得能自动化的肯定可以往这个方向发展,但有些“特殊”的不行 :joy: 像我领导最近提出了一个需求:“处理下图片,让图片变好看”,最后弄了半天才知道,领导觉得像平时喜报那样,加个大红花边来点金粉就是“好看”,这种东西只能人验证。

1 个赞

这是可以做到的呀,而且一些模型在某些工具下也确实会这样做。

但还是得验收。退一步说,领导布置的任务,你做完以后,领导也得看一眼,以决定是否认可你完成了这个任务。

可以试试各种编程套餐,比如智谱和kimi都有月费套餐,虽然还是有上限,但是对日常编程来说够用了。

OpenRouter 也有免费模型、ModelScope还有每天免费2000次调用。