【我的 AI 观察报告】2026-01-11(写小说谈感悟)

OpenCode

用起来确实挺爽。配置简单,功能稳定。

然后我才发现他提供免费的模型。这样我就能够通过反复测试进行练习了。

然后发现它还提供了一个 web 界面,这样就可以实现在手机上控制了,所以早晨在电脑上打开了它,然后就又抱着手机钻回了被窝,这十分幸福!

不过他的 web 界面其实挺简陋的,就处于刚刚能用的状态,真的想用的舒服还是得用 SSH 连上去才行。

不过总之,用手机写代码这件事情看起来离我们越来越近了。

写小说

我今天用它做的测试就是写小说,其实上一次就在做了,写了三四章,今天又写了两章。

但写小说本身不是目的,如果不加干涉他写出来的是非常符合刻板印象的内容,比如让他写修仙小说,就是废柴灵根,长老重视,同门挑事,各种机缘……反正后面的任何情节都不会出乎你的意料。

但是这个方法可以非常好的去测试和观察他对整个项目的把控能力,情节要连贯,前后设定不能存在冲突,而且要更注意各种细节的衔接。其实这和编程是差不多的。而且每一章大概 3000 字,三四张以后妥妥的上万了。项目代码虽然行数比较多但是每一行的内容并不多,所以在字数上现在也堪比一个小项目了。并且内容是非常稳定的逐步增加的,可以算是线性变化,非常有利于观测。

如果是写代码,阅读起来并不容易,那么作为测试目的,让他写小说,然后去阅读就变得简单许多。

说感悟

最开始是我自己设定了一套工作流程让他按照这个工作流程去操作,但当字数增加以后效果并不是很好,并不能够稳定的控制它按照我预定的流程去操作,而且有一些操作上的细节我也没有设想到。

后来我改做让他自己去出方案,也就是我做了更少的工作,但最后的效果反倒更好。

我觉得他的思路很不错。我以前的思路是创建几个文件来记录当前所有关键信息,然后基于这些信息来确保情节的连贯以及避免设定上的冲突。然后在提示词里给了一个基本的生成流程。他的思路和我的大方向上是一致的,但是他创建了一个当前快照的文件,将最近章节的信息,各种设定等放入其中,大概相当于一个压缩好的上下文,当然那些记录进度和设定的文件依然存在,但是有了这样一个快照就让整体的效果更加稳定。这个思路大概也类似于 Skills 的设计,先给 AI,一份摘要的信息(元数据),如果有需要,他可以自行阅读更加详细的信息。

然后在提示词方面,它增加了一个任务列表,这样就更加明确的说明了步骤和顺序;同时,他还创建了一个检查列表,用来在生成之后去检查效果,也用来检查任务的具体完成情况,避免在跨度很长的生成过程中产生遗漏。这样做之后的效果就很稳定。

我觉得这应该算是在当前 AI 效果并不算稳定的前提下的一种权益方案——用 token 换稳定。

如果他能够时刻记住他要做的事情,其实并不需要任务列表。但现在他做不到,所以设置一个任务列表,并被识别为权重更高的上下文贯穿始终(每次任务完成都要更新一下这个任务列表),以确保他能够按照预定的流程去完成一切。

如果他真的能够按照我们的预期去完成每一个任务,那也就不需要检查。但现在他做不到,所以为了避免一些很明显很低级的错误,那就让他在返回结果之前再自己检查一遍。

这倒是很像人类的做事流程。但显然,我们内心对 AI 的预期是要远比这个高的。

然后这件事情也是要区分模型的,这一次我使用的是 GLM-4.7。

而与之区别的是, Kimi-k2-0905,因为他似乎内建了创建任务与复核的流程,我发现他非常喜欢这样做,这也是我这一段对它的生成效果接受度很高的原因。

接收提示词——经过分析生成待办任务——逐项完成所有任务——复核生成效果

变懒一些

OpenCode 有一个辅助软件 Oh my OpenCode,它的安装方法很有趣——直接把他的说明文档的网址丢给 OpenCode ,让 AI 按照这个说明进行安装就行。

既然有 AI 可以帮我干活了,我为什么还要自己去学习如何安装这种学了也不会给我什么提升的无用技能呢?

那么想让 AI 做事情提示词为什么要我们自己去写去优化呢?先和ai讨论去研究应该如何构建这个项目,让 AI 去写去优化提示词也许最终产生的效果更加理想。

简言之,Plan 阶段是非常重要的。

AI 还没有足够智能,没有办法做到我们提出需求他就完美完成。那就拆分成更小一些的步骤,将每个步骤拆分到它能够完美完成的大小。

建个群吧

因为最近测试的比较多,所以絮絮叨叨的废话也比较多,也许建一个群相互讨论一下更容易激发想法,谁知道呢,就当朋友之间聊聊天儿也挺好的吧。

当然观察报告还是会发的,我觉得形成长文记录自己的想法还是很有必要的事情。

1 个赞