本篇只是理性分析,也是我折腾了这么多天之后的思考,希望能对大家有所启发。
先说成本
凡事都要讲个投入产出比,产出现在不太好估量,但投入上还是比较好计算的。想干活肯定要尽量用最先进的模型,然后因为每次携带的上下文长度是很高的,所以 token 消耗量巨大,按量计费过于昂贵所以肯定是要买套餐的。按照日常聊天的请求次数看,一般使用至少也要中档的套餐才能够满足,也就是每个月的成本起码也得上百块,我们简单按照每月 200 块钱计算。
当然实际上为了能够让他更好的工作可能会选择更好更昂贵的模型,或者多个模型协同工作以获得更完美的效果,这都非常合理但在这里我们先取一个下限(200元/月)。毕竟上限就难以计量了,我们甚至可以让他开多个子智能体进行同步工作。
它值吗?
这个价格乍一听不算低,但假设我们开发出了它的实际应用场景,对于现在的办公党,我觉得大部分人是愿意花钱购买的。毕竟日常为了办公买的各种会员也不算少。如果有一个能帮自己干活能够提升效率的工具,那可能是必须得买的,虽然他未必能够帮自己做得更好但如果是同事买了而自己没买,可能更容易凸显自己的效率低下。
无论是主动的还是被迫的,这件事情都是很容易卷起来的。
他能做点什么?
但能做的事情很多,但是在成本上未必划算。一方面我们需要用尽可能好的模型,一方面我们要花时间和精力去对它进行调教。
他能帮你敲一颗钉子,但如果成本是为他买一个专用的榔头,并且花半个小时教会他,这究竟值不值得呢?如果教会他之后他就能够自己去敲1万颗钉子那大概也是划算的吧,然而他使用的榔头又是易损耗材。
所以如果一件事情要重复许多次,可能还是写一个程序更加划算,当然也许我们可以让他去帮我们写这个程序。于是又回到了用 AI 写代码的命题,这和小龙虾又有多大关系呢?
当然有一些场景下确实用死板的程序很难处理,如果加入 AI 的灵活判断会获得更好的效果,但是小龙虾自身携带大量的上下文,导致 token 的消耗量巨大,直接让他去做这种事情肯定是不划算的,不如我们让他去调用一个具有很少上下文的子智能体来参与处理。忽然发现这和编程调用AI也没什么区别,所以就又转回来了。
显然,如果一件事情需要重复许多次,用编程的方法解决是性价比最高的。即便需要 AI 参与也是使用编程的方式进行调用。
反向思考
所以它更适合去处理的可能是,用到次数比较少的,比如偶尔接到一个临时的任务,可能只是做一次或者重复三五下,反正写一个程序肯定是不值当的,手动处理一下可能是在时间上最划算的方法。这种也许是最适合交给 AI 的。当然太复杂的他可能做不好,太简单的可能也不值得交给他,所以应该是一个难度适中的。
总结:偶发性,低重复,侧重主观,难度适中的任务。
所以实际上现在AI的应用场景还是比较狭窄的。好像在名词上这叫做 ANI。但是,如果放到工作场景中去思考,你会发现这样的任务有时候还是蛮多的:领导忽然交代你把那几份文件去处理一下……
总结上面两点
这就是我们常常觉得这些工具似乎能够提升效率,但是在真正使用的时候又常常无法提升效率。在某些单次的难度适中的任务上它确实能够提升效率,给我们惊喜。但是当你想将一个流程进行复用的时候,却又常常因为他的跑偏而陷入泥潭,也就是在用 AI 去处理本应该程序处理的流程。
又或者你交给他一个复杂的任务之后,发现自己教他去做这件事情的成本比自己去做这件事情的成本还高。任务难度没控制好,导致投入产出比失衡。
所以这里需要一个对任务的评估机制,来筛选出真正适合交给他去做的任务。这不合理,我们使用 AI 就是希望把任务丢给他然后不去思考,但是现在他还没有发展到这个程度所以我们只好……然而这种判断又是很困难的,对于不同的模型有不同的阀值,很难一概而论。
所以非常容易在调教过程中产生了过量的投入,而很难获得预期的产出。
而且每一次模型升级、工具迭代,我们都需要重新去适应,很难获得一个舒适的稳定态。
也就是说
它确实是生产力,但是目前场景非常狭窄,如果你的工作场景恰好对应了它的应用范围,那将会获得非常好的体验。否则在寻找适应调教的过程中很难把控投入产出比,以及获得稳定的效果。
但是问题不大
给他一点时间(也许两年?也许半年),让他再发展一下。当现代 AI 越接近 AGI 的时候,我们所能获得的体验就越符合预期了。
[!important] 为我家的小龙虾求点口粮
。°(°¯᷄◠¯᷅°)°。
Token 消耗量巨大,小龙虾要断粮了
希望大家留点猫粮 投喂小龙虾