想体验编辑审稿的快乐吗,用AI办公吧

我们这小城市有一个小饭店,做菜特别好吃然后价格也便宜,所以总是很多人去之前基本上都得提前一天打电话定位置然后提前把菜点好。之前都是用手机拍那个照片刚才突然想整理成文字。

借助 AI 工具来整理菜单。先进行截图,再由豆包提取文字。

随后要求 AI 将提取出的内容进行逐行排版,并按照菜品金额进行排序。原本以为这是一个较为简单的问题,然而结果却出人意料。

豆包、kimi 和 Copilot 无法正确进行排序,经过多次反复询问也无法纠正问题。

阿里通义、腾讯元宝、智谱清言以及 GPT4o 能进行排序,但在第一次执行当中会丢失一道菜“鱼香肉丝”,在询问为什么丢失一道菜之后会纠正错误,需要两次提问,可以得到正确答案。

一次就执行成功的是,百度文心一言 4.0 turbo 和万知。

所有测试均在官方网页版进行,未调用开源模型或者 API。

就这么一个感觉非常简单不需要太智能的问题没想到还会出现纰漏,感觉如果真的用ai来进行办公或者文字处理的情况真的要认真去审核最后的文字,他没准真的会给你少写点什么或者多写点什么,不要那么相信他们。

附一下一部分菜单如果有兴趣的话可以自己测试一下

  1. 肉炒素鸡 20元
  2. 烧芸豆 24元
  3. 溜肝尖 28元
  4. 辣子鸡丁 28元
  5. 溜鸡丁 28元
  6. 鱼香肉丝 30元
  7. 京酱肉丝 32元
  8. 木须肉 32元
  9. 滑溜里脊 35元
  10. 过油肉 35元
  11. 溜肉丁 35元
  12. 干炸肉段 38元
  13. 樱桃肉 38元
  14. 焦溜肉段 38元
  15. 清炒肉 40元
  16. 炸牛肉串 40元
  17. 锅包肉 40元
  18. 溜三样 40元
  19. 溜白肚 48元
  20. 溜肠肚 48元
  21. 溜肥肠 48元
  22. 红烧排骨 55元
  23. 糖醋排骨 58元

试了一圈 SiliconFlow 的模型,只有两个可以正确排序: DeepSeek-V2.5Meta-Llama-3.1-405B-Instruct

测试了一下是提示词的原因。假如你给AI一个身份再让他干活,结果会好很多。直接问的话大概率得到的回答不太准确。

现在prompt对结果的引导性确实挺大的

为啥排序这个事情, 我第一时间想到的是:

粘贴到excel, 然后排序. :rofl:

Meta-Llama-3.1-405B-Instruct对中文的支持如何?

我也一直很奇怪,为什么 AI 从很早开始就被吹得那么神,实际使用却总是感到不尽如人意。

难道是因为咱们都太认真了?太较真了?当然我知道 Prompts 有一定的学问。

另外这个标题,审稿可真痛苦,我讨厌审稿,一点都不快乐,十分折磨。

我太同意你了,我讨厌审稿,也讨厌校稿,压力特别大

那个太贵了(¥21/M),没具体用过 :wl:

确实,我看了价格了,对了你给我的那个siliconflow链接我用了,也注册了。

1 个赞