想体验编辑审稿的快乐吗，用AI办公吧

kmoui · 2024 年9 月 11 日 15:35

我们这小城市有一个小饭店，做菜特别好吃然后价格也便宜，所以总是很多人去之前基本上都得提前一天打电话定位置然后提前把菜点好。之前都是用手机拍那个照片刚才突然想整理成文字。

借助 AI 工具来整理菜单。先进行截图，再由豆包提取文字。

随后要求 AI 将提取出的内容进行逐行排版，并按照菜品金额进行排序。原本以为这是一个较为简单的问题，然而结果却出人意料。

豆包、kimi 和 Copilot 无法正确进行排序，经过多次反复询问也无法纠正问题。

阿里通义、腾讯元宝、智谱清言以及 GPT4o 能进行排序，但在第一次执行当中会丢失一道菜“鱼香肉丝”，在询问为什么丢失一道菜之后会纠正错误，需要两次提问，可以得到正确答案。

一次就执行成功的是，百度文心一言 4.0 turbo 和万知。

所有测试均在官方网页版进行，未调用开源模型或者 API。

就这么一个感觉非常简单不需要太智能的问题没想到还会出现纰漏，感觉如果真的用ai来进行办公或者文字处理的情况真的要认真去审核最后的文字，他没准真的会给你少写点什么或者多写点什么，不要那么相信他们。

附一下一部分菜单如果有兴趣的话可以自己测试一下

bugeshan · 2024 年9 月 12 日 03:17

试了一圈 SiliconFlow 的模型，只有两个可以正确排序: DeepSeek-V2.5 和 Meta-Llama-3.1-405B-Instruct。

Sharks · 2024 年9 月 12 日 16:09

测试了一下是提示词的原因。假如你给AI一个身份再让他干活，结果会好很多。直接问的话大概率得到的回答不太准确。

kmoui · 2024 年9 月 12 日 16:35

现在prompt对结果的引导性确实挺大的

xiaokonglong · 2024 年9 月 13 日 01:09

为啥排序这个事情, 我第一时间想到的是:

粘贴到excel, 然后排序.

ian_zhang · 2024 年9 月 13 日 01:22

Meta-Llama-3.1-405B-Instruct对中文的支持如何？

DavidJoy · 2024 年9 月 13 日 02:19

我也一直很奇怪，为什么 AI 从很早开始就被吹得那么神，实际使用却总是感到不尽如人意。

难道是因为咱们都太认真了？太较真了？当然我知道 Prompts 有一定的学问。

另外这个标题，审稿可真痛苦，我讨厌审稿，一点都不快乐，十分折磨。

kmoui · 2024 年9 月 13 日 02:37

我太同意你了，我讨厌审稿，也讨厌校稿，压力特别大

bugeshan · 2024 年9 月 13 日 08:23

那个太贵了（¥21/M），没具体用过

ian_zhang · 2024 年9 月 14 日 01:36

确实，我看了价格了，对了你给我的那个siliconflow链接我用了，也注册了。

话题		回复	浏览量
DeepSeek-R1 发布，MIT 授权，性能对标 OpenAI o1 正式版青蛙的分享	27	1117	2025 年1 月 27 日
请问怎样搭建一个本地的类似ChatGPT的服务，将自定义的知识库输入，以获得专业问答的效果？问题求助❓	16	1642	2024 年3 月 5 日
啥时候AI能出一个功能，找不到就说不知道而不是胡编啊……还有就是屏蔽过犹不及了讨论分享 ai	27	1628	2023 年7 月 15 日
大家是如何跟纯小白的亲朋好友科普AI的？讨论分享 ai	16	312	2025 年2 月 16 日
GPT-4o mini 发布：OpenAI 最便宜的小型模型，比 GPT-3.5 便宜，比 GPT-4 优秀青蛙的应用	9	584	2024 年7 月 27 日