我又来测试大模型了，这次数数

Qingwa · 2026 年1 月 3 日 04:57

是这样的，这个页面是三所香港大学联合发布的公共图书馆，有50来本书，使用 CC-BY-NC-ND 4.0 授权

然后我就找大模型数了下具体数量，结果有点惨不忍睹。

1. ChatGPT

kat · 2026 年1 月 3 日 05:21

Claude 4.5

所以正确答案是多少本？

Qingwa · 2026 年1 月 3 日 05:48

我人肉数的只有 Gemini 和我一样，但我也不知道对不对。

Xclo · 2026 年1 月 3 日 06:06

每个回答都不一样啊

rcdfrd · 2026 年1 月 3 日 08:20

aistudio

dms · 2026 年1 月 3 日 09:56

为什么要数？直接在页面中搜索 “購買實體書”就可以了。

然后数据不准确，可能是因为抓取方式的不同。所以这点不太能够直观的去评判大模型的能力。

skystar · 2026 年1 月 3 日 11:44

千文是什么？ @Qingwa

Qingwa · 2026 年1 月 3 日 12:11

问

dawn · 2026 年1 月 3 日 15:19

我觉得哪怕千八百次的个例测试也是没意义的
挑几个顺眼的，平时都用就是了

HillJian · 2026 年1 月 4 日 00:47

Gemini还是不错

usnake · 2026 年1 月 6 日 04:48

54本，是瞧不起咱z-library吗

dangerace · 2026 年1 月 8 日 03:13

目前所有AI都只能在不太精确的文字领域堪堪一用，在需要精确的数字统计和分析领域，就是一坨屎。

话题		回复	浏览量
关于论坛首页的样式讨论分享	9	2733	2019 年3 月 12 日
我们开发的一款任务管理应用，可以用【不同以往的方式管理任务】，欢迎讨论发现频道	1	1647	2023 年3 月 22 日
【小程序自荐】灵犀汉语词典发现频道	0	2521	2020 年5 月 22 日
声笔 - 独特句式连续感的顶功打字方案讨论分享	9	1714	2023 年9 月 11 日
一个可以帮助你在快速切换默认搜索引擎的扩展，同时还是不追踪你的搜索引擎发现频道	0	834	2022 年12 月 6 日