没人用Claude吗?

只看排行的话 Claude 3 Opus 更靠前

现在多了 claude-3-haiku-20240307

另外,Gemini 1.5 Pro 最近也开放了,之前需要申请

https://aistudio.google.com/app/prompts/new_chat

Gemini 1.5 Pro 介绍
https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024

别说看排行没有意义,就是讨论我们不会用甚至不常用的都没太大意义。
对普通用户而言,需求是在能用之中挑选一个最可靠的。

之所以提排行是因为和我个人的体验还挺符合,当然影响影响因素有很多

方便提供下这 3 个问题吗,我也试试

我记得官方 gpt3.5 好像会修正回答,一些经典问题问的人多,也会被修正

我是用的Poe测试,他家集成方便。

校验 ChatGPT 4.0 真实性的三个经典问题:快速区分 GPT3.5 与 GPT4,并提供免费测试网站,我是用中文测试的。

GPT3.5还会修正?不是早不更新了?至少这3个回答没变过。

刚刚试的,都是在默认参数下

官方 gpt3.5

claude-3-sonnet-20240229

claude-3-opus-20240229

claude-3-haiku-20240307

Gemini 1.5 Pro

我这的 gpt3.5 的回答中,中文提问 昨天的当天是明天的什么? 以及英文提问 There are 9 birds in the tree, the hunter shoots one, how many birds are left in the tree? ,这两个问题被完全修正了,可能是点踩的反馈按钮起作用了


Poe 的也试了下, Poe 的 Claude-3-Opus 需要订阅没有测试

先看官方ChatGPT的回答,和你相比第一题差异巨大,第二题一样,第三题表达意思差不多:


Poe的ChatGPT和GPT3.5和上述回答差不多,不截图了。

Claude官方账号被封了,试了下Poe里面的,和你差不多,不是废话就是错的。

Poe的Gemini Pro,第二题(你的第一题)解释差异大,第三题你的更精确,估计是1.5版本修复过了。

官方的 gpt3.5 ,新建聊天后,前两个问题多问几次能答对,也可能答错,鲁迅那个问了 10 次左右都没答对

本来想再去试下 Poe 的,结果现在 Poe 连 gpt3.5 都限制次数了,果然还是先引流再收割的套路

又体验了下 Claude-3-Opus,感觉在编程方面能和 gpt4 打了

个人主观体验目前 Claude 最强的是 Opus

这个可用性就存在很大问题了,我不可能一个问题多次问,太没效率了,还不如自己搜索算了。

本来是设置中可以看到剩余可用数,现在看不到了,你是在哪里看的?

你是在官方平台充钱用的?

image_10

上面提到的 lmsys

如果想测试 ai 编程能力,也可以去 LeetCode 试试困难题


论坛提示推荐私聊,还是私聊吧

这个查看方法太不直观了,点了几个,发现Claude还真是贵。

lmsys很适合用来比较,聊天界面还不如官方或者poe的。