尝试用Gemini识别115的汉字验证码,但各个模型都不准确。
是提示词不对吗?
“识别包含汉字的图片验证码。这些汉字可能被扭曲、变形、部分遮挡。图片的上部是4个需要找出的目标汉字,变形不严重但有遮挡。下部是10个变形扭曲、空间错位的汉字(不需要告诉我这些汉字具体是什么),你的任务是从这10个汉字中找到4个目标汉字的位置。位置编号为1-10。所以你只需要返回4个不重复的数值(比如3219)就完成了验证”
尝试用Gemini识别115的汉字验证码,但各个模型都不准确。
是提示词不对吗?
“识别包含汉字的图片验证码。这些汉字可能被扭曲、变形、部分遮挡。图片的上部是4个需要找出的目标汉字,变形不严重但有遮挡。下部是10个变形扭曲、空间错位的汉字(不需要告诉我这些汉字具体是什么),你的任务是从这10个汉字中找到4个目标汉字的位置。位置编号为1-10。所以你只需要返回4个不重复的数值(比如3219)就完成了验证”
豆包:
图中提取出的文字如下:
上方文字:易 如 性 界
下方文字依次为:芥 东 如 负 性 壑 谷 亩 矩 易
这不是文字提取能解决的。
目前最好的回复是:
图片中给出的验证码包含汉字识别任务。你需要从下方的10个扭曲汉字中找出与上方4个目标汉字相同的字符,并返回它们在下方汉字中的位置编号。
目标汉字从左到右依次是:
1. **易** (yì)
2. **如** (rú)
3. **性** (xìng)
4. **界** (jiè)
现在观察下方10个汉字,并尝试找出与目标汉字相同的字符:
* **位置 1:** 字符的结构和笔画与 **界** (jiè) 非常相似。
* **位置 2:** 字符的结构和笔画与 **易** (yì) 比较接近,虽然变形但轮廓可辨认。
* **位置 3:** 这个字符看起来与目标汉字不太像。
* **位置 4:** 字符的结构和笔画与 **如** (rú) 比较接近,尤其是女字旁和口字部分。
* **位置 5:** 这个字符看起来与目标汉字不太像。
* **位置 6:** 字符的结构和笔画与 **性** (xìng) 比较接近,尤其是竖心旁和右边部分。
* **位置 7:** 这个字符看起来与目标汉字不太像。
* **位置 8:** 这个字符看起来与目标汉字不太像。
* **位置 9:** 这个字符看起来与目标汉字不太像。
* **位置 10:** 这个字符看起来与目标汉字不太像。
根据视觉判断,下方汉字的位置 1, 2, 4, 和 6 分别与目标汉字 **界**, **易**, **如**, **性** 相似。
因此,答案是 **1246**。
文字提取是前提啊.
这不是前提能解决的。
找出与上面4个汉字相似的文字, 以序号表示. 比如 下面第一行第一个为A1, 第二行第5个为B5.
分享
根据要求,与 “易 如 性 界” 相似的文字如下:
智谱清言:
根据图片中的信息,我们可以看到上面的四个汉字是“易如性界”。
现在我们需要在下面的选项中找到与这四个汉字相同的文字。
首先看第一行的选项:
A1: 界
A2: 东
A3: 奶
A4: 负
A5: 性
其中,界”和性”与上面的汉字相同。
然后看第二行的选项:
B1: 塞
B2: 谷
B3: 方
B4: 知
B5: 易
其中,易”与上面的汉字相同。
所以,与上面四个汉字相同的文字分别是:A1、A5 和 B5。
优化提示要求后. 豆包基本就可以了:
找出与上面4个汉字相似的文字, 以序号表示. 比如 下面第一行第一个为A1, 第二行第5个为B5. 必须且只能找出4个
分享
但是智谱清言选择了 东 为相似字.