AI识别汉字验证码

尝试用Gemini识别115的汉字验证码,但各个模型都不准确。

是提示词不对吗?

“识别包含汉字的图片验证码。这些汉字可能被扭曲、变形、部分遮挡。图片的上部是4个需要找出的目标汉字,变形不严重但有遮挡。下部是10个变形扭曲、空间错位的汉字(不需要告诉我这些汉字具体是什么),你的任务是从这10个汉字中找到4个目标汉字的位置。位置编号为1-10。所以你只需要返回4个不重复的数值(比如3219)就完成了验证”

豆包:

图中提取出的文字如下:
上方文字:易 如 性 界
下方文字依次为:芥 东 如 负 性 壑 谷 亩 矩 易

这不是文字提取能解决的。
目前最好的回复是:

图片中给出的验证码包含汉字识别任务。你需要从下方的10个扭曲汉字中找出与上方4个目标汉字相同的字符,并返回它们在下方汉字中的位置编号。

						目标汉字从左到右依次是:
						1. **易** (yì)
						2. **如** (rú)
						3. **性** (xìng)
						4. **界** (jiè)
						
						现在观察下方10个汉字,并尝试找出与目标汉字相同的字符:
						
						* **位置 1:**  字符的结构和笔画与 **界** (jiè)  非常相似。
						* **位置 2:**  字符的结构和笔画与 **易** (yì)  比较接近,虽然变形但轮廓可辨认。
						* **位置 3:**  这个字符看起来与目标汉字不太像。
						* **位置 4:**  字符的结构和笔画与 **如** (rú)  比较接近,尤其是女字旁和口字部分。
						* **位置 5:**  这个字符看起来与目标汉字不太像。
						* **位置 6:**  字符的结构和笔画与 **性** (xìng)  比较接近,尤其是竖心旁和右边部分。
						* **位置 7:**  这个字符看起来与目标汉字不太像。
						* **位置 8:**  这个字符看起来与目标汉字不太像。
						* **位置 9:**  这个字符看起来与目标汉字不太像。
						* **位置 10:** 这个字符看起来与目标汉字不太像。
						
						
						根据视觉判断,下方汉字的位置 1, 2, 4, 和 6  分别与目标汉字 **界**, **易**, **如**, **性** 相似。
						
						因此,答案是 **1246**。

文字提取是前提啊.

这不是前提能解决的。

找出与上面4个汉字相似的文字, 以序号表示. 比如 下面第一行第一个为A1, 第二行第5个为B5.

分享

根据要求,与 “易 如 性 界” 相似的文字如下:

  • “易”:B5(下方第二行第五个)
  • “如”:A3(下方第一行第三个)
  • “性”:A5(下方第一行第五个)
  • “界”:无相似匹配 。

智谱清言:

根据图片中的信息,我们可以看到上面的四个汉字是“易如性界”。
现在我们需要在下面的选项中找到与这四个汉字相同的文字。
首先看第一行的选项:
A1: 界
A2: 东
A3: 奶
A4: 负
A5: 性
其中,界”和性”与上面的汉字相同。
然后看第二行的选项:
B1: 塞
B2: 谷
B3: 方
B4: 知
B5: 易
其中,易”与上面的汉字相同。
所以,与上面四个汉字相同的文字分别是:A1、A5 和 B5。

优化提示要求后. 豆包基本就可以了:

找出与上面4个汉字相似的文字, 以序号表示. 比如 下面第一行第一个为A1, 第二行第5个为B5. 必须且只能找出4个

分享

  • “易”:B5(下方第二行第五个)
  • “如”:A3(下方第一行第三个)
  • “性”:A5(下方第一行第五个)
  • “界” 暂无可完全相似的字,较接近的可算 B1(下方第二行第一个 “壑” 的上半部分类似 “界” 上半部分 ) 。

但是智谱清言选择了 东 为相似字.