2010-07-22 36 views
24

我对reCAPTCHA的工作原理有点困惑。我已经使用ROR实施了它 。reCAPTCHA接受两个字中的一个字

有时即使我只指定了两个字中的一个,它仍会返回true ,而有时它会失败。

我真的很困惑,不能理解 reCAPTCHA的行为。

回答

17

只有一个recaptcha单词被系统“知道” - 它依靠用户执行验证码来告诉系统其他单词是什么,因为它不是机器可读的。

这就是recaptcha的“要点”,或者是附加的好处 - 它不仅仅是进行人类测试,它还是大规模的集体采购翻译,其中自动OCR失败。

2

Recaptcha使用两个单词,其中一个是已知的,一个是未知的(未知单词是程序试图帮助解密的单词 - 它可能是扫描出旧书或某处的某个地方!)。所以真的,所有服务都在寻找是已知单词的正确答案。如果这是你所说的话,即使你没有为这个未知的单词输入任何东西,它也会成功。如果你放入另一个单词(未知单词),它会失败。

15

Recaptcha显示两个单词。计算机扫描仪扫描和识别的一个以及计算机扫描仪无法识别的一个。 Recaptcha会检查它知道答案的单词并保存未知单词的答复。对未知单词的这些反应进行编译和分析,以便它基本上被人类而不是计算机扫描仪“解决”。

这里有更多的信息,在他们自己的话说:

“但是,如果计算机无法读取这样的CAPTCHA,系统怎样知道正确答案的谜题方法如下:?每一个新词,不能通过OCR正确读取的信息会被提供给用户,并与另一个已知答案的单词一起使用,然后要求用户阅读这两个单词,如果他们解决了答案已知的问题,系统会假设他们的答案对于新的系统是正确的,然后系统给其他人一个新的图像,以更高的置信度确定原始答案是否正确。“

源 - http://www.google.com/recaptcha/learnmore

+0

您确定其中一个单词被扫描仪识别吗?难道它不能使用以前用户解决的一个词吗? – Greg 2010-07-22 14:38:14

+1

是的。它确实使用了以前用户解决的单词。一个字是扫描仪可以读取的字,另一个字是扫描仪无法读取的字。扫描仪不读取的数据由多个用户解决。这就建立了一个关于什么是正确的单词的共识(因此,“解决”未知单词不仅仅取决于1个答案。) 我在上面的答案中添加了有关页面的关于recaptcha的链接。 – programatique 2010-07-22 14:57:35

1

我认为这是验证码的主要观点。它可以帮助开发人员在人类和机器人之间进行区别,并且还可以帮助数字化图书。

总是有两个词。一个更容易阅读。如果你能读懂这个词,那很好,你是人类。

第二个词是来自书本的扫描,其中自动OCR(识别)对这个词不确定。因此,用户正在帮助阅读这个词,以便书籍可以更好地数字化。

+0

实际上两者都是扫描,但其中一个已经被N个用户识别。一旦这个阈值数字已经识别出第二个单词,它将被添加到已知的单词中。 – 2010-07-22 14:33:27

相关问题