reCAPTCHA 计划是由卡内基梅隆大学所发展的系统,主要目的是利用CAPTCHA技术来帮助典籍数位化的进行,这个计划将由书本扫描下来无法准确的被光学文字辨识技术识别的文字显示在CAPTCHA问题中,让人类在回答CAPTCHA问题时用人脑加以识别。reCAPTCHA正数位化纽约时报的扫描存档,目前已经完成20年份的资料,并希望在2010年完成110年份的资料。
为了验证人类所输入的文字是正确的,而不是随意输入,有两个字会被显示出来;一个是光学文字辨识软体无法辨别的字,另一个是一个已经知道正确答案的 字。如果使用者正确的回答出已知正确答案的字,那么就假设所输入的另一个光学辨识软体无法辨识的字是认真的检视后被输入而非随便输入
reCAPTCHA 问题的所需的文字图片,首先会由 reCAPTCHA 计划网站利用 Javascript API 取得, 在终端使用者回答问题后,伺服器再连回 reCAPTCHA 计划的主机验证使用者的输入是否正确。 reCAPTCHA 计划提供了许多程式语言的函式库,让整合 reCAPTCHA 服务到现有程式的过程可以轻松些。除非有较大的频宽需求,否则 reCAPTCHA 原则上是一个免费的服务。