sexta-feira, 23 de agosto de 2013

Saiba como o Captcha que você digita está colaborando com a digitalização de livros



O sistema usado para evitar fraudes nos downloads está ajudando na digitalizar obras mais antigas





O Captcha é um sistema criado para evitar fraudes em downloads, digitando palavras a ferramenta reconhece se você é um computador ou uma pessoa de fato. Aproximadamente 200 milhões de Captchas são resolvidos diariamente, cada pessoa leva 15 segundos para decifrar a palavra lançada. Individualmente, esse tempo é insignificante, mas somado chegam a mais de 150 mil horas de trabalho todos os dias.
E se esse esforço fosse pudesse ser utilizado em prol da cultura? Um dos criadores do Captcha, Luis Von Ahn, pensou em uma maneira de aproveitar a ferramenta na digitalização de livros.
Existe um processo automático que transforma obras para um formato digital, o Optical Character Recognition (OCR). O problema é que essa plataforma é falha e não compreende algumas palavras de livros antigos. É aí que o ReCaptcha entra.
As palavras que o sistema não entende são jogadas no Captcha e nós traduzimos para ele. E para saber que o que estamos escrevendo está correto, o OCR lança uma palavra que ele conhece. Acertando essa, o sistema automaticamente entende que você acertará a que ele não sabe. Dessa forma, os 200 milhões de ReCaptchas resolvidos em um dia ajudam a digitalizar 5 milhões de livros ao ano.
  



Nenhum comentário:

Postar um comentário

Obrigado pelo participação!