Captcha e o poder da colaboração na Internet

Captcha capa

Os Captchas, aquelas letrinhas riscadas e entortadas muito comuns em formulários, são praticamente onipresentes na internet. Ao tentarmos fazer qualquer cadastro ou login em praticamente qualquer serviço na Internet (Facebook,Gmail) nos deparamos com as irritantes e famigeradas letrinhas e por vezes me vejo desacreditado se realmente não sou um robô. Isso pois é justamente esta a finalidade dos Captchas, identificar se o usuário não é na realidade um software ou seja um robô.

 

Captcha Hard

 

Mas qual é a finalidade de se evitar o uso de robôs? Imaginemos que exista um formulário de cadastro para se concorrer a um prêmio qualquer, alguém poderia escrever um software que fizesse milhões de cadastros para aumentar as chances de conquista do prêmio. Ou mesmo a compra de um ticket de um show, um cambista poderia utilizar um robô (software) que faria inúmeras compras de ticket para revendê-las posteriormente. Desta forma, visando impedir (ou dificultar) esta prática surgiu a ideia do Captcha. O conceito é questionar o usuário com algo de simples resolução para um humano mas incrivelmente difícil para um robô (veremos mais a frente que já não é tão difícil assim). A forma mais amplamente utilizada são as já mencionadas letras distorcidas.

 

Captcha Robot

 

Inicialmente o Captcha foi um sucesso com números impressionantes: de acordo com seu próprio criador, Luis von Ahn, aproximadamente 200 milhões de Captchas eram digitados todos os DIAS. Levando-se em conta que se gasta aproximadamente 10 segundo para sua digitação chegamos a incríveis 500.000 horas diárias perdidas pelos internautas apenas digitando Captchas.

Percebendo o incrível trabalho humano que estava sendo desperdiçado, foi criado o reCaptcha (empresa que posteriormente foi adquirida pelo Google) com a ideia de se aproveitar todo este desperdício de trabalho.

E como então o reCaptcha pôde tornar algo tão improdutivo em algo útil?

Basicamente de duas formas:
Há diversos projetos em curso de digitalização de livros. Ao escanear estes livros, inicialmente é obtida a imagem da página e posteriormente é rodado um segundo processo que é o OCR (Reconhecimento óptico de caracteres, da sigla em inglês) para que se faça o reconhecimento das palavras desta imagem digitalizada com a finalidade de se obter o texto final do livro. Ocorre que este processo não é perfeito, nem todas as palavras podem ser reconhecidas por inúmeros motivos, livros antigos com páginas desgastadas é um deles. Neste cenário é que nos utilizamos do trabalho gratuito feito por milhões de internautas pelo mundo.

No reCapthca são exibidas duas palavras ao invés de uma. Uma destas palavras é conhecida pelo software e é realmente uma prova para testar se o usuário não é um robô enquanto a outra é uma palavra que não foi reconhecida pelo OCR no processo de escaneamento. Ao digitar corretamente a palavra teste, o software considera que você também digitou corretamente a outra palavra que se pretende identificar. Para prover maior precisão ao processo de reconhecimento, a mesma palavra é testada em mais 10 oportunidades por outros usuários, se a maioria digitou a palavra igual, esta é considerada reconhecida.
Segundo levantamento do mesmo Luis Von Ahn, 100 milhões de palavras são reconhecidas diariamente possibilitando a digitalização de aproximadamente 2,5 milhões de livros por ano!! Ou seja, estamos trabalhando de graça para o Google (quero minhas ações) mas por uma boa causa (?).

A outra forma é bem semelhante a já comentada mas diz respeito ao serviço Google Street View. Alguns números de imóveis não podem ser reconhecidos pelos algoritmos do Google, desta forma, os usuários reconhecem estes números antes inteligíveis para o Street View…de graça.

Os Captchas (e os reCaptchas) gradativamente vêm sendo substituídos na Internet por um outro serviço chamado noCaptcha após ser constatado, pelo próprio Google (detentor da empresa reCapthca), que há algoritmos que possibilitam a um robô passar no teste em 99,8% das vezes.

É incrível ao visualizarmos os números percebermos o tamanho e o valor do trabalho distribuído na Internet, anos de trabalho mecânico e computacional desperdiçados podem ser reaproveitados com uma boa ideia. Inúmeras outras necessidades poderiam ser atendidas por este poder laboral imenso. Alguns, adeptos de teorias da conspiração, dizem que os reCaptchas estão servindo para alimentar a inteligência Artificial que ira dizimar a humanidade. Existem tantas coisas que irão dizimar a humanidade ultimamente que esta deve ser uma das últimas da fila, atrás talvez do apocalipse zumbi!

Fonte: Ted

Comentários

Comentários

Be the first to comment

Leave a comment

Your email address will not be published.


*