Seguidores

quinta-feira, agosto 23, 2012

Das ideias super boas da humanidade: o reCAPTCHA

0


Captcha, pra quem não sabe, é o nome convencionado daquelas letras super esquisitas que você precisa digitar pela internet antes de clicar em um botão de ‘enviar’ e servem para provar para o sistema que você uma pessoa e não um robô. São tempos estranhos esse em que vivemos, quando se torna necessário digitar letrinhas pra provar que não somos robôs e, pior ainda, quando a gente não consegue ler a merda das letras e, portanto, pro sistema em questão somos indistinguíveis de um robô.

Quando eu falo “robô” aqui, acho que é necessário explicar para alguns usuários que estamos falando de softwares conhecidos como “bots”, e não de robôs de lata e circuitos tipo o Homem Bicentenário (infelizmente, já que esse é um grande personagem de Robin Williams). Só para ficar claro.

O sistema de Captcha mais famoso chama reCAPTCHA e – ADIVINHA! – é do Google. É gratuito e é só botar o código no seu software e o computador ligado à internet será capaz de verificar se está diante de um homem ou uma máquina. O que sempre me intrigou é que frequentemente esses Captchas do Google vêm com imagens realmente ilegíveis. Por “ilegíveis”, entenda algo na linha “eu não preciso usar óculos e mesmo assim não faço ideia do que está escrito aqui’. Além da clara falta de praticidade de um sistema assim, o mais perturbador é pensar que se aquelas letrinhas estão ali, em um campo de verificação, o sistema precisa saber de verdade o que está escrito, claro, pra checar se você acertou. E se alguém foi capaz de ler uma palavra toda cagada e você não, bom, você começa a se questionar sobre a possibilidade de você ser, de fato, um robô.

Felizmente, eu descobri esse temor como sendo infundado depois de entrar no site do reCAPTCHA e ler como a parada funciona. E quer saber? Como quase tudo do Google, com exceção talvez do Google+ e do Google Nexus, há de ser parabenizado pela sua engenhosidade.

O reCAPTCHA atende a dois propósitos: além de servir como um eficiente repelente para robôs malandros que estejam tentando usar o computador dos humanos da casa na ausência dos últimos HEH, ele serve como uma ferramenta gratuita de "crowdsourcing", que ajuda na digitalização de manuscritos antigos. Isso explica outra coisa que me intrigava no ReCaptcha: eu era frequentemente confrontada com palavras que conhecia, em português ou outras línguas. Outros Captchas costumam exibir caracteres randômicos.

O método empregado pelo reCAPTCHA é simples, simples: ele exibe duas palavras escaneadas de livros e jornais antigos. O servidor conhece o significado de apenas uma delas – que é de fácil leitura e, portanto, o computador foi capaz de ler corretamente. Se você acertar essa, ele vai assumir que aquilo que você identificou na outra palavra da dupla está correto, e então usa seu conhecimento de ser humano para digitalizar literatura que já é patrimônio da humanidade. E o melhor: não é necessário pagar ninguém. É assim que o Google coloca a disposição dos usuários aquele monte de coisas no Google Books, ou edições antigas do New York Times. E também explica algumas palavras incompreensíveis – nem o software sabe a resposta pra elas. Ele vai simplesmente tomar o que você disse como verdadeiro!

Com o esforço de milhões de usuários que usam o reCAPTCHA diariamente em um monte de atividades corriqueiras na rede, são 200 milhões de palavras decifradas por dia – se cada usuário levar 10 segundos por palavra, o Google então se beneficia de 150 mil horas diárias de trabalho gratuito. Nada mal pra um monte de gente que precisa provar que não é um robô.

No Response to "Das ideias super boas da humanidade: o reCAPTCHA"

Postar um comentário