O CAPTCHA foi “quebrado”?

Um recente artigo do Wall Street Journal descreve Os problemas da Ticketmaster com os cambistas on-line:

A era da Internet trouxe velocidade e conveniência para todos os tipos de transações de consumo. Para os frequentadores de shows, no entanto, ela também levou a esgotamentos cada vez mais rápidos de eventos importantes. A Ticketmaster utiliza uma tecnologia que supostamente impede que os corretores tenham acesso a um grande número de assentos por meio de vendas on-line. Mas a Ticketmaster afirma que o software dos corretores burla as proteções da empresa.

Isso colocou um grande número de assentos nas mãos de corretores que usam o StubHub do eBay Inc., o Craigslist e outros locais on-line para revender os ingressos com uma grande margem de lucro.

Uma situação que está agitando os consumidores envolve a turnê “Best of Both Worlds”, com 54 shows, na qual a cantora e atriz Miley Cyrus está se apresentando como ela mesma e como seu alter ego fictício, Hannah Montana. Pais e filhos têm achado difícil e caro encontrar ingressos para os shows. O problema está chamando a atenção das autoridades governamentais. Na quinta-feira – em um raro exemplo da era da Internet de autoridades aplicando leis anti-fiscalização – os procuradores-gerais de Missouri e Arkansas entraram com processos contra pessoas acusadas de revender ilegalmente ingressos para Hannah Montana.

De acordo com a StubHub, os ingressos para a turnê “Best of Both Worlds” estão sendo vendidos atualmente por uma média de US$ 237, o que os torna mais caros do que os ingressos para o Police (US$ 209), Justin Timberlake (US$ 182) e Beyonc (US$ 212). O valor de face mais alto para um ingresso da turnê de Hannah Montana: US$ 63.

Eles devem ter realmente irritou alguns pais políticos de alto escalão para conseguir esse tipo de atenção. Não que eles não mereçam – os cambistas são malvados e aproveitadores, com certeza. Eles merecem toda a dor que pudermos enviar para eles.

A “tecnologia que supostamente impede os corretores” a que eles estão se referindo é CAPTCHA.

Por exemplo, empresas como a Ticketmaster exigem que os clientes que procuram ingressos on-line reproduzam um conjunto de letras e números ondulados, conhecido como “Captcha”. Teoricamente, apenas os clientes humanos podem identificar corretamente os caracteres, apesar das fontes estranhas, o que exclui os programas de compra automatizados. Mas o software da RMG, de acordo com o Sr. Kovach, também pode “descobrir os caracteres gerados aleatoriamente e redigitá-los automaticamente”. O Sr. Kovach disse que os funcionários da RMG também lhe deram conselhos sobre como enganar os computadores da Ticketmaster, fazendo-os pensar que suas solicitações vinham de endereços diferentes da Internet. Nem o Sr. Kovach nem seu advogado puderam ser contatados para comentar o assunto.

Então, se os cambistas on-line estão de alguma forma burlando o sistema, isso significa que o CAPTCHA foi quebrado? I abordei esse tópico há um anoe minha opinião não mudou. Se os CAPTCHAs estivessem realmente quebrados, o Google, o Yahoo e o Hotmail parariam de usá-los. Por que eles continuariam a usar algo que não funciona? Não vou repetir todos os argumentos aqui, mas se o senhor tem sentimentos fortes sobre esse assunto, não se preocupe, recomendo que o senhor leia minha postagem anterior antes de comentar.

O problema da Ticketmaster é que seu CAPTCHA é não é bom o suficiente. Os programadores parecem não entender o que torna um CAPTCHA difícil de “quebrar”. Mas não é difícil descobrir. Os próprios hackers vão contar como fazer o CAPTCHA corretamente se o senhor souber onde procurar. Por exemplo, a página desse hacker chinês detalha uma série de CAPTCHAs comunse o preço do software que ele vende para derrotá-los com uma determinada porcentagem de sucesso:

Parece que muitos programadores aderem à escola de design de CAPTCHA do tipo “adicione alguns padrões e/ou cores malucos ao texto e reze para que tudo dê certo”. Isso não é apenas desleixado, mas simplesmente não funciona. A parte superior deste gráfico está repleta de tentativas fracassadas. Em alguns sites, isso não tem problema. Eles não precisam do mesmo nível de proteção de classe mundial contra bots e scripts que a Ticketmaster precisa – há um enorme incentivo financeiro para os cambistas quebrarem o sistema deles.

Esse hacker em particular estima uma taxa de sucesso de 50% contra o captcha da Ticketmaster, muito antes de o artigo acima ser publicado. Não é de se admirar que esses pais não tenham conseguido comprar ingressos para Hannah Montana para seus filhos… não é por causa de falhas na proteção do CAPTCHA, é porque os programadores da Ticketmaster não conseguiram implementar o CAPTCHA corretamente.

Em vez de criar seu próprio sistema parcialmente eficaz (e muitas vezes nem mesmo solucionáveis por humanos) CAPTCHA, o que os programadores da Ticketmaster deveriam ter feito foi estudar a técnica anterior – em particular, copiando os CAPTCHAs do Yahoo, do Google e do Hotmail, que são amplamente pesquisados e de grande volume. Gosto muito da técnica de CAPTCHA do Google; em minha opinião profissional, ela é ao mesmo tempo a mais legível e a mais infernalmente difícil de fazer OCR corretamente. Se o senhor precisar de proteção de força industrial contra bots e scripts, esse é o por onde o senhor quer começar.