Não pergunte – observe

James Surowiecki, autor de The Wisdom of Crowds (A sabedoria das multidões), escreve sobre o paradoxo da complexidade e da escolha do consumidor em uma coluna recente da New Yorker:

Um estudo recente realizado por um trio de acadêmicos de marketing descobriu que, quando os consumidores podiam escolher entre três modelos, de complexidade variável, de um dispositivo digital, mais de sessenta por cento escolhiam o que tinha mais recursos. Depois, quando os sujeitos tiveram a chance de personalizar o produto, escolhendo entre 25 recursos, eles se comportaram como crianças em uma loja de doces. (Vinte recursos foi a média). Porém, quando lhes foi solicitado que usassem o dispositivo digital, surgiu a chamada “fadiga de recursos”. Eles ficaram frustrados com a infinidade de opções que haviam criado e acabaram ficando mais felizes com um produto mais simples.

É impossível perceber que o senhor está criando um monstro de frankenstein de um produto – até que tente usá-lo. É o que eu chamo de o problema do bufê à vontade. Há tanta comida deliciosa para escolher no bufê, e o senhor está com muita fome. Naturalmente, o senhor enche o prato com muita vontade. Mas depois de sentar-se à mesa, o senhor percebe tardiamente que não há como o senhor comer toda essa comida.

Com toda a justiça, às vezes as pessoas querem, de fato, complexidade. O recém-redesenhada página inicial do Google Coreia é intencionalmente complexa. Marissa Mayer, do Google, observou “Foi importante nos casos em que nosso minimalismo clássico não estava funcionando que nos adaptássemos.”

Nova página inicial do Google para a Coreia, 2007

Isso ecoa uma post anterior do blog de Donald Norman descrevendo a maneira como os sul-coreanos buscam a complexidade em artigos de luxo:

Recentemente, visitei uma loja de departamentos na Coreia do Sul. Visitar lojas de departamentos e mercados locais é um dos meus passatempos favoritos sempre que visito um país novo para mim, para conhecer melhor a cultura local. Os alimentos são diferentes, as roupas são diferentes e, no passado, os eletrodomésticos eram diferentes: eletrodomésticos, utensílios de cozinha, ferramentas de jardinagem e ferramentas de loja.

Achei os tradicionais “produtos da linha branca” mais interessantes: Geladeiras e máquinas de lavar. A loja obviamente tinha as empresas coreanas LG e Samsung, mas também GE, Braun e Philips. Os produtos coreanos pareciam mais complexos do que os não coreanos, embora as especificações e os preços fossem essencialmente idênticos. “Por quê?” Perguntei aos meus dois guias, ambos profissionais de usabilidade. “Porque os coreanos gostam que as coisas pareçam complexas”, responderam eles. É um símbolo: mostra seu status.

O que é particularmente revelador no estudo que Surowiecki cita é a desconexão entre o que as pessoas dizem eles querem e o que eles na verdade querem. O senhor encontrará esse tema repetido várias vezes nos círculos de usabilidade: o que os usuários dizem que farão e o que eles realmente fazem são, muitas vezes, duas coisas muito diferentes. É por isso que perguntar aos usuários o que eles querem é quase inútil do ponto de vista da usabilidade; o senhor precisa observar o que os usuários realmente fazem. É isso que o teste de usabilidade é. Em vez de perguntar aos consumidores quais recursos eles queriam em uma câmera digital, o estudo deveria ter apresentado a eles alguns protótipos de câmeras digitais e depois observado como eles eram usados. O sucesso ou o fracasso dos consumidores ao interagir com os protótipos nos diz mais do que mil pesquisas, questionários ou grupos de foco poderiam dizer. Infelizmente, a criação de protótipos físicos de câmeras digitais é proibitivamente cara, portanto, isso não acontece.

Software de prototipagem, que é construído a partir de puro material de pensamentoé uma proposta muito mais fácil. Dare Obasanjo indicou recentemente um excelente artigo, Guia prático para experimentos controlados na Web (pdf), que defende fortemente a realização frequente de testes de usabilidade A/B observacionais:

Greg Linden, da Amazon, criou um protótipo para mostrar recomendações personalizadas com base nos itens de um carrinho de compras. O senhor adiciona um item e as recomendações aparecem; adiciona outro item e recomendações diferentes aparecem. Linden observa que, embora o protótipo parecesse promissor, um vice-presidente sênior de marketing foi terminantemente contra, alegando que isso distrairia as pessoas do check-out. Greg foi proibido de continuar trabalhando no projeto. Mesmo assim, Greg fez um experimento controlado e o recurso ganhou por uma margem tão grande que não tê-lo em funcionamento estava custando à Amazon uma quantia considerável de dinheiro. Com uma nova urgência, as recomendações do carrinho de compras foram lançadas. Desde então, vários sites copiaram as recomendações de carrinho.

A cultura de experimentação da Amazon, em que os dados superam a intuição, e um sistema que facilitava a execução de experimentos, permitiram que a Amazon inovasse de forma rápida e eficaz.

Por que perguntar se os usuários gostariam de ter recomendações em seus carrinhos de compras quando o senhor pode simplesmente implementar o recurso para metade dos seus usuários, então observe o que acontece? Os sites da Web são particularmente adequados a esse tipo de teste observacional, pois é fácil coletar os dados das ações do usuário no servidor como uma série de solicitações HTTP. O senhor nem mesmo precisa estar fisicamente presente para “observar” os usuários dessa forma. No entanto, o senhor pode realizar o mesmo tipo de análise de dados, com um pouco de cuidado, mesmo se estiver implantando um aplicativo de desktop tradicional. Jensen Harris descreve como a Microsoft coleta dados de ações do usuário no Office 2003:

Suponha que o senhor quisesse saber o que o [Office 2000] recursos que as pessoas mais usam. Bem, o senhor começa perguntando a um “guru” que trabalha com o produto há muito tempo. “Todo mundo usa muito o AutoText”, diz o guru. Quanto mais altos forem os “especialistas”, mais suas opiniões contam. Em seguida, o senhor passa para as evidências anedóticas: “Eu estava em casa no Natal e vi minha mãe usando o Normal View… provavelmente é o que a maioria dos iniciantes usa.” E misture o conselho do especialista prestativo: “a maioria das pessoas usa vários monitores, ouvi isso do cara da Best Buy”.

SQM, que significa “Service Quality Monitoring” (monitoramento da qualidade do serviço), é nosso nome interno para o que ficou conhecido externamente como Programa de aprimoramento da experiência do cliente. Ele funciona da seguinte forma: Os usuários do Office 2003 têm a oportunidade de aderir ao programa. Dessas pessoas, coletamos pontos de dados anônimos e não rastreáveis que detalham como o software é usado e em que tipo de hardware. (Obviamente, nenhum dado de identificação pessoal é coletado).

Como designers, definimos pontos de dados sobre os quais temos interesse em aprender e o software é instrumentado para coletar esses dados. Todos os dados recebidos são agregados em um servidor enorme, onde pessoas como eu os utilizam para ajudar a tomar decisões.

Que tipo de dados coletamos? Sabemos tudo, desde a frequência com que os comandos são usados até o número de pastas de e-mail do Outlook que o senhor tem. Sabemos quais atalhos de teclado o senhor usa. Sabemos quanto tempo o senhor passa no Calendário e sabemos se personaliza as barras de ferramentas. Em resumo, coletamos tudo o que achamos interessante e útil, desde que não comprometa a privacidade do usuário.

Isso pode soar assustadoramente como um Big Brother, mas o SQM simplesmente estende o mesmo nível de relatório utilizado em todos os aplicativos da Web já criados para aplicativos de desktop.

O verdadeiro poder desses dados é que o senhor pode “observar” remotamente, silenciosamente e automaticamente o que os usuários realmente fazem no seu software. Agora o senhor pode responder a perguntas como Quais são os 5 comandos mais usados no Microsoft Word 2003? A resposta pode surpreendê-lo. O senhor sabe quais são as 5 funções mais usadas no Microsoft Word 2003? do seu são?

Não me entenda mal. Eu adoro usuários. Alguns dos meus melhores amigos são usuários. Mas, como todos nós, humanos, eles não são confiáveis, na melhor das hipóteses. Para ir além das suposições sobre usabilidade, nada substitui a observação dos clientes usando seu produto. Não seria libertador poder tomar decisões de design com base na forma como os clientes realmente usam o software, e não na forma como eles dizem ao senhor que o usam? Ou a maneira como o senhor pensar eles usam? Se o senhor estiver observando os usuários em testes de usabilidade de baixa fidelidadeou coletando dados de ações do usuário para que o senhor possa observá-los virtualmente, o objetivo é o mesmo: não pergunte — observe.