Participando do evento de ontem Halo 3 O evento de lançamento no campus da Microsoft no Vale do Silício e o grande torneio de Halo3 que ajudamos a moderar me fizeram pensar sobre sistemas de classificação e correspondência de jogadores. Sem um sistema de classificação e correspondência bem projetado, os senhores terão jogos terrivelmente incompatíveis, em que uma equipe derruba a outra por uma margem de 3x ou mais. Isso é contraproducente para ambas as equipes:
- A equipe mais qualificada não aprende absolutamente nada ao derrotar seu oponente pouco qualificado. Eles estão passando sem nenhum desafio. Suponho que seja divertido, de certa forma, vencer todas as partidas e esmagar os adversários. Mas, em última análise, é um estilo de jogo vazio e sem sentido.
- A equipe menos habilidosa é desmoralizada por uma derrota total e esmagadora nas mãos da equipe mais qualificada. Não há incentivo para continuar. E quando o senhor é constantemente confrontado com adversários contra os quais não tem chance de vencer, por que jogar?
Um sistema ideal sempre combinaria jogadores de habilidade aproximadamente igual um contra o outro. Como o senhor sabe se alcançou essa meta? O senhor olha para os dados. O registro de vitórias, derrotas e empates de cada jogador fornece a resposta: se o sistema de correspondência e classificação estiver funcionando adequadamente, cada jogador ou equipe acabará atingindo um nível de habilidade em que estará vencendo cerca de 50% das vezes.
Há dezenas de sistemas possíveis de classificação e classificação que poderíamos usar. Postagem de Christopher Allen e Shannon Appelcline Collective Choice (Escolha coletiva): Sistemas de classificação competitiva explora muitos deles. Mas talvez o sistema de classificação mais famoso seja o Sistema de classificação Elo, que teve origem no mundo do xadrez. Trata-se de um modelo estatístico simples usado para avaliar objetivamente os níveis de habilidade dos jogadores:
Veja como funciona o Elo:
- Um novo jogador recebe uma classificação padrão, digamos 1200.
- Dois jogadores competem, com um dos três resultados: vitória, derrota, empate.
- As classificações dos dois jogadores são inseridas em um algoritmo juntamente com o estado final do jogo. É retornada uma nova classificação para cada jogador.
Digamos que dois jogadores, ambos com rating 1200, joguem uma partida. O jogador 1 vence. O jogador 1 terá agora a classificação 1205 e o jogador 2 terá a classificação 1195.
Os jogadores que vencem muito atingem classificações mais altas. Mas o jogador com classificação mais alta também começa a ver retornos decrescentes ao derrotar jogadores com classificação mais baixa. Para aumentar sua classificação, ele precisa derrotar outros jogadores de classificação mais alta. Se um jogador com classificação alta perder para um jogador com classificação baixa, ele perderá muito mais de sua classificação do que ganharia se tivesse vencido a partida.
Com o tempo, os jogadores do jogo acabarão sendo classificados com base em seu nível de habilidade Elo em vez de outros fatores.
É mais simples do que parece. Deixe-me colocar isso em uma linguagem que nós, geeks, possamos entender: o senhor ganha mais XP ao matar um dragão enorme e poderoso do que ao bater em um rato comum do cais.
Ao subir de nível, é perfeitamente possível que o senhor se torne tão poderoso que tenha de passar desses dragões enormes para adversários ainda mais intimidadores. Parece bastante óbvio para aqueles que entendem as convenções estatísticas de Dungeons and Dragons.
O sistema Elo, assim como o sistema Dungeons and Dragons, comprovadamente funciona. Embora tenha sido originalmente projetado para classificar jogadores de xadrez, ele é usado em todo o mundo dos jogos on-line e off-line para classificar e combinar jogadores em tudo, de Pokemon a Scrabble e World of Warcraft.
Quando se trata de combinar jogadores on-line, Blizzard Entertainment é, sem dúvida, uma das empresas mais experientes do planeta. Eles foram pioneiros em sistemas de classificação on-line em 1996 com Diablo e battle.nete ampliou essa liderança com Starcraft, Diablo II, Warcraft III e o rolo compressor que é o World of Warcraft. A Blizzard combinou e classificou coletivamente milhões de jogadores – se alguém sabe como fazer isso direito, é a Blizzard.
Warcraft III é um excelente estudo de caso sobre classificação e correspondência de jogadores. Apesar da experiência anterior da Blizzard e de usar o comprovado sistema de classificação Elo, o Warcraft III teve muitos problemas para combinar jogadores — problemas que levaram anos para serem resolvidos pela Blizzard. Eu mesmo fui um ávido jogador ranqueado de Warcraft III por cerca de um ano, então vivenciei isso em primeira mão. O sistema de correspondência automática do Warcraft III foi radicalmente reformulado com o Patch 1.15 em 2004, dois anos após o lançamento do jogo. Se o senhor examinar as perguntas frequentes de suporte da Blizzard, poderá ler nas entrelinhas para ver onde estão as explorações e patologias:
1. Até que um jogador tenha jogado um determinado número de jogos, seu desempenho será altamente variável, e é difícil fazer uma correspondência precisa entre eles.
A habilidade dos jogadores com contas de baixo nível pode variar radicalmentedesde um jogador que acabou de começar a jogar jogos multijogador de Warcraft III até um jogador altamente experiente que já jogou centenas de jogos, mas acabou de criar uma nova conta. Os jogadores iniciantes muitas vezes se encontravam em partidas injustas contra adversários muito habilidosos. Em uma tentativa de combinar melhor jogadores com habilidades semelhantes em jogos, o sistema de criação de partidas da Battle.net não usa mais o nível do jogador como o único fator determinante na criação de jogos.
2. A menos que os jogadores estejam jogando consistentemente, sua classificação deve decair com o tempo.
Os jogadores podem perder XP se não jogarem um número mínimo de jogos por semana, conforme listado em Gráfico 1. Deixar de jogar o mínimo exigido durante uma semana resulta em uma penalidade de XP. Para cada jogo que não for jogado abaixo da quantidade exigida para o seu nível, o usuário incorre em uma perda [to an opponent of the same skill level].
3. Os jogadores não podem escolher oponentes ou ambientes para melhorar sua classificação. Eles devem jogar com adversários escolhidos aleatoriamente em campo neutro.
O sistema de escalas do Battle.net foi reformulado para o Warcraft III. Esse novo sistema promove a competição ativa e mantém a integridade da escada. O sistema de combinação anônima (AMM) impede a troca de vitórias e garante que jogadores de alto nível enfrentem adversários com habilidades semelhantes. O AMM combina anonimamente os jogadores com base no nível de habilidade e seleciona aleatoriamente os mapas com base nas preferências dos jogadores. Os jogadores podem escolher sua raça, mas a maioria das outras opções de jogo é predefinida pelos designers, o que resulta em um nível mais alto de jogo.
Se o senhor não gosta de jogos anônimos, é possível organizar jogos em equipe, mas eles são isolados em uma escada especial própria. Isso é feito para evitar que qualquer tipo de conluio entre jogadores manche os resultados da escada principal.
O senhor pode encontrar muitos dos mesmos perigos ecoados no na seção “practical issues” (questões práticas) do verbete da Wikipédia sobre classificação Elo. Os jogos de xadrez e os jogos de estratégia em tempo real são coisas completamente diferentes, mas têm patologias de classificação e correspondência surpreendentemente semelhantes.
Um ponto fraco específico do sistema Elo é que o a suposição excessivamente simplificada de que o desempenho de cada jogador seguirá uma distribuição normal. Esse é um problema mais grave do que o senhor imagina, pois afeta desproporcionalmente os jogadores novos e iniciantes. Como a Blizzard observou acima, “os jogadores novatos muitas vezes se encontram em partidas injustas contra adversários muito habilidosos”. Em muitos jogos, uma grande proporção do público será de novatos. Se esses jogadores novatos passarem por várias partidas injustas, talvez nunca mais voltem e, em breve, o senhor não terá uma comunidade de jogadores para enfrentar.
A maioria das implementações modernas do sistema Elo faz ajustes para corrigir essa falha gritante:
Testes estatísticos subsequentes mostraram que o desempenho no xadrez quase certamente não é normalmente distribuído. Os jogadores mais fracos têm chances de vitória significativamente maiores do que o modelo da Elo prevê. Portanto, tanto a USCF quanto a FIDE mudaram para fórmulas baseadas na distribuição logística. Entretanto, em deferência à contribuição da Elo, ambas as organizações ainda costumam usar o “sistema Elo”.
Talvez a variante mais moderna do Elo seja O sistema de classificação TrueSkill da Microsoft da Microsoft, usado em sua rede de jogos on-line Xbox Live. O sistema TrueSkill tem melhores disposições para pontuar jogos em equipe, enquanto o Elo se baseia no modelo de um único jogador por jogo. Mas a principal inovação do TrueSkill é incorporar a incerteza da classificação de um jogador profundamente no modelo matemático.
Em vez de presumir uma única habilidade fixa para cada jogador, o sistema caracteriza sua crença usando uma distribuição de crença em curva de sino (também chamada de gaussiana) que é descrita exclusivamente por sua média μ (mu) (“ponto de pico”) e desvio padrão ÃÆ’ (sigma) (“spread”). Uma crença exemplar é mostrada na figura.
![]()
Observe que a área sob a curva de distribuição de crença de habilidade em um determinado intervalo corresponde à crença de que a habilidade do jogador estará nesse intervalo. Por exemplo, a área verde na figura à direita é a crença de que a habilidade do jogador está entre os níveis 15 e 20. À medida que o sistema aprende mais sobre a habilidade do jogador, ÃÆ’ tem a tendência de se tornar menor, delimitando melhor a habilidade do jogador. Outra forma de pensar sobre o μ e ÃÆ’ é considerá-los como a “crença média de habilidade do jogador” e a “incerteza” associada a essa avaliação de sua habilidade.
É uma matemática mais complexa do que o sistema de classificação Elo clássico relativamente simples, mas o TrueSkill deve resultar em uma classificação e correspondência mais precisas. Lembre-se, é por isso que estamos fazendo isso: para obter a melhor experiência de jogo possível para os todos jogadorese não apenas os jogadores de elite que têm centenas de jogos em seu currículo.
Nosso objetivo é combinar jogadores de todos os níveis de habilidade com seus colegas e permitir que os jogadores subam de classificação de forma confiável até que atinjam um patamar natural de 50% de proporção de vitórias e derrotas. Não queremos derrotas. Queremos jogos de roer as unhas, sempre com emoção, jogos que vão até o fim. Saberemos que fomos bem-sucedidos quando cada jogador sentir que cada jogo foi o equivalente a matar um dragão enorme e poderoso, e não bater em alguns ratos insignificantes do cais.