O grande experimento da taxa de bits do MP3

Ultimamente, tenho tentado livrar minha vida do maior número possível de artefatos físicos. Concordo com Merlin Mann em relação aos CDs:

Não acredito na rapidez com que os CDs passaram de algo que odeio armazenar para algo que odeio comprar e para algo que odeio simplesmente existir.

Embora eu estenda essa linha de pensamento aos DVDs também. A morte da mídia física tem algumas desvantagens definitivas, mas depois de ter alguns filmes em VHS, depois em DVD e, finalmente, em Blu-Ray, acho que agora estou em paz com a ideia de não possuir nenhuma mídia física nunca mais, se eu puder evitar.

Minha estratégia atual de desejar minha coleção de mídia física em um milharal envolve o envio de todos os nossos DVDs para Segundo giro por correio e pagando ao nosso sobrinho US$ 1 por CD para extrair nossa coleção de CDs usando o Cópia exata de áudio e LAME como um projeto de verão. O objetivo desse exercício é absolutamente não pirataria; não tenho interesse em manter cópias digitais e físicas da mídia que paguei pelo privilégio de de possuirlicenciamento temporário. Observe que não me dei ao trabalho de extrair nenhum dos DVDs porque quase nunca os assistia; na maioria das vezes, eles apenas acumulavam poeira. Mas Continuo amando música e ouço minha coleção de músicas diariamente. Vou doar todos os CDs ripados para alguma instituição de caridade ou biblioteca e, se não conseguir fazer isso, vou destruí-los completamente. Átomos estúpidos!

Os CDs, ao contrário dos DVDs ou mesmo dos Blu-Rays, são considerados qualidade de referência. Ou seja, os dados de áudio digital não compactados contidos em um CD são uma representação quase perfeita do master original do estúdio, segundo a interpretação de “perfeito” da maioria das pessoas sensatas, pelo menos em 1980. Portanto, se o senhor pagou por um CD, pode estar preocupado com a possibilidade de copiá-lo para um compactado resultaria em uma experiência auditiva inferior.

Não sou exatamente um audiófilo, mas gosto de pensar que tenho ouvidos muito bons. Já recomendei comprar fones de ouvido de mais de US$ 200 e amplificadores de fone de ouvido já há algum tempo. A propósito: ainda é um bom investimento! O senhor pode fazer isso! De qualquer forma, pesquisas anteriores e meus próprios experimentos me levaram a escrever Obtendo o melhor retorno para seu byte há sete anos. Concluí que ninguém conseguia realmente ouvir a diferença entre uma faixa de CD bruta e um MP3 usando um codificador decente em uma taxa de bits variável com média de cerca de 160 kbps. Qualquer taxa de bits superior a essa era apenas desperdício de espaço no dispositivo e de largura de banda sem motivo racional. O chamado “áudio de alta resolução” era recentemente desmascarado por motivos muito semelhantes.

Artigos no mês passado revelaram que o músico Neil Young e Steve Jobs, da Apple discutiram a possibilidade de oferecer downloads de música digital com “qualidade de estúdio sem concessões. Grande parte da imprensa e dos comentários dos usuários estava particularmente entusiasmada com a perspectiva de downloads de 192kHz de 24 bits sem compressão. O 24/192 teve destaque em minhas próprias conversas com o grupo do Sr. Young há vários meses.

Infelizmente, não faz sentido distribuir música no formato 24 bits/192 kHz. Sua fidelidade de reprodução é ligeiramente inferior a 16/44.1 ou 16/48, e ocupa 6 vezes mais espaço.

Existem alguns problemas reais com a qualidade de áudio e a “experiência” da música distribuída digitalmente atualmente. O 24/192 não resolve nenhum deles. Enquanto todos se fixarem no 24/192 como uma solução mágica, não veremos nenhuma melhoria real.

Os autores do LAME devem ter concordado comigo, porque a maneira típica, padrão, recomendada e padrão de codificar qualquer entrada de áudio antiga para MP3 …

lame --preset standard "cd-track-raw.wav" "cd-track-encoded.mp3"

… agora produz faixas MP3 de taxa de bits variável a uma taxa de bits de cerca de 192 kbps em média.

Encspot-omigod-disc-3

(Descer um nível para a predefinição “medium” produz uma média quase exata de 160 kbps, minha recomendação de 2005).

Os codificadores só melhoraram desde os bons e velhos tempos de 2005. Dada a melhoria de muitas ordens de magnitude no desempenho e no armazenamento desde então, sinto-me totalmente à vontade para acrescentar mais 32 kbps, passando de uma média de 160 kbps para uma média de 192 kbps só para garantir a segurança total. Isso ainda é um tamanho de arquivo minúsculo em comparação com a enorme quantidade de dados necessários para um áudio bruto mítico e auralmente perfeito. Para uma faixa de música específica de 4 minutos e 56 segundos, isso seria:

Formato de CD bruto não compactado 51 mb
Compressão FLAC sem perdas 36 mb
LAME insane encoded MP3 (320kbps) 11.6 mb
MP3 codificado no padrão LAME (média de 192 kbps) 7.1 mb

A extração para áudio não compactado não é uma opção. Não importa o quanto o senhor seja um nerd da qualidade de áudio, gastar 7× ou 5× a largura de banda e o armazenamento para completamente inaudível As melhorias de “qualidade” são um punhal diretamente no coração do este pelo menos para um nerd amante da eficiência. Talvez, se o senhor estiver planejando fazer muitas remixagens e manipulações, faça sentido manter o áudio de origem bruto, mas para uma audição normal, nunca.

A diferença entre a faixa de 320 kbps e a faixa de 192 kbps é mais racional de se discutir. Mas ainda é 1,6 vezes o tamanho. Sim, hoje temos muito mais largura de banda, armazenamento e potência, mas o espaço de armazenamento em seu dispositivo móvel nunca será gratuito, nem a largura de banda ou o armazenamento na nuvem, onde, na minha opinião, a maior parte desse material deve residir. E se todas as outras coisas forem iguais, o senhor não preferiria poder colocar 200 músicas no seu dispositivo em vez de 100? O senhor não prefere poder baixar 10 faixas ao mesmo tempo em vez de 5? É aí que está a eficiência. Principalmente quando pessoas com ouvidos de cachorro nem conseguiriam ouvir a diferença.

Mas espere, eu tenho orelhas de cachorro

É claro que o senhor tem. Na Internet, ninguém sabe que o senhor é um cachorro. Pessoalmente, acho que o senhor é um ser humano cheio de besteiras, mas vamos usar um pouco de ciência nisso e ver se consegue provar.

Na Internet, ninguém sabe que o senhor é um cachorro

Quando alguém me diz “Caras, vamos lá, vamos nos afastar da pior música já escrita!”, eu digo desafio aceito. Veja O grande experimento de taxa de bits do MP3!

Como proposto em nosso próprio Stack Exchange de produção de áudio e vídeovamos fazer um teste cego do mesmo trecho de 2 minutos de uma determinada faixa de áudio de rock em algumas taxas de bits diferentes, variando de MP3 CBR de 128 kbps até áudio de CD não compactado. Cada amostra foi codificada (se necessário) e, em seguida, exportada para WAV para que todas tivessem o mesmo tamanho de arquivo. O senhor sabe dizer a diferença entre qualquer uma dessas amostras de áudio? usando apenas seus ouvidos?

1. Ouça cada amostra de áudio de dois minutos

(atualização: experimento concluído; links removidos).

Limburger
Cheddar
Gouda
Brie
Feta

2. Avalie cada amostra quanto à qualidade da codificação

Depois de ouvir cada amostra de áudio – o senhor pode apenas com seus ouvidos, por favor, não com software de análisepreencha este breve formulário e avalie cada amostra de áudio de 1 a 5 quanto à qualidade da codificação, sendo que 1 representa o pior e 5 representa o melhor.

Sim, seria melhor usar uma variedade de amostras de áudio diferentes, como faz o SoundExpert, mas não tenho tempo para fazer isso. De qualquer forma, se a diferença na qualidade da taxa de bits da codificação for tão profunda quanto certos elementos vocais da comunidade querem que os senhores acreditem que seja, essa diferença deverá ser audível em qualquer faixa de música. Para aqueles que possam argumentar que estou enganando os audiófilos para que ouçam uma das piores e melhores músicas de rock de todos os tempos… repetidamente. mais … para provar um ponto … eu digo, como o senhor ousa impugnar minha honra dessa maneira? Como o senhor se atreve!

Eu não me sentia à vontade para fazer minha generosos anfitriões do TypePad sofrem com as demandas de largura de banda de várias amostras de áudio de 16 megabytes, então essa foi uma oportunidade divertida de exercitar minha conta do Amazon S3, há muito adormecida, e testar o serviço on-demand da Amazon CloudFront CDN. Espero não estar incomodando nenhum detentor de direitos autorais com esse teste; acabei de usar um trecho de música para fins científicos, cara! Vou retirar os arquivos completamente depois de algumas semanas, só para ter certeza.

O senhor não terá nenhum argumento de que a antiga codificação de taxa de bits constante de 128 kbps não é adequada para a maioria das músicas, mesmo nos dias de hoje, e deve ser possível ouvir isso nesse teste. Mas também afirmo que praticamente ninguém consegue perceber a diferença entre um MP3 com taxa de bits variável de 160 kbps e o áudio bruto do CD, muito menos 192 kbps. Se o senhor quiser provar que estou errado, esta é a sua grande chance. Como o locutor da Smash TV, eu digo boa sorte – o senhor vai precisar.

Então, qual é o senhor? o senhor é um cachorro ou um homem? Ouça as amostras e depois avalie-as. Publicarei os resultados desse experimento em alguns dias.