Em que formato é melhor ouvir música. Três baleias com perdas
Em que formato é melhor ouvir música. Três baleias com perdas
Anonim

Compreender os formatos de áudio digital não é nada fácil. É ainda mais difícil chegar a uma conclusão inequívoca em que formato é melhor ouvir música. Se você olhar para a tabela comparativa de formatos de áudio na Wikipedia, seus olhos começarão a ondular com colunas de números silenciosos. Vamos tentar descobrir o que está por trás disso.

Em que formato é melhor ouvir música. Três baleias com perdas
Em que formato é melhor ouvir música. Três baleias com perdas

Vamos fazer uma reserva desde já que o artigo fala APENAS de características gerais e não incluirá alguns detalhes. No futuro, Lifehacker conduzirá sua própria pesquisa imparcial. E hoje vamos tentar generalizar a experiência já conhecida de uma forma ou de outra.

Existe um análogo e uma figura.

Analógico é bom, mas de curta duração e inconveniente. Portanto, a mídia analógica, apesar das altas vendas de vinil, não fará um retorno.

O áudio digital pode ser de três tipos principais:

  • em um formato que não usa compressão;
  • em um formato que usa compactação sem perdas;
  • em um formato que usa compactação com perdas.

À primeira vista, os formatos sem perdas são mais promissores. Nem sempre é o caso, como discutiremos com mais detalhes em um dos materiais a seguir. Os formatos não compactados não fazem nenhum sentido além de armazenar as gravações principais necessárias para criar conteúdo de áudio. Eles são mais fáceis de restaurar. Armazenar e ouvir gravações caseiras é supérfluo.

Dos muitos parâmetros de áudio digital, o usuário deve primeiro se preocupar com a frequência de amostragem (a precisão de digitalizar um sinal analógico no tempo), profundidade de bits (a precisão da digitalização em amplitude - volume), taxa de bits (a quantidade de informações contidas no arquivo por segundo).

Hoje vamos falar sobre perdas.

Para som comprimido, o conceito de modelo psicoacústico é muito importante - as ideias de cientistas e engenheiros sobre como uma pessoa percebe o som. O ouvido percebe todo o espectro de ondas acústicas que chegam a ele. No entanto, o cérebro processa os sinais.

O valor de referência da faixa audível humana é de 16 Hz a 20 kHz, mas ele não é capaz de ouvir e estar ciente de todos os sons de entrada simultaneamente.

A audição é discreta e sua sensibilidade auditiva não é linear.

Os modelos psicoacústicos modernos avaliam com precisão a audição humana e estão em constante aperfeiçoamento. Na verdade, apesar das garantias dos amantes da música, músicos e audiófilos, para o ouvido não treinado médio, o aparecimento inicial do MP3 em qualidade máxima tornou-se extremamente perceptível. Existem exceções, elas não podem deixar de existir. Mas nem sempre são facilmente perceptíveis quando se ouve às cegas.

Formatos que usam modelos de compressão psicoacústica

Existem muitos desses formatos para compressão de áudio com perdas. Os mais comuns hoje são os seguintes.

OGG (Vorbis)

Em geral, um arquivo com a extensão *.ogg é um "contêiner": ele pode conter várias gravações de som com suas próprias tags e características. Na maioria das vezes, os arquivos armazenados nele são compactados com o codec Ogg Vorbis, embora outros, incluindo MP3 ou FLAC, possam ser usados.

Suas principais vantagens incluem uma ampla gama de parâmetros possíveis durante a codificação: a taxa de amostragem de áudio pode chegar a 192 kHz, a profundidade de bits é de 32 bits. Por padrão, OGG usa uma taxa de bits variável (embora isso não seja mostrado na exibição de propriedades), que pode ir até 1.000 kbps.

MP3

Ao contrário do OGG gratuito, o MP3 foi desenvolvido pela Fraunhofer Society, uma associação de institutos alemães de pesquisa aplicada, o que é muito importante para a acústica moderna. Entre os audiófilos, aliás, este é um escritório extremamente respeitado, porém, eles não gostam de admitir. Mas seus desenvolvimentos são observados de perto.

Ao contrário do OGG, ele pode ter taxa de bits variável (VBR) e taxa de bits constante (CBR). Aliás, foi graças ao MP3 que se descobriu que nem toda gravação pode ser codificada com alta qualidade com uma taxa de bits variável (veja os motivos acima, os algoritmos de codificação e seus resultados neste caso podem ser diferentes ao codificar a mesma fonte)

Devido à sua idade avançada, o MP3 tem limitações significativas: a profundidade de bits pode ser de 16-24 bits, a frequência de amostragem é expressa apenas em valores discretos (8, 11, 025, 12, 16, 22, 05, 24, 32, 44, 1, 48), taxa de bits limitada a 320 kbps. Além disso, na versão regular do MP3, o número de canais é limitado a dois.

AAC

O mesmo rake, apenas de perfil. Também desenvolvido pela Fraunhofer Society. Posteriormente e utiliza um modelo psicoacústico diferente, mais moderno. A informação publicamente disponível permite-nos concluir: sim, conseguiram melhorar a sua própria criação.

Mesmo com os números mais básicos, o AAC é um formato mais flexível. A profundidade de bits dos arquivos obtidos com a ajuda deste desenvolvimento varia de 16 a 24, a frequência de amostragem, se desejada, também permitirá não perder a imagem sonora e fica na faixa de 8-192 kHz. O fluxo de dados geralmente se aproxima daqueles de formatos sem perdas (até 512 kbps), enquanto o número máximo de canais de arquivo AAC chega a 48.

Qual formato é definitivamente o melhor

Considerando que o AAC é o MP3 reimaginado após doze anos, a escolha é a seu favor. Se desejar, faz sentido comparar apenas MP3 e OGG. Vamos dar uma olhada nas fotos feitas pelo respeitado Andrey Aspidov do ixbt.com:

1
1

Nos gráficos - bom AudioCD, OGG compactado com taxa de bits variável de 350 kbps e MP3 usando Lame. Quanto mais baixo for o gráfico, mais próximo o som estará do original. Acontece que é uma imagem muito interessante. Apesar de o MP3 ter claramente cortado as altas frequências, ao contrário do OGG, em que se nota o bloqueio abaixo de 2 kHz.

2
2

A distribuição de freqüência-tempo do som não fala de coisas menos interessantes. Com uma taxa de bits constante de 320 kbps, o MP3 é quase idêntico à gravação original. Tudo parece estar se encaixando agora. Mas … Na verdade, tudo é ainda mais confuso.

Por que usar com perdas quando não há perdas disponíveis?

Senso comum.

O fato é que a maioria das gravações analógicas não contém a quantidade de informações que precisariam ser armazenadas em formatos de alta qualidade. Não se esqueça que a taxa de amostragem nativa para CD é 44,1 kHz, a quantização é de apenas 16 bits.

Os gráficos anteriores demonstram bem a alta fidelidade da transmissão de MP3. Mas para uma fita cassete de áudio, fita magnética (a menos, é claro, que seja uma fita master), as características de um CD de áudio são inatingíveis. E para equipamento de estúdio de massa, a capacidade de gravar som analógico correspondente ao AudioCD apareceu relativamente recentemente. Não adianta digitalizar em FLAC (e mais ainda em WAV) uma gravação de concerto ou um disco da era pré-digital, principalmente aqueles feitos em mídia magnética. Eles não contêm esses espectros e a quantidade de informações que podem ser armazenadas por contêineres sem compressão.

O que mudou hoje

Um raro engenheiro de som faz uma gravação digital master (que é então reproduzida em mídia física), utilizando tecnologias modernas ao máximo. Portanto, a chance de uma trilha de 24 bits ser na verdade apenas 16 bits é extremamente alta.

A gravação analógica de alta qualidade em equipamentos de alta qualidade é ainda mais difícil de encontrar hoje - mesmo que apenas para os fãs desse som. Assim, por exemplo, é Jack White, o ex-líder do White Stripes. Ao mesmo tempo, algumas de suas gravações remetem a variações de lo-fi, e procurar as características sonoras ultrajantes da faixa torna-se uma espécie de prazer para os gourmets.

Se você imaginar a fonte ideal, apenas ouvidos treinados ou ouvir em um equipamento de áudio de alta qualidade permitirá que você encontre um arquivo compactado. E já com base nisso (e não esquecendo a percepção), vale a pena tirar a seguinte conclusão:

O AAC é necessário e suficiente para equipamentos de preço médio, na ausência do qual (e na ausência de fontes que possam ser codificadas em AAC) - MP3 com uma taxa de bits constante de 320 kbps, criado usando o codec Lame 3,93 (chaves recomendadas para decodificação: -cbr -b320 -q0 -k -ms).

As exceções são gravações originalmente gravadas em alta qualidade, digamos, gravadas em DVD-Áudio, SACD ou gravações originalmente coletadas em DSD (ou formato semelhante) com uma alta taxa de bits.

Embora sem perdas tenha alguns recursos. E contaremos sobre eles na próxima vez.

Recomendado: