BEM-VINDO AO MEU BLOG!

Aqui no meu blog você vai achar dicas de Computer Music, especialmente de Pro Tools, Reason, Live, áudio profissional e Homestudio. Alguns trabalhos artísticos que eu fiz também têm seu espaço. Há muita informação legal nos comentários. Use a caixa de pesquisa logo abaixo para achar um assunto que você está procurando.

Boa navegação!

Dithering no Pro Tools, mais trabalho para depois dos finalmentes

Antes de começar o meu novo solilóquio quero contar um fato verídico.

Era uma vez um moço que queria muito uma coisa. Muito mesmo!
Ele queria tanto essa coisa que ele estava disposto a fazer qualquer coisa para consegui-la.
Então, ele fez tudo que podia e conseguiu!
Vangloriou-se então com sua conquista.
Mas, no instante seguinte, passou a querer outra coisa.

A vida é assim! Quando a gente acha que terminou, começa tudo de novo; quando a gente acha que tá pronto, surge uma ideia, principalmente na mixagem que é uma das etapas criativas que nunca termina.
Todo artista dificilmente termina as suas obras, ele apenas desiste de continuar em determinado momento e assina. Uma obra de arte não tem fim e alguns estudiosos dizem ainda que ela só está completa quando comunica com o observador... Uma mixagem é arte e não tem fim. A cada dia novo a gente tem uma impressão diferente, uma postura diferente, uma ideia diferente e aí está o nosso moto perpétuo, mas como temos que entregar o trabalho a gente acaba desistindo a certa altura onde estamos mais ou menos convencidos com o resultado naquele instante, mas não totalmente. Todavia, a mixagem, como você já está farto de saber, não é a etapa final da música, principalmente se você não envia suas músicas para um masterizador profissional, como deveria fazer. A masterização então passa a ser um novo começo. Lá se vão mais horas e horas de equalizações sutis, leves reverbs, compressão e limitação discreta com o olho pregado um uma das escalas K, não necessariamente exatamente seguindo essa receita e nem nessa ordem, mas com certeza até o ponto no qual a gente desiste. Fato.

O problema da masterização é que ela não termina no estágio final quando fazemos o novo Bounce para um arquivo estéreo. Há um novo começo logo após esse segundo fim, o downsampling, e é dele que quero falar hoje.
Assunto perigoso. Tem gente que vai gostar, tem gente que vai torcer o nariz, principalmente na hora da matemática.

Esse estágio de downsampling é tão importante quanto a primeira captura de ondas mecânicas por diafragmas a condensador, sem transformador na saída de preferência. Apesar de que a histerese presente nos núcleos de alguns transformadores com bobina de ferro promove a distorção das frequências baixas que, para os iniciados, é muito agradável, macia. E posso afirmar sem medo da minha esposa ficar preocupada que amo o DPA 4006, que tem transformador. Mais polêmica? Agora não. Mas é fato também que eu particularmente não sou muito fã dessa onda MP3. Ok, mais polêmica! Tudo bem que o arquivo fica menor, mas o som é de lascar. Aquele meu disco do Michael Hedges gravado em 30ips não fica bom em MP3. Vangelis também não rola; nada como a Spiral e Pulsar rodando do vinil...literalmente.

Bom, voltando...Downsampling:
Downsampling é obrigatório? Primeira questão. Em todas as nossas produções a gente obviamente vai trabalhar em 24 bits ou até mesmo em 32 bits em ponto flutuante (que eu recomendo porque não existe saturação interna no mixbus, pois o headroom é, de certo modo, infinito) e depois teremos que exportar o resultado final (ou parcial, melhor dizendo) para um arquivo estéreo que será posto em um CD ou que será tocado por algum reprodutor que dificilmente vai dar conta de arquivos em 24 bits. CD utiliza arquivos de 16 bits em 44.1kHz, então temos que fazer o downsampling de qualquer jeito neste caso, senão é o mesmo que jogar um CD no lixo, mas aí entra a segunda questão: Como fazer esse downsampling? Vai lá no menu File > Bounce to > Disc > muda para interleaved > muda a resolução para 16 bits  e clica o botão Bounce? Melhor não. Nesse caso nenhum dither está sendo aplicado e vamos acabar ouvindo o ruído de quantização, principalmente nos decaimentos de reverbs nas passagens de baixa amplitude.

Tudo bem, tem gente que vai dizer que o dither é um ruído feio de fundo e quem é que vai querer colocar um ruído de fundo em uma música limpa? Ninguém, nem eu, mas acredite que em alguns casos faz toda a diferença e pode ser que você nem ouça esse ruído, mas, pelo contrário, o ruído de quantização é muito mais feio e audível, e ficará bem perceptível se você não usar um dither. Tem gente que vai até questionar o Bounce, como eu mesmo fiz em uma edição passada, na 232, creio eu, mas isso são outros quinhentos.

Com certeza o seu processo de produção tem vários começos e finais, provavelmente ele segue assim:

1. Gravação multipista
2. Edição
3. Processamento com plug-ins
4. Mais edição
5. Mixagem
6. Bounce para um arquivo estéreo de mesma resolução
7. Importação do arquivo para masterização
8. Masterização com plug-ins
9. Bounce para um arquivo na resolução pretendida

Tem gente que até inclui já no canal master do Pro Tools os plug-ins de masterização, nada contra. Entretanto, eu acredito que faltaram estágios após esse último estágio 9, que aliás deveria ser a exportação para um arquivo de mesma resolução, são eles:

10. Importação do arquivo masterizado
11. Configuração de dither
12. Bounce para arquivo final

Depois que você fez toda a sua mixagem e sua masterização e está com um arquivo "final" no HD que deve ter nome similar a "nome da música_data_master.wav" provavelmente em 24 bits, é chegada a hora de convertê-lo para a resolução adequada, mas em alta qualidade, sem artifícios. Para isso vamos usar o plug-in POWr-Dither presente no Pro Tools (que também existe no Live e em outros softwares), mas antes disso quero explicar mais um pouco sobre o que o dither é, e o que ele faz:

Resumo: O dither é um ruído (geralmente ruído branco por ser plano) de baixa intensidade que tem o intuito de alterar o sinal original para que o ruído de quantização fique mais randômico (menos periódico) quando convertemos de uma profundidade de amostra para outra menor (de 24 bits para 16 bits, por exemplo) de forma que o ruído fique menos intrusivo à audição de acordo com as leis da psicoacústica.

Um pouco de matemática agora e mais explicações: Um som gravado em 24 bits tem uma margem dinâmica de 144dB, pois cada bit é responsável por 6dB. Sendo assim, 16 bits tem 96dB e, consequentemente, temos uma redução da margem dinâmica ao fazermos o downsampling de 24 para 16. Ademais, cada profundidade de amostragem tem uma quantidade finita de níveis de resolução, por exemplo: 16 bits tem 216 níveis de resolução, que nos dá 65536 níveis de resolução e, por sua vez, 24 bits tem 224 níveis, ou seja  16.777.216 níveis. Como o ruído de quantização sempre estará restrito ao bit menos significativo (LSB = Least Significant Bit), ou seja, no caso da resolução de 16 bits ele estará restrito à 1/65536 do total de bits disponível, isso indica que o ruído de quantização estará presente nas partes mais silenciosas da música, portanto se você está pensando em aplicar dither em uma música de speed metal da banda do namorado da sua cunhada que se chama Living Corpse (a banda, não a cunhada) você está perdendo seu tempo, pois não há partes silenciosas. Guarde o dither para gêneros musicais que tem bastante variação de dinâmica, como música clássica, Ethereal, Jazz, Deep, New Age e alguns Pops.

Ao reduzir a profundidade da amostra através do downsampling a gente reduz a quantidade de valores disponíveis (níveis de resolução) para representarmos as diferenças de amplitude de um determinado som (amostra), ou seja, o valor que estava fixo em determinado lugar em 24 bits será movido para o valor mais próximo em 16 bits, subindo ou descendo. Isso cria a chamada truncagem, trucamento, erro de quantização, ruído de quantização, erro de arredondamento ou como quiser. Fato é que a onda fica parecendo uma escadinha. Se pegarmos o som original e subtrairmos o som reamostrado (com menos bits) ficaremos apenas com o ruído de quantização e este terá a amplitude do bit menos significativo, como eu disse antes. Aquela continha básica aí de cima. Em um osciloscópio podemos ver que uma onda senoidal, por exemplo, fica aquadradada (como uma escada) ao ter sua profundidade alterada para menos bits. Se subtrairmos essa onda resultante da original temos a imagem do ruído de quantização e este tem a amplitude do menor nível de resolução e aparece como sendo uma onda periódica (que se repete).


FIG 1. Até que enfim uma figura, que inspiradora... no canto esquerdo está a onda original, no meio a onda com resolução reduzida e na direita a subtração da original pela reduzida que mostra o ruído de quantização.

Como você pode perceber, esse ruído é periódico, ou seja, psicoacusticamente desagradável. Para resolver essa questão o dither aplica um ruído randômico para que o ruído de quantização também seja randômico, ou seja, mais agradável ao ouvido, pois ruídos randômicos toleramos melhor, por isso que os nenês dormem melhor com o barulho do carro do que com Dub Step, mesmo que estejam no mesmo volume.

Podemos ainda utilizar ruídos filtrados no dither, como o ruído azul (que tem menos informação de baixa frequência e é mais ou menos o inverso do pink noise) para tentar jogar o ruído de quantização para fora do espectro audível ou usar o noise shaping, que insere o ruído de quantização de volta no conversor de amostragem para filtrar o resultado de forma a conseguir um resultado semelhante à técnica acima.

Existem várias formas alternativas de se explicar o dither, uma que eu gosto é:
Olhe para essa matéria na tela. Ok, você já está olhando. Agora imagine que ela é 24 bits e que você precisa transformá-la em 16 bits, ou seja, você vai ter que retirar alguma informação do que está vendo. Para isso estenda a sua mão sobre ela. Pronto uma área foi retirada, este é o seu erro de quantização, mas assim fica impossível de ler alguns trechos, pois sua mão fica na frente de algumas partes. Distorção. Balance a mão agora para os lados bem rápido em frente à revista. Pronto, você está aplicando um ruído, ou seja: um dither. Você acaba de reduzir a quantidade de espaço visível, mas consegue ler tudo muito bem e se você for rápido o bastante nem conseguirá ver sua mão, o ruído.

Muito bem, você já percebeu que a aplicação de dither não é para qualquer estilo musical e que ele vai criar um ruído na sua música que poderá ser perceptível nas passagens mais "vazias", portanto a pergunta retorna: Vale a pena aplicar dither? A única maneira de responder à essa questão é aplicando ele e comparando-o com a versão sem ele aplicado. Qual você gosta mais? Fique com esta então.

OBS: Um jeito bom de saber qual é o ruído que o dither aplica é aplicando-o em um arquivo silencioso. O resultado final é o ruído puro gerado pelo dither, assim você consegue perceber exatamente como ele é e fica mais fácil de ser identificado.

Falar de dither e não falar da frequência de nyquist é meio estranho, pois ela rege onde o ruído fica melhor posicionado. A frequência de nyquist segue o teorema de Nyquist que diz que para termos fidelidade na digitalização a taxa de amostragem tem que ser o dobro da frequência a ser digitalizada. Por isso que gravamos áudio no mínimo em 44.1kHz, pois ele é mais ou menos o dobro de 20kHz, que é o nosso limite da audição. Aha! Sendo assim a frequência de Nyquist em um sistema que grava em 44.1kHz, por exemplo, é 22050Hz, praticamente indaudível. Se tentarmos digitalizar uma frequência que está acima da frequência de nyquist acontece um fenômeno conhecido como aliasing, ou seja: a frequência sendo gravada gera uma função que tem os mesmos samples, mas produz uma onda mais grave, diferente da original.


FIG 2. A onda com período menor é a original; a outra com período maior é originária do aliasing.

Porque isso é importante para o dither?
Se acumularmos o ruído de quantização logo abaixo da frequência de Nyquist em um sistema trabalhando em 44.1kHz este ruído ocupará a região de 22.05kHz, ou seja, fora do nosso espectro audível e portanto o ruído parecerá não existir e também evitamos a formação de aliasing. Você vai entender melhor isso ao ler porque existe o Tipo 1 de noise shaping do plug-in POWr-Dither no final da matéria.

Na música que tenho feito ultimamente, algo próximo de uma viagem até Andrômeda, recheada de pianos com reverbs longos, pads obesos da Roland, grooves de TR-606 e leads melancólicos com excesso de delay que saem do meu estimado sintetizador analógico Moog, cabe colocar um dither no final. Quando gravo meu violãozinho Martin Backpacker solo com bastante reverb no melhor estilo 80, mas despretensiosamente, eu também uso esse recurso. Como eu faço isso? Assim:

Abro a música final na Timeline do Pro Tools.
Crio um canal Master (Master Fader). Neste inserto o plug-in desprovido de beleza POWr-dither a partir do menu dither, defino qual vai ser a profundidade da amostra final (sempre 16 bits na verdade) e escolho o algoritmo apropriado na caixa Noise Shaping.
Mando fazer o Bounce na mesma resolução definida no plug-in (obviamente).
Bati. Canastra limpa. Marca 200 aí.


FIG 3 - O Plug-in POWr-dither. Que graça! Podia ter ao menos um botão mais bonitinho, se fosse da Universal Audio...

Como o POWr-dither também tem noise shaping, mostro abaixo a tabelinha que sigo para você saber qual é o algoritmo correto para determinado tipo musical:

Type 1: Tipo 1 - Tem a resposta de frequência mais plana em todo o espectro audível modulando e acumulando o ruído de dither abaixo da frequência de nyquist. Recomendado para material que tem pouca abertura de panorama no campo estéreo, como instrumentos solo. Perfeito para violão solo.
Type 2: Tipo 2 - Tem uma curva otimizada psicoacusticamente de baixa ordem ideal para material sonoro com grande complexidade no ambiente estéreo. Não usei ainda.
Type 3: Tipo 3 -  Tem uma curva otimizada psicoacusticamente de alta ordem ideal para material sonoro com altíssima complexidade no ambiente estéreo. Minhas músicas espaciais...

Se você não quer utilizar nenhum noise shaping você pode usar o plug-in Dither, que é igualmente desprovido de fenótipo amistoso, bastando desclicar o botão Noise Shaping. Contudo, para meus ouvidos, prefiro o plug-in alvo dessa matéria. Se você é do tipo prático e já faz uma sessão só para mixagem, masterização e downsampling, você pode usar o plug-in Maxim no final da cadeia de processamento como sendo o último plug-in no master fader, mas só coloque ele no momento final do Bounce para downsampling. Neste verifique se o botão ON está ligado no campo dither e escolha se você vai ligar ou não o botão noise shaping, que também utiliza um dither filtrado para jogar a frequência do ruído de quantização acima do espectro audível. Por fim, escolha a resolução adequada: 16, 18 ou 20 bits e faça o bounce de acordo. Se você vai mandar masterizar fora (melhor opção), não aplique dither nenhum e mande tudo na resolução original. Agora, se você pretende gerar um MP3 que vai parar no YouTube, não há dither no planeta que irá ajudar seu resultado final.


FIG 4 - Plug-in Maxim, ótimo para os práticos. Só não se esqueça de colocar ele por último.

Pois é! Mais uma vez chegamos ao final de um post, mas como o supra citado conceito já prevê esse tipo de coisa, será que não fui eu que desisti de gerar ainda mais discussão? Por via das dúvidas assino:

Um abraço e até a próxima!

8 comentários:

  1. Olá Daniel, perdoe-me pela ingênua colocação, mas o dither pode ser encarado como um "cancelamento de fase" do ruído de quantização, ou apenas a amiga mais bonitinha da menos apessoada ?

    ResponderExcluir
    Respostas
    1. Olá Rei, fico com a segunda opção. Se fosse um cancelamento de fase o dither teria que gerar um sinal idêntico ao ruído de quantização para depois inverter a sua fase e então somar este resultado ao sinal com ruído para que ambas fossem canceladas. Para isso o dither teria que analisar o sinal e "entender" o que é ruído, pouco improvável na tecnologia atual. Temos algo similar, como o noise shaping, mas que serve para retirar ruídos de ar condicionado por exemplo, em pós produção, mas sempre se perdem frequências no processo e é um algoritmo muito complicado de usar. Acho que o dither é mesmo a amiga mais bonitinha da menos apessoada. Abs.

      Excluir
  2. Olá daniel,parabéns pelo trabalho cara! Seguinte,estou trabalhando a pouco tempo com o pro tools 10,mas ele não grava com buffer em 128 samples, para mixar ele trabalha normal com buffer em 1028 samples,mas quando pinho em 128 o sinal racha e fica como se fosse um robô,o que eu faço para trabalhar com o ideal que seria o buffer em 128 samples ? Obrigado!!

    ResponderExcluir
    Respostas
    1. Olá, isso depende de seu computador e de sua sessão. Se em 128 está criando esses ruídos significa que você precisa melhorar o HD da máquina e colocar mais memória. Abs.

      Excluir
  3. Ele está gravando com o buffer somente em 512 samples o que fazer? Obrigadooo!

    ResponderExcluir
  4. muto bom o artigo, daniel vc acha interessante gravar em 24/48 e depois abrir outro projeto 32/96 para mixagem? ai so no final fazer bounce nesse mesma ultima resolução pra masterizar? agradeço a dica!!

    ResponderExcluir