Antes de
começar o meu novo solilóquio quero contar um fato verídico.
Era
uma vez um moço que queria muito uma coisa. Muito mesmo!
Ele queria
tanto essa coisa que ele estava disposto a fazer qualquer coisa para
consegui-la.
Então, ele fez
tudo que podia e conseguiu!
Vangloriou-se
então com sua conquista.
Mas, no
instante seguinte, passou a querer outra coisa.
A vida é assim! Quando a gente acha que terminou,
começa tudo de novo; quando a gente acha que tá pronto, surge uma ideia, principalmente
na mixagem que é uma das etapas criativas que nunca termina.
Todo artista dificilmente termina
as suas obras, ele apenas desiste de continuar em determinado momento e assina.
Uma obra de arte não tem fim e alguns estudiosos dizem ainda que ela só está
completa quando comunica com o observador... Uma mixagem é arte e não tem fim.
A cada dia novo a gente tem uma impressão diferente, uma postura diferente, uma
ideia diferente e aí está o nosso moto perpétuo, mas como temos que entregar o
trabalho a gente acaba desistindo a certa altura onde estamos mais ou menos convencidos
com o resultado naquele instante, mas não totalmente. Todavia, a mixagem, como
você já está farto de saber, não é a etapa final da música, principalmente se
você não envia suas músicas para um masterizador profissional, como deveria
fazer. A masterização então passa a ser um novo começo. Lá se vão mais horas e
horas de equalizações sutis, leves reverbs, compressão e limitação discreta com
o olho pregado um uma das escalas K, não necessariamente exatamente seguindo
essa receita e nem nessa ordem, mas com certeza até o ponto no qual a gente
desiste. Fato.
O problema da masterização é que
ela não termina no estágio final quando fazemos o novo Bounce para um arquivo
estéreo. Há um novo começo logo após esse segundo fim, o downsampling, e é dele
que quero falar hoje.
Assunto perigoso. Tem gente que
vai gostar, tem gente que vai torcer o nariz, principalmente na hora da
matemática.
Esse estágio de downsampling é
tão importante quanto a primeira captura de ondas mecânicas por diafragmas a
condensador, sem transformador na saída de preferência. Apesar de que a histerese
presente nos núcleos de alguns transformadores com bobina de ferro promove a
distorção das frequências baixas que, para os iniciados, é muito agradável,
macia. E posso afirmar sem medo da minha esposa ficar preocupada que amo o DPA
4006, que tem transformador. Mais polêmica? Agora não. Mas é fato também que eu
particularmente não sou muito fã dessa onda MP3. Ok, mais polêmica! Tudo bem
que o arquivo fica menor, mas o som é de lascar. Aquele meu disco do Michael
Hedges gravado em 30ips não fica bom em MP3. Vangelis também não rola; nada
como a Spiral e Pulsar rodando do vinil...literalmente.
Bom, voltando...Downsampling:
Downsampling é obrigatório? Primeira
questão. Em todas as nossas produções a gente obviamente vai trabalhar em 24
bits ou até mesmo em 32 bits em ponto flutuante (que eu recomendo porque não
existe saturação interna no mixbus, pois o headroom é, de certo modo, infinito)
e depois teremos que exportar o resultado final (ou parcial, melhor dizendo)
para um arquivo estéreo que será posto em um CD ou que será tocado por algum
reprodutor que dificilmente vai dar conta de arquivos em 24 bits. CD utiliza
arquivos de 16 bits em 44.1kHz, então temos que fazer o downsampling de
qualquer jeito neste caso, senão é o mesmo que jogar um CD no lixo, mas aí entra
a segunda questão: Como fazer esse downsampling? Vai lá no menu File >
Bounce to > Disc > muda para interleaved > muda a resolução para 16
bits e clica o botão Bounce? Melhor não.
Nesse caso nenhum dither está sendo aplicado e vamos acabar ouvindo o ruído de
quantização, principalmente nos decaimentos de reverbs nas passagens de baixa
amplitude.
Tudo bem, tem gente que vai dizer
que o dither é um ruído feio de fundo e quem é que vai querer colocar um ruído
de fundo em uma música limpa? Ninguém, nem eu, mas acredite que em alguns casos
faz toda a diferença e pode ser que você nem ouça esse ruído, mas, pelo
contrário, o ruído de quantização é muito mais feio e audível, e ficará bem
perceptível se você não usar um dither. Tem gente que vai até questionar o
Bounce, como eu mesmo fiz em uma edição passada, na 232, creio eu, mas isso são
outros quinhentos.
Com certeza o seu processo de
produção tem vários começos e finais, provavelmente ele segue assim:
1. Gravação
multipista
2. Edição
3. Processamento
com plug-ins
4. Mais
edição
5. Mixagem
6. Bounce
para um arquivo estéreo de mesma resolução
7. Importação
do arquivo para masterização
8. Masterização
com plug-ins
9. Bounce
para um arquivo na resolução pretendida
Tem gente que até inclui já no
canal master do Pro Tools os plug-ins de masterização, nada contra. Entretanto,
eu acredito que faltaram estágios após esse último estágio 9, que aliás deveria
ser a exportação para um arquivo de mesma resolução, são eles:
10. Importação
do arquivo masterizado
11. Configuração
de dither
12. Bounce
para arquivo final
Depois que você fez toda a sua
mixagem e sua masterização e está com um arquivo "final" no HD que
deve ter nome similar a "nome da música_data_master.wav" provavelmente
em 24 bits, é chegada a hora de convertê-lo para a resolução adequada, mas em
alta qualidade, sem artifícios. Para isso vamos usar o plug-in POWr-Dither presente
no Pro Tools (que também existe no Live e em outros softwares), mas antes disso
quero explicar mais um pouco sobre o que o dither é, e o que ele faz:
Resumo: O dither é um ruído (geralmente
ruído branco por ser plano) de baixa intensidade que tem o intuito de alterar o
sinal original para que o ruído de quantização fique mais randômico (menos
periódico) quando convertemos de uma profundidade de amostra para outra menor (de
24 bits para 16 bits, por exemplo) de forma que o ruído fique menos intrusivo à
audição de acordo com as leis da psicoacústica.
Um pouco de matemática agora e
mais explicações: Um som gravado em 24 bits tem uma margem dinâmica de 144dB, pois
cada bit é responsável por 6dB. Sendo assim, 16 bits tem 96dB e,
consequentemente, temos uma redução da margem dinâmica ao fazermos o
downsampling de 24 para 16. Ademais, cada profundidade de amostragem tem uma quantidade
finita de níveis de resolução, por exemplo: 16 bits tem 216 níveis
de resolução, que nos dá 65536 níveis de resolução e, por sua vez, 24 bits tem
224 níveis, ou seja
16.777.216 níveis. Como o ruído de quantização sempre estará restrito ao
bit menos significativo (LSB = Least Significant Bit), ou seja, no caso da
resolução de 16 bits ele estará restrito à 1/65536 do total de bits disponível,
isso indica que o ruído de quantização estará presente nas partes mais
silenciosas da música, portanto se você está pensando em aplicar dither em uma
música de speed metal da banda do namorado da sua cunhada que se chama Living
Corpse (a banda, não a cunhada) você está perdendo seu tempo, pois não há
partes silenciosas. Guarde o dither para gêneros musicais que tem bastante
variação de dinâmica, como música clássica, Ethereal, Jazz, Deep, New Age e alguns
Pops.
Ao reduzir a profundidade da
amostra através do downsampling a gente reduz a quantidade de valores
disponíveis (níveis de resolução) para representarmos as diferenças de amplitude
de um determinado som (amostra), ou seja, o valor que estava fixo em
determinado lugar em 24 bits será movido para o valor mais próximo em 16 bits,
subindo ou descendo. Isso cria a chamada truncagem, trucamento, erro de
quantização, ruído de quantização, erro de arredondamento ou como quiser. Fato
é que a onda fica parecendo uma escadinha. Se pegarmos o som original e
subtrairmos o som reamostrado (com menos bits) ficaremos apenas com o ruído de
quantização e este terá a amplitude do bit menos significativo, como eu disse
antes. Aquela continha básica aí de cima. Em um osciloscópio podemos ver que
uma onda senoidal, por exemplo, fica aquadradada (como uma escada) ao ter sua
profundidade alterada para menos bits. Se subtrairmos essa onda resultante da
original temos a imagem do ruído de quantização e este tem a amplitude do menor
nível de resolução e aparece como sendo uma onda periódica (que se repete).
FIG 1. Até que enfim uma figura, que
inspiradora... no canto esquerdo está a onda original, no meio a onda com
resolução reduzida e na direita a subtração da original pela reduzida que
mostra o ruído de quantização.
Como você pode perceber, esse
ruído é periódico, ou seja, psicoacusticamente desagradável. Para resolver essa
questão o dither aplica um ruído randômico para que o ruído de quantização
também seja randômico, ou seja, mais agradável ao ouvido, pois ruídos
randômicos toleramos melhor, por isso que os nenês dormem melhor com o barulho
do carro do que com Dub Step, mesmo que estejam no mesmo volume.
Podemos ainda utilizar ruídos
filtrados no dither, como o ruído azul (que tem menos informação de baixa
frequência e é mais ou menos o inverso do pink noise) para tentar jogar o ruído
de quantização para fora do espectro audível ou usar o noise shaping, que
insere o ruído de quantização de volta no conversor de amostragem para filtrar
o resultado de forma a conseguir um resultado semelhante à técnica acima.
Existem várias formas alternativas
de se explicar o dither, uma que eu gosto é:
Olhe para essa matéria na
tela. Ok, você já está olhando. Agora imagine que ela é 24 bits e que você
precisa transformá-la em 16 bits, ou seja, você vai ter que retirar alguma
informação do que está vendo. Para isso estenda a sua mão sobre ela. Pronto uma
área foi retirada, este é o seu erro de quantização, mas assim fica impossível
de ler alguns trechos, pois sua mão fica na frente de algumas partes. Distorção.
Balance a mão agora para os lados bem rápido em frente à revista. Pronto, você
está aplicando um ruído, ou seja: um dither. Você acaba de reduzir a quantidade
de espaço visível, mas consegue ler tudo muito bem e se você for rápido o
bastante nem conseguirá ver sua mão, o ruído.
Muito bem, você já percebeu que a
aplicação de dither não é para qualquer estilo musical e que ele vai criar um
ruído na sua música que poderá ser perceptível nas passagens mais
"vazias", portanto a pergunta retorna: Vale a pena aplicar dither? A
única maneira de responder à essa questão é aplicando ele e comparando-o com a
versão sem ele aplicado. Qual você gosta mais? Fique com esta então.
OBS: Um jeito bom de saber qual é
o ruído que o dither aplica é aplicando-o em um arquivo silencioso. O resultado
final é o ruído puro gerado pelo dither, assim você consegue perceber
exatamente como ele é e fica mais fácil de ser identificado.
Falar de dither e não falar da
frequência de nyquist é meio estranho, pois ela rege onde o ruído fica melhor
posicionado. A frequência de nyquist segue o teorema de Nyquist que diz que para
termos fidelidade na digitalização a taxa de amostragem tem que ser o dobro da
frequência a ser digitalizada. Por isso que gravamos áudio no mínimo em
44.1kHz, pois ele é mais ou menos o dobro de 20kHz, que é o nosso limite da
audição. Aha! Sendo assim a frequência de Nyquist em um sistema que grava em 44.1kHz,
por exemplo, é 22050Hz, praticamente indaudível. Se tentarmos digitalizar uma
frequência que está acima da frequência de nyquist acontece um fenômeno
conhecido como aliasing, ou seja: a frequência sendo gravada gera uma função
que tem os mesmos samples, mas produz uma onda mais grave, diferente da
original.
FIG 2. A onda com período menor é a original;
a outra com período maior é originária do aliasing.
Porque isso
é importante para o dither?
Se acumularmos o ruído de
quantização logo abaixo da frequência de Nyquist em um sistema trabalhando em
44.1kHz este ruído ocupará a região de 22.05kHz, ou seja, fora do nosso
espectro audível e portanto o ruído parecerá não existir e também evitamos a
formação de aliasing. Você vai entender melhor isso ao ler porque existe o Tipo
1 de noise shaping do plug-in POWr-Dither no final da matéria.
Na música que tenho feito
ultimamente, algo próximo de uma viagem até Andrômeda, recheada de pianos com
reverbs longos, pads obesos da Roland, grooves de TR-606 e leads melancólicos
com excesso de delay que saem do meu estimado sintetizador analógico Moog, cabe
colocar um dither no final. Quando gravo meu violãozinho Martin Backpacker solo
com bastante reverb no melhor estilo 80, mas despretensiosamente, eu também uso
esse recurso. Como eu faço isso? Assim:
Abro a música final na Timeline
do Pro Tools.
Crio um canal Master (Master
Fader). Neste inserto o plug-in desprovido de beleza POWr-dither a partir do
menu dither, defino qual vai ser a profundidade da amostra final (sempre 16 bits
na verdade) e escolho o algoritmo apropriado na caixa Noise Shaping.
Mando fazer o Bounce na mesma
resolução definida no plug-in (obviamente).
Bati. Canastra limpa. Marca 200
aí.
FIG 3 - O Plug-in POWr-dither. Que graça!
Podia ter ao menos um botão mais bonitinho, se fosse da Universal Audio...
Como o POWr-dither também tem
noise shaping, mostro abaixo a tabelinha que sigo para você saber qual é o
algoritmo correto para determinado tipo musical:
Type 1: Tipo 1 - Tem a resposta de frequência mais plana
em todo o espectro audível modulando e acumulando o ruído de dither abaixo da
frequência de nyquist. Recomendado para material que tem pouca abertura de
panorama no campo estéreo, como instrumentos solo. Perfeito para violão solo.
Type 2: Tipo 2 - Tem uma curva otimizada
psicoacusticamente de baixa ordem ideal para material sonoro com grande
complexidade no ambiente estéreo. Não usei ainda.
Type 3: Tipo 3 - Tem
uma curva otimizada psicoacusticamente de alta ordem ideal para material sonoro
com altíssima complexidade no ambiente estéreo. Minhas músicas espaciais...
Se você não quer utilizar nenhum
noise shaping você pode usar o plug-in Dither, que é igualmente desprovido de
fenótipo amistoso, bastando desclicar o botão Noise Shaping. Contudo, para meus
ouvidos, prefiro o plug-in alvo dessa matéria. Se você é do tipo prático e já
faz uma sessão só para mixagem, masterização e downsampling, você pode usar o
plug-in Maxim no final da cadeia de processamento como sendo o último plug-in
no master fader, mas só coloque ele no momento final do Bounce para downsampling.
Neste verifique se o botão ON está ligado no campo dither e escolha se você vai
ligar ou não o botão noise shaping, que também utiliza um dither filtrado para
jogar a frequência do ruído de quantização acima do espectro audível. Por fim,
escolha a resolução adequada: 16, 18 ou 20 bits e faça o bounce de acordo. Se
você vai mandar masterizar fora (melhor opção), não aplique dither nenhum e
mande tudo na resolução original. Agora, se você pretende gerar um MP3 que vai
parar no YouTube, não há dither no planeta que irá ajudar seu resultado final.
FIG
4 - Plug-in Maxim, ótimo para os práticos. Só não se esqueça de colocar ele por
último.
Pois é! Mais uma vez chegamos ao
final de um post, mas como o supra citado conceito já prevê esse tipo de
coisa, será que não fui eu que desisti de gerar ainda mais discussão? Por via
das dúvidas assino:
Um abraço e até a próxima!
Muito bom! Obrigado!
ResponderExcluirOlá Daniel, perdoe-me pela ingênua colocação, mas o dither pode ser encarado como um "cancelamento de fase" do ruído de quantização, ou apenas a amiga mais bonitinha da menos apessoada ?
ResponderExcluirOlá Rei, fico com a segunda opção. Se fosse um cancelamento de fase o dither teria que gerar um sinal idêntico ao ruído de quantização para depois inverter a sua fase e então somar este resultado ao sinal com ruído para que ambas fossem canceladas. Para isso o dither teria que analisar o sinal e "entender" o que é ruído, pouco improvável na tecnologia atual. Temos algo similar, como o noise shaping, mas que serve para retirar ruídos de ar condicionado por exemplo, em pós produção, mas sempre se perdem frequências no processo e é um algoritmo muito complicado de usar. Acho que o dither é mesmo a amiga mais bonitinha da menos apessoada. Abs.
ExcluirOlá daniel,parabéns pelo trabalho cara! Seguinte,estou trabalhando a pouco tempo com o pro tools 10,mas ele não grava com buffer em 128 samples, para mixar ele trabalha normal com buffer em 1028 samples,mas quando pinho em 128 o sinal racha e fica como se fosse um robô,o que eu faço para trabalhar com o ideal que seria o buffer em 128 samples ? Obrigado!!
ResponderExcluirOlá, isso depende de seu computador e de sua sessão. Se em 128 está criando esses ruídos significa que você precisa melhorar o HD da máquina e colocar mais memória. Abs.
ExcluirEle está gravando com o buffer somente em 512 samples o que fazer? Obrigadooo!
ResponderExcluirOi, tá faltando computador...Abs.
Excluirmuto bom o artigo, daniel vc acha interessante gravar em 24/48 e depois abrir outro projeto 32/96 para mixagem? ai so no final fazer bounce nesse mesma ultima resolução pra masterizar? agradeço a dica!!
ResponderExcluir