Rares celles et ceux qui prennent le temps de se pencher sur le sujet du dithering.
J’aurais du mal à leur en tenir rigueur : en effet, s’il s’agit de la dernière étape des traitements effectués lors du mastering, elle n’est clairement pas la plus passionnante.
La plupart d’entre nous ajoutent du dithering parce qu’on leur a dit de le faire. Et c’est tout.
Alors si vous avez déjà lu cette page jusqu’ici, félicitations 🙂 — c’est que vous êtes vraiment motivé(e) à en savoir plus sur le sujet.
Et rassurez-vous, cet article ne va pas être une thèse technique sur le dithering (ça existe), mais simplement un aperçu suffisamment complet pour que vous compreniez à quoi ça sert et comment l’utiliser.
C’est parti…
Notion de résolution en bits
Commençons par regarder ce à quoi ressemble un signal numérique (ça sera peut-être un rappel pour certains d’entre vous).
Dans l’univers digital — donc celui de votre PC et de votre DAW par exemple — un signal audio est composé de 0 et de 1.
C’est pour cela qu’on parle de “signal numérique”, par rapport aux signaux analogiques du monde physique.
Cela veut dire que si l’on prend une courbe sinusoïdale comme ceci :

et que l’on zoome, on obtient quelque chose comme ça :

Vous voyez ces points ?
Eh bien, il s’agit des échantillons (samples en anglais) de votre signal.
L’échelle horizontale correspond au temps qui s’écoule. Par seconde, il y a autant de points-échantillons que la fréquence d’échantillonnage du signal.
Par exemple, sur un CD, l’échantillonnage est à 44100 Hz : on a donc 44100 échantillons par seconde.
L’échelle verticale, elle, correspond à la valeur des échantillons. Plus la résolution en bits est élevée, plus il y a de valeurs possibles.
Donc, plus la plage dynamique de signal pouvant être représentée est grande :
- 1 bit = 2 valeurs possibles, 0 ou 1 ;
- 2 bits = 4 valeurs possibles ;
- 16 bits = 65 536 valeurs possibles ;
- 24 bits = 16 777 216 valeurs possibles ;
- etc.
Le fait est que suivant le support, on ne va pas retrouver la même résolution.
Typiquement, dans votre DAW, vous traitez probablement des pistes enregistrées en 24 bits.
Mais vos effets travaillent en 64 bits.
Et in fine, les CDs que vous allez produire sont en 16 bits.
Et là, il va y avoir un problème…
Réduction de la résolution en bits = problème
Imaginons que vous ayez un signal simple enregistré en 24 bits.
Par exemple, une onde sinusoïdale à 1 kHz.
Si l’on regarde le spectre de fréquences correspondant, on retrouve une jolie fréquence fondamentale avec un bruit de fond extrêmement bas (le noise floor).

Jusqu’ici, tout va bien.
Imaginons maintenant que vous souhaitiez convertir ce signal en 16 bits.
Pour ce faire, on va par exemple tronquer le signal en retirant les bits les moins importants.
Problème : en faisant cela, on génère ce que l’on appelle des erreurs de quantification, qui vont se traduire :
- en distorsion harmonique ;
- en un bruit de fond additionnel et d’amplitude variable.
Le tout se comportant de façon relativement imprédictible en termes de répartition fréquentielle.
Si on regarde le spectre de fréquences de notre enregistrement converti en 16 bits, on obtiendra donc ceci :

Pas terrible : la distorsion est partout (regardez les harmoniques apparues à 3 et 5 kHz par exemple) et il y a un bruit de fond qui n’est pas du tout homogène.
C’est donc ce problème de quantification que l’on va essayer de traiter avec le dithering.
Le dithering, c’est quoi ?
Pour pallier les problèmes de conversion inhérents à la réduction de la résolution d’un fichier audio, on utilise le dithering.
To dodanie do sygnału bazowego ciągłego szumu na bardzo niskim, wręcz niesłyszalnym poziomie.
Ten szum ma tę szczególność, że jest całkowicie losowy, więc niepowtarzalny.
Może na przykład wyglądać tak:

Oczywiście, może się to wydawać intuicyjnie sprzeczne, aby dodać szum do swojego mastera: w końcu często staramy się uzyskać jak najniższy poziom szumów tła.
Jednak spójrz, co się dzieje, gdy dodajemy ten szum ditheringowy do naszej sinusoidy przekształconej na 16 bitów:

Na powyższym wykresie:
- niebieska krzywa odpowiada naszemu sygnałowi przekształconemu na 16 bitów z ditheringiem;
- a poniżej można dostrzec pomarańczową krzywą, którą widzieliśmy wcześniej, a która odpowiada temu samemu sygnałowi przekształconemu, ale bez ditheringu.
Jak widać, dithering pozwala wyeliminować zniekształcenia, ale w zamian oczywiście uzyskujemy wyższy poziom szumów tła.
To powiedziawszy, ten szum tła jest prawie niesłyszalny: jesteśmy poniżej -120 dBFS. A lepiej mieć łagodny i jednorodny szum tła niż szum tła stworzony przez redukcję rozdzielczości, znacznie mniej przyjemny dla ucha.
Wreszcie warto zauważyć, że poziom ditheringu wpływa oczywiście na jego zdolność do korygowania całkowitych lub nie problemów z kwantyzacją.
Uwaga: dithering może nawet pomóc odzyskać poprawny sygnał, gdy redukcja rozdzielczości jest ekstremalna.
Na przykład, z ditheringiem możliwe będzie usłyszenie sinusoidy zmniejszonej z 24 bitów do 1 bitu, podczas gdy w przeciwnym razie mielibyśmy 100% zniekształcenia.
Jak uczynić dithering mniej słyszalnym?
Domyślnie, szum dodany przez dithering ma bardzo niski poziom.
Typowo mówi się o poziomie poniżej -100 dBFS.
Jednak nikt nie chce dodawać szumu do swojego mastera.
W związku z tym zaprojektowano szereg algorytmów ditheringowych, od najprostszych do najbardziej złożonych, aby uczynić efekt mniej słyszalnym, jednocześnie maksymalizując jego skuteczność.
Kiedy słuchamy dźwięku na niskim poziomie, jesteśmy znacznie bardziej wrażliwi na dźwięki znajdujące się, powiedzmy, między 800 a 5000 Hz. To są słynne krzywe Fletchera i Munsona.

Krótko mówiąc — wychodząc z tego zjawiska fizycznego, możemy filtrować szum ditheringowy:
- aby go osłabić w pasmach częstotliwości, na które jesteśmy bardziej wrażliwi;
- a wręcz przeciwnie, wzmocnić go w częstotliwościach, które słyszymy mniej łatwo.
Co daje nam na przykład profil szumu jak ten:

Mówimy o “shaping szumu” — innymi słowy, o filtracji szumu.
Jak widać, w niektórych obszarach szum ditheringowy jest znaczny, podczas gdy w innych pasmach częstotliwości jest znacznie słabszy.
Rezultat: w zakresie percepcji przez inżyniera dźwięku lub potencjalnie przez słuchacza, dithering jest mniej słyszalny, ale nadal odgrywa swoją rolę i w niektórych przypadkach jest nawet bardziej skuteczny niż “płaski” dithering, jak mogliśmy zobaczyć w poprzednim akapicie.
Jak zastosować dithering podczas masteringu?

Teraz, gdy wiesz prawie wszystko o ditheringu, pozostaje pytanie, jak go zastosować.
Z definicji, powinien być używany tylko raz na utwór: gdy wykonujesz końcowy eksport, redukując liczbę bitów.
W większości DAW możesz korzystać z wbudowanych narzędzi do ditheringu. Oto kilka przykładów:
- w Cubase dithering można wykonać za pomocą wtyczki UV22HR;
- w Ableton Live ustawienia ditheringu są dostępne podczas eksportu (patrz obrazek obok);
- to samo w Reaper i FL Studio, za pomocą pól wyboru;
- w Pro Tools wtyczki są dołączone do zarządzania ditheringiem;
- itd.
Później, zwłaszcza jeśli chcesz pójść dalej i trochę poeksperymentować z różnymi algorytmami, masz możliwość skorzystania z wtyczek od zewnętrznych producentów.
Nieco zaskakująco, na rynku nie ma ich jednak zbyt wiele.
Oczywiście, słynny iZotope Ozone zawiera bardzo potężny moduł do tego zadania:

Jednak jeśli chcesz naprawdę dedykowanego narzędzia, polecam zwrócić się ku PSP X-Dither, które jest bardzo skuteczne i łatwe w użyciu:

W praktyce, mówiąc, wbudowane funkcje w twoim DAW wystarczą w 99% przypadków.
Podsumowanie
Oto, teraz rozumiesz wszystko na temat ditheringu i do czego służy.
Nie zapomnij o dwóch najważniejszych punktach:
- przede wszystkim, stosuj dithering tylko raz na utwór
- i tylko wtedy, gdy zmniejszasz rozdzielczość w bitach.
Kliknij tutaj, aby kontynuować czytanie moich artykułów na temat masteringu.