SUONO&STUDIO
L’acustica delle sale di
doppiaggio
L’acustica delle sale per la registrazione della
voce è più complessa di quanto a prima vista possa apparire. Sebbene sia
conoscenza diffusa il fatto che essa richieda un ambiente acusticamente
trattato per la riduzione del tempo di riverberazione e del rumore ambientale,
questi fattori di comune intuizione non sono sufficienti per ottenere delle
registrazioni qualitativamente accettabili per applicazioni professionali. Troppi
studi di doppiaggio esistenti sono purtroppo allestiti in maniera abbastanza
sommaria, con elementi fonoassorbenti molto standard che in genere assorbono
bene solo per frequenze al di sopra di circa 500 Hz. Ciò crea il problema le
frequenze più basse di questa soglia sono in genere non curate, causando così
fastidiosi rimbombi, eccessive code sonore, riflessioni sgradevoli: ossia
succede che, per dirla in gergo, “si sente la stanza”. Sopratutto se lo speaker
si allontana dal microfono si percepisce un “effetto scatola” assolutamente non
piacevole e decisamente intollerabile in un ambiente destinato ad un lavoro hi-end.
Si pensi ad un doppiaggio di un film, in cui sarà necessario ricreare con degli
effetti virtuali sulla voce l’ambiente in cui si svolge la scena: è ovvio che
questa voce deve essere “neutra”, ossia priva della sensazione di un qualunque
locale, quindi tanto meno deve avere traccia dell’ambiente in cui è stata
registrata. E’ perciò fondamentale capire innanzi tutto quali sono le
caratteristiche della voce umana. Il segnale generato dalla laringe ha forma
d'onda del tipo a dente di sega e, analizzato, presenta una struttura ad
armonici d'ampiezza decrescente dal basso all'acuto (Fig. 1). Il suono laringeo risale il canale vocale, che si allarga
in più cavità delle quali le più ampie sono quella faringea e quella buccale.
Il volume di queste dipende dalle dimensioni anatomiche dell'individuo e
dall'atteggiamento degli organi articolatori. Poiché al volume di ogni cavità
corrisponde una determinata frequenza di risonanza, le armoniche la cui
frequenza di vibrazione corrisponde alla frequenza di risonanza della cavità
attraversata vengono amplificate. Dato che la forma e le dimensioni delle due
cavità non sono nettamente determinate, l’amplificazione non si verifica per
singole armoniche, ma per gruppi di armoniche chiamate “formanti del timbro” (Fig. 2). La forma e le dimensioni del canale
vocale variano con continuità a seconda dei movimenti articolatori della
mandibola, della lingua e delle labbra. Al loro variare variano le frequenze di
risonanza delle due cavità e la voce assume strutture formantiche, cioè timbri,
diverse. Quando i timbri si fanno sistematici essi possono assumere il valore
di segnali utili alla comunicazione ed allora si parla di “vocali”. Per
ottenere la neutralità della stanza e la sua non percepibilità, come discusso
all’inizio dell’articolo, è fondamentale dunque che la stanza non abbia
frequenze naturali che risuonino in corrispondenza delle formanti vocali, in
quanto queste sensibili risonanze possono “colorare” acusticamente la voce
dello speaker, lasciando memoria della stanza medesima. Ciò può essere ottenuto
con due approcci differenti e da usarsi congiuntamente: il primo consiste nel
progettare le dimensioni della stanza destinata a studio di doppiaggio in modo
tale che essa non abbia frequenze di risonanza spiccate (ossia modi assiali o
onde stazionarie coincidenti) in corrispondenza delle formanti vocali. Il
secondo rimedio è il realizzare nella stanza delle strutture ad assorbimento
accordato alle frequenze delle formanti vocali: come si vede dalla fig. 2 per
alcuni suoni vocalici le formanti possono avere frequenze di risonanza e
notevole energia ben al di sotto dei 500 Hz citati all’inizio; dunque è
necessario inserire nell’ambiente trappole per i bassi che si spingano ad
assorbire fino alle frequenza di 80 – 100 Hz. L’emissione dei suoni vocalici
può essere preceduta, interrotta o seguita da occlusioni o restringimenti del
canale vocale, determinati dai movimenti articolatori. Le fasi di apertura e di
chiusura di questi movimenti fanno variare i volumi delle cavità di risonanza e
di conseguenza del timbro delle vocali che li precedono e li seguono. Tali
variazioni si integrano nel nostro orecchio con i silenzi, i rumori o le
nasalizzazioni che a volta a volta le accompagnano e sono percepite come
“consonanti”. Esse possono essere di molteplici tipologie, ma alcune di esse
riescono a produrre notevole energia: esse sono le consonanti esplosive,
rullanti e sibilanti. La stanza non deve aggiungere enfasi o esaltare questi
tipi di consonanti, anzi deve in qualche modo attenuarle, sia con metodi di
assorbimento alle relative frequenze, sia attraverso la cancellazione delle
riflessioni (non parallelismo delle pareti e l’aggiunta di elementi diffusori
del suono). Avendo ora chiare queste caratteristiche della voce, si evince che
la progettazione dell’acustica di una sala per il doppiaggio, richiede
particolari attenzioni che hanno origine da presupposti diversi da quelli
seguiti per la registrazione della musica. E’ di particolare importanza la
struttura della risposta all’impulso e l’alterazione della profondità di
modulazione del segnale vocale (funzione di trasferimento della modulazione
dalla bocca dello speaker al microfono di ripresa). La progettazione deve
quindi seguire criteri basati sulla definizione della risposta all’impulso
della sala che si vuole ottenere per la registrazione ottimale.
marco Fringuellino
Musicista ed Esperto di Acustica
Consulente della S-M di
www.S-M.it

Figura 1 (didascalia):
segnale elettroglottografico: (a) forma
d’onda, (b) spettro.

Figura 2 (didascalia): spettri delle formanti dei sette suoni vocalici della lingua italiana.