SUONO&STUDIO

L’acustica delle sale di doppiaggio

L’acustica delle sale per la registrazione della voce è più complessa di quanto a prima vista possa apparire. Sebbene sia conoscenza diffusa il fatto che essa richieda un ambiente acusticamente trattato per la riduzione del tempo di riverberazione e del rumore ambientale, questi fattori di comune intuizione non sono sufficienti per ottenere delle registrazioni qualitativamente accettabili per applicazioni professionali. Troppi studi di doppiaggio esistenti sono purtroppo allestiti in maniera abbastanza sommaria, con elementi fonoassorbenti molto standard che in genere assorbono bene solo per frequenze al di sopra di circa 500 Hz. Ciò crea il problema le frequenze più basse di questa soglia sono in genere non curate, causando così fastidiosi rimbombi, eccessive code sonore, riflessioni sgradevoli: ossia succede che, per dirla in gergo, “si sente la stanza”. Sopratutto se lo speaker si allontana dal microfono si percepisce un “effetto scatola” assolutamente non piacevole e decisamente intollerabile in un ambiente destinato ad un lavoro hi-end. Si pensi ad un doppiaggio di un film, in cui sarà necessario ricreare con degli effetti virtuali sulla voce l’ambiente in cui si svolge la scena: è ovvio che questa voce deve essere “neutra”, ossia priva della sensazione di un qualunque locale, quindi tanto meno deve avere traccia dell’ambiente in cui è stata registrata. E’ perciò fondamentale capire innanzi tutto quali sono le caratteristiche della voce umana. Il segnale generato dalla laringe ha forma d'onda del tipo a dente di sega e, analizzato, presenta una struttura ad armonici d'ampiezza decrescente dal basso all'acuto (Fig. 1). Il suono laringeo risale il canale vocale, che si allarga in più cavità delle quali le più ampie sono quella faringea e quella buccale. Il volume di queste dipende dalle dimensioni anatomiche dell'individuo e dall'atteggiamento degli organi articolatori. Poiché al volume di ogni cavità corrisponde una determinata frequenza di risonanza, le armoniche la cui frequenza di vibrazione corrisponde alla frequenza di risonanza della cavità attraversata vengono amplificate. Dato che la forma e le dimensioni delle due cavità non sono nettamente determinate, l’amplificazione non si verifica per singole armoniche, ma per gruppi di armoniche chiamate “formanti del timbro” (Fig. 2). La forma e le dimensioni del canale vocale variano con continuità a seconda dei movimenti articolatori della mandibola, della lingua e delle labbra. Al loro variare variano le frequenze di risonanza delle due cavità e la voce assume strutture formantiche, cioè timbri, diverse. Quando i timbri si fanno sistematici essi possono assumere il valore di segnali utili alla comunicazione ed allora si parla di “vocali”. Per ottenere la neutralità della stanza e la sua non percepibilità, come discusso all’inizio dell’articolo, è fondamentale dunque che la stanza non abbia frequenze naturali che risuonino in corrispondenza delle formanti vocali, in quanto queste sensibili risonanze possono “colorare” acusticamente la voce dello speaker, lasciando memoria della stanza medesima. Ciò può essere ottenuto con due approcci differenti e da usarsi congiuntamente: il primo consiste nel progettare le dimensioni della stanza destinata a studio di doppiaggio in modo tale che essa non abbia frequenze di risonanza spiccate (ossia modi assiali o onde stazionarie coincidenti) in corrispondenza delle formanti vocali. Il secondo rimedio è il realizzare nella stanza delle strutture ad assorbimento accordato alle frequenze delle formanti vocali: come si vede dalla fig. 2 per alcuni suoni vocalici le formanti possono avere frequenze di risonanza e notevole energia ben al di sotto dei 500 Hz citati all’inizio; dunque è necessario inserire nell’ambiente trappole per i bassi che si spingano ad assorbire fino alle frequenza di 80 – 100 Hz. L’emissione dei suoni vocalici può essere preceduta, interrotta o seguita da occlusioni o restringimenti del canale vocale, determinati dai movimenti articolatori. Le fasi di apertura e di chiusura di questi movimenti fanno variare i volumi delle cavità di risonanza e di conseguenza del timbro delle vocali che li precedono e li seguono. Tali variazioni si integrano nel nostro orecchio con i silenzi, i rumori o le nasalizzazioni che a volta a volta le accompagnano e sono percepite come “consonanti”. Esse possono essere di molteplici tipologie, ma alcune di esse riescono a produrre notevole energia: esse sono le consonanti esplosive, rullanti e sibilanti. La stanza non deve aggiungere enfasi o esaltare questi tipi di consonanti, anzi deve in qualche modo attenuarle, sia con metodi di assorbimento alle relative frequenze, sia attraverso la cancellazione delle riflessioni (non parallelismo delle pareti e l’aggiunta di elementi diffusori del suono). Avendo ora chiare queste caratteristiche della voce, si evince che la progettazione dell’acustica di una sala per il doppiaggio, richiede particolari attenzioni che hanno origine da presupposti diversi da quelli seguiti per la registrazione della musica. E’ di particolare importanza la struttura della risposta all’impulso e l’alterazione della profondità di modulazione del segnale vocale (funzione di trasferimento della modulazione dalla bocca dello speaker al microfono di ripresa). La progettazione deve quindi seguire criteri basati sulla definizione della risposta all’impulso della sala che si vuole ottenere per la registrazione ottimale.

marco Fringuellino

Musicista ed Esperto di Acustica

Consulente della S-M di Pino Stillitano

www.S-M.it

 


Figura 1 (didascalia): segnale elettroglottografico: (a) forma d’onda, (b) spettro.

 


Figura 2 (didascalia): spettri delle formanti dei sette suoni vocalici della lingua italiana.