venerdì 19 Aprile 2024

Basi fisiologiche della stereofonia

Prima di occuparci dei problemi riguardanti la riproduzione e la ripresa stereofonica è bene familiarizzare con le proprietà dell’udito, da cui dipende la prospettiva dell’ascolto. Per comprendere la tecnica stereofonica è indispensabile sapere in quale modo noi possiamo localizzare uditivamente una sorgente sonora. La facoltà di localizzare le sorgenti sonore con le orecchie è un fatto naturale per uomini sani. Come un radar, il nostro orecchio localizza una sorgente sonora mediante la sua direzione e la sua distanza fornendo le tre coordinate nello spazio. Per quanto riguarda la distanza non è possibile valutarla con un solo orecchio. Sebbene la sua determinazione non sia precisa, noi veniamo guidati istintivamente dall’intensità del suono perché siamo in grado di valutare soggettivamente l’intensità sonora di una sorgente. Nella valutazione della distanza con un solo orecchio siamo guidati anche dal contributo del suono riverberato rispetto al suono diretto e dal contenuto spettrale del suono, in quanto la predominanza di suoni acuti caratterizza le sorgenti molto ravvicinate. Come succede per un altro importante senso che è la vista, l’udito si espleta tramite due recettori ed un “sistema centralizzato” costituito dal cervello con tutte le sue emanazioni ed i suoi prolungamenti. Analogamente alla vista, dunque, anche per l’udito la sensazione della posizione dello stimolo deve essere contenuta in massima parte nella diversità degli stimoli che arrivano agli orecchi destro e sinistro che chiameremo D ed S rispettivamente. Analizziamo le differenze fra gli stimoli D ed S.
Figura 5_5

Se consideriamo, come è giusto, i percorsi più brevi che congiungono la sorgente s con le orecchie (cioè i raggi diretti) vediamo che D ed S, per quel che riguarda i tratti rettilinei, costituiscono i lati maggiori di un triangolo isoscele, per cui sono uguali. I segnali acustici che arrivano alle orecchie, in altre parole, sono uguali nei punti a e b. Mentre però il segnale D ha raggiunto l’orecchio destro, il segnale S deve ancora percorrere il tratto misto a – c. È nel percorso a – c che il segnale S si differenzierà dal segnale D. Per quantificare, o almeno qualificare, le differenze fra D ed S dobbiamo fare delle ipotesi: ipotizziamo, per semplicità, che la testa sia una sfera di 17 cm di diametro e che la sorgente s, posta su un piano orizzontale che contiene le orecchie, formi un angolo di 30° con la direzione frontale (cioè quella del naso). Il segnale S rispetto a D dovrà subire:

  1. attenuazione (per cui si avrà differenza di intensità fra S e D)
  2. ritardo
  3. sfasamento
  4. diffrazione

Sebbene questi fenomeni siano strettamente interdipendenti, li analizzeremo di seguito come fenomeni separati.

  1. Attenuazione: non c’è dubbio che l’attenuazione delle onde acustiche è funzione (anche se non lineare) della lunghezza del percorso, dato che un percorso più lungo, in linea di principio, attenua di più. La teoria non è proponibile per la individuazione di una sorgente posta alla distanza di qualche metro dall’ascoltatore che emetta una nota di frequenza molto bassa (es. 17 Hz). La attenuazione dovuta a 8,5 centimetri è troppo piccola perché l’udito umano possa utilizzarla per la localizzazione della sorgente. D’altra parte la misura della testa (17 cm di diametro è troppo piccola rispetto ai 20 m della lunghezza d’onda della nota a 17 Hz, per cui non esiste nessun effetto schermante sensibile (diffrazione) da parte della testa. A frequenze medio alte l’effetto della differenza si fa più consistente. Per una nota di 1700 Hz si ha che la lunghezza d’onda è dell’ordine di grandezza della misura della testa per cui quest’ultima produce un effetto parziale di schermo (diffrazione) nei riguardi dell’orecchio sinistro. L’onda che arriva all’orecchio sinistro è notevolmente più attenuata di quella che arriva all’orecchio destro. Siccome per frequenze più alte l’effetto schermante della testa è maggiore, si può concludere che da frequenze di poco inferiori a 1700 Hz in poi (fino all’estremo superiore della banda) il fenomeno della differenza di intensità deve avere molta importanza nella determinazione della posizione della sorgente. Non dimentichiamo che la stereofonia in buona parte si costruisce agendo proprio sulla intensità.
  2. Ritardo: Siccome l’onda acustica nell’aria percorre 340 m/s, per percorrere 8,5 cm impiega 250 µS (microsecondi). Questo tempo, che scritto nella carta sembra essere molto piccolo, è però facilmente riconoscibile dall’udito umano come differenza del tempo di arrivo di uno stimolo alle due orecchie. Prova ne sia che se due stimoli arrivano ai padiglioni di una cuffia stereo con pari intensità e una differenza di tempo nulla la sorgente virtuale viene individuata frontalmente. Un ritardo di un solo microsecondo dell’arrivo dello stimolo sinistro rispetto a quello destro fa spostare leggermente verso destra la posizione della sorgente virtuale. Ciò succede su tutta la gamma delle frequenze udibili perché il fenomeno si verifica sia assumendo come stimolo un “clic” che note con frequenze molto basse. Per una nota di 17 Hz si verifica, in particolare, che all’inizio dell’ascolto di una sorgente posta a qualche metro dall’ascoltatore la sua posizione viene individuata; perdurando la nota, la posizione della sorgente viene persa come percezione dall’ascoltatore. La sorgente, addirittura, può ruotare (lentamente) attorno all’ascoltatore senza che questi se ne accorga. Al contrario l’ascoltatore può sempre individuarla se la nota viene frequentemente interrotta e ciò dimostra che l’elemento aggiunto dalle interruzioni è il tempo di arrivo dei due fronti d’onda.
  3. Sfasamento: una differenza di percorso deve necessariamente produrre l’effetto di una differenza di fase fra i due segnali che arrivano alle orecchie. Nel caso ipotizzato di una differenza di percorso in aria di 8,5 cm, gli effetti saranno impercettibili per frequenze molto basse, notevoli per frequenze medie e inattendibili (ai fini della determinazione della posizione della sorgente) per note a frequenza molto elevata. Per 17 Hz (limite inferiore di frequenza udibile) alle orecchie arrivano pressioni praticamente uguali istante per istante perché le sinusoidi con cui dette pressioni si rappresentano hanno una lunghezza d’onda di circa venti metri e sono sfasate di 8,5 cm: il rapporto è tanto grande che è impossibile fare un disegno esplicativo. Per 1000 Hz si ha che la lunghezza d’onda è di 34 centimetri.
Figura 5_6
  1. Nella figura si vede con chiarezza che quando la sorgente, come nel nostro caso, è spostata di 30°, le orecchie sono sottoposte nello stesso istante a pressioni diverse. Diversità ancora maggiori si verificano per uno spostamento angolare della sorgente superiore a 30°. A 90°, in particolare, la differenza di pressione è la più grande possibile e si riduce a zero per una posizione frontale della sorgente. Intorno a 1000 Hz, dunque, vi sono elementi validi perché con l’udito si possa individuare la posizione della sorgente a causa della differenza di fase. Man mano che la frequenza si abbassa (e quindi cresce la lunghezza d’onda) questi elementi, come abbiamo già visto, si affievoliscono. Se la frequenza sale, per es. fino a 17 KHz, la individuazione della sorgente tramite la differenza di fase diventa impossibile perché per una rotazione della testa da 0° a 30° rispetto alla sorgente, per ben 5 volte i segnali arrivano in fase ai due orecchi per cui per altrettante volte la sorgente appare centrale pur essendo effettivamente centrale una sola volta. Il riscontro si può fare sia tenendo presente che in 8,5 cm di differenza di percorso vi sono comprese 4 lunghezze d’onda intere (lunghezza d’onda=2 cm.), sia analizzando la figura.
Figura 5_7

La differenza di fase, quindi, funziona bene solo per frequenze medio-basse; non funziona né per frequenze basse né per frequenze medio alte ed alte.

  1. Timbro. Il timbro influisce certamente nel differenziare le caratteristiche dei due segnali che arrivano alle orecchie quando la sorgente non centrale. Ciò deriva dal fatto che uno dei due orecchi è mascherato dalla testa che abbiamo assimilato ad una sfera di 17 cm di diametro. L’azione di schermo è, ovviamente, diversa al variare della frequenza. I casi limite sono:

17 Hz: essendo la lunghezza d’onda molto maggiore del diametro della testa, questa viene totalmente aggirata da un’onda acustica di 17 Hz, per cui si può dire che in questa circostanza la testa non scherma l’orecchio non in linea con la sorgente.

17 KHz: Essendo la lunghezza d’onda molto minore del diametro della testa, questa riflette (secondo le sue caratteristiche) l’onda incidente su di essa ed in parte la diffrange. Ben poca parte dell’energia proveniente direttamente dalla sorgente può arrivare all’orecchio nascosto tramite diffrazione. Fra i due casi limite vi è una infinità di valori di lunghezza d’onda ed altrettante “figure” di diffrazione cioè “mappe” diverse di distribuzione dell’energia acustica attorno alla testa per quella determinata frequenza. Per una sorgente che generi un segnale composito, come avviene sempre nella realtà, ai due orecchi devono arrivare segnali diversi per timbro. Non si può trascurare che la testa non è sferica, come abbiamo ammesso per semplicità, e che esistono i padiglioni auricolari per cui certamente l’energia acustica che arriva ad ogni meato uditivo deve dipendere sia dalla posizione della sorgente che dalla frequenza. Delle quattro entità per cui lo stimolo D differisce dallo stimolo S per posizioni non centrali della sorgente non ve ne è una che sia più importante dell’altra in assoluto anche se si può dire che il ritardo influisce su tutta la gamma acustica. Per certe composizioni armoniche prevale magari la differenza di fase mentre per altre prevale la differenza di timbro o la differenza di intensità. La realtà è che l’udito umano utilizza sempre contemporaneamente tutti gli strumenti che ha a disposizione, e lo può fare perché ascolta sempre composizioni spettrali che si estendono su una larga parte della banda udibile. Ciò è sempre meno vero man mano che l’uomo costruisce macchine che emettono segnali diversi e particolari come le macchine elettroniche, ma non bisogna dimenticare che il sistema uditivo si è evoluto in molti milioni di anni a contatto con la natura, immerso nei suoni che questa continuamente gli propone. La maggior parte delle prove e delle indagini sul funzionamento dell’udito si fa utilizzando note pure con l’intento di isolare certi meccanismi, ma nella considerazione dei risultati non si deve dimenticare che le note pure sono un prodotto della civiltà a cui l’udito umano non è certamente abituato.