Audio 3D. Il “viaggio allucinante” del riverbero

Written by Luigi Agostini on . Posted in Recording

Riprendiamo a parlare di registrazione e mastering in 3D dopo “l’avvento” in ambito commerciale, che vi ho segnalato nell’articolo precedente, del suono “nell’emisfero alto”(sic). Per ricapitolare velocemente, vorrei addentrarmi con voi nei meandri del percorso DSP che un segnale mono deve compiere per acquisire una posizione virtuale nello spazio condiviso con i suoi ascoltatori.

Di Luigi Agostini

I meno giovani tra di voi ricorderanno forse il film Viaggio allucinante (Fantastic Voyage, 1966) diretto da Richard Fleisher. Fate finta di esser stati ridotti alla stessa dimensione di un elettrone e aiutatemi a inseguire il nostro segnale all’interno dei circuiti elettronici che tanto amiamo…

Il primo evento non è una sorpresa, abbiamo già parlato della clonazione del segnale in più copie da assegnare ad un certo numero di diffusori disposti su due livelli di altezza, come minimo. Ogni diffusore cambierà continuamente il volume di emissione del clone a lui assegnato in base alla posizione virtuale assegnata al segnale originale per mezzo dell’interfaccia utente. Lo stesso diffusore riceverà continuamente anche le informazioni temporali necessarie per correggere la sua posizione rispetto all’ascoltatore (ITD e Delay vari).

Se adesso guardate in alto alle vostre spalle potete vedere un semplice filtro posizionato a monte del percorso: il suo compito è quello di tener conto delle variazioni in frequenza causate dalla velocità virtuale impressa al malcapitato segnale (effetto Doppler). Ma la spazializzazione che ascolteremo a questo punto del viaggio, pur efficace e preferibile nella maggior parte delle situazioni in cui l’ambiente sia già molto riverberato, risulterà al contempo fredda ed irreale. Questo perché istintivamente siamo portati a confrontare il ricordo di una sensazione provata realmente con una simulazione. Oltretutto, una simulazione digitale, quindi per forza di cose approssimata e limitata.

La nostra sorgente audio, nella realtà, era una forma d’onda molto complessa, con il suo bel transiente d’attacco, le prime riflessioni e la riverberazione principale e quella diffusa causate dalla presenza delle pareti, del soffitto e del pavimento, oppure dal terreno e dagli ostacoli che incontrava in campo aperto.

Ora che l’abbiamo estrusa, trafilata, frammentata in 48000 (se va bene) scalini congelati nel tempo e successivamente elaborata attraverso i funambolici percorsi dei più astrusi algoritmi DSP partoriti da menti contorte (la mia per prima…), del suo fascino originale resta ben poco: è ormai l’ombra di se stessa, un surrogato digitale appunto.

L’unica possibilità che abbiamo è cercare di creare virtualmente parte delle riflessioni che la sorgente avrebbe causato muovendosi in un ambiente reale simile a quello fornito dalla nostra interfaccia utente (leggi software di gestione). Abbiamo soltanto un piccolissimo problema in termini di risorse a nostra disposizione. Le riflessioni da riprodurre sono nell’ordine delle migliaia soltanto nella parte diffusa, per non parlare della completa casualità di gran parte di queste…

Il nostro segnale audio, a questo punto del suo “viaggio allucinante”, diventerà la pietra di paragone con cui ricreare il maggior numero possibile di copie diverse per intensità e tempo di emissione (volume e delay). Tali differenze saranno determinate dalla dimensione dell’ambiente, dai materiali che rivestono o costituiscono pareti, soffitto e pavimento, dalla posizione nello spazio della sorgente e dell’ascoltatore, e dalla lunghezza dei percorsi che le copie effettueranno per raggiungere le orecchie dell’ascoltatore. Praticamente, nella realtà non si prova nemmeno a contare il numero di riflessioni generate da una vibrazione acustica, sono quasi infinite e dipendono inoltre dalle capacità uditive del soggetto ascoltatore.

Per capirci: quanti di voi sanno giocare a biliardo possono paragonare la componente principale del suono che raggiunge per prima l’ascoltatore ad un tiro diretto sul bersaglio, le prime riflessioni a un colpo di sponda, le seconde alla doppia sponda e così via immaginando fino ad esaurimento quasi totale dell’energia originale della sorgente audio. Quasi, perché la soglia standardizzata per l’identificazione del tempo di riverbero non è “meno infinito” ma ­60 db. Il riverbero in pratica è il tempo che deve trascorrere perché il livello di un suono decada di 60 dB all’interno di un ambiente chiuso. Prima approssimazione, accettabile, ma soltanto la prima di una lunga lista.

Seconda approssimazione: l’orecchio umano non riesce a distinguere due suoni se essi sono percepiti a meno di 0.1 secondi di distanza uno dall’altro. (Ma le vibrazioni non interessano anche il tatto?).

Terza approssimazione: la velocità del suono nell’aria a 20 °C è di circa 340 m/s e questo valore viene assunto come default. Circa e solo a quella temperatura, senza contare umidità e inquinamento.

Quarta approssimazione: la fonte sonora e l’ascoltatore dovrebbero essere nello stesso punto di fronte all’ostacolo che crea le riflessioni. No comment.

Quinta approssimazione: di conseguenza, in uno spazio aperto si può parlare di riverbero solo quando l’ostacolo si trova a meno di 17 metri dalla fonte del suono, perché il percorso dell’onda sonora (dalla fonte all’ostacolo e ritorno) sarà inferiore a 34 metri e il suono impiegherà meno di un decimo di secondo per tornare al punto di partenza confondendosi nell’orecchio dell’ascoltatore con il suono originario. Se l’ostacolo si trova a più di 17 metri di distanza dalla fonte, allora suono diretto e suono riflesso distano tra loro di più di 1/10 di secondo risultando quindi come due suoni distinti (eco). Ma in uno spazio chiuso ed ampio, come ad esempio una chiesa, si possono udire le innumerevoli riflessioni delle pareti lunghe a volte anche più di 17 metri che decrescono di intensità fino al silenzio. Il riverbero, in realtà, è un fenomeno complesso e affascinante che sfugge alle capacità di calcolo e razionalizzazione dell’uomo e dei suoi computer… pensate adesso alla complessità di realizzazione di una simulazione che includa un effetto anche soltanto simile ad un riverbero tridimensionale.

Vedremo nel prossimo articolo quali approssimazioni sono state accettate e utilizzate nel lexicon, nel senso latino del termine, di tutti i produttori di riverberi digitali 3D, e cominceremo a parlare anche di convoluzione…

Tags: , , ,

Trackback from your site.

Comments (5)

  • Lorenzo

    |

    Moooooolto molto molto molto interessante.
    Una domanda: nei parametri di moltissimi riverberi è presente il dosaggio delle “early reflections”; ma cosa sono, a livello fisico, queste early reflections?

    Reply

    • Enrico Cosimi

      |

      le “early reflections” sono le “prime riflessioni”, cioè l’insieme dei primi rimbalzi che l’energia prodotta dalla sorgente sonora realizza sbattendo contro le pareti della stanza in cui ci si trova; ovviamente, la loro quantità è definita arbitrariamente negli algoritmi di riverbero, permettendo così di differenziare la loro presenza/ampiezza/distanza dal segnale originale in maniera indipendente da quello che poi è la coda di riverbero vera e propria (composta dalla somma assai più densa di tutti gli altri rimbalzi…)

      fai un esperimento, meglio se con un segnale “secco e corto”: prova a regolare una reverb time bello significativo – diciamo 2.5 secondi – e metti a ZERO il livello delle early reflections; il risultato è abbastanza innaturale… appena finisce il suono originale, hai la coda di riverbero densa; adesso, prova a mettere un livello significativo per le early reflections e regolale ad una “distanza” di 100-200 millisecond; noterai che prima senti il suono secco, poi dopo una breve pausa arrivano le early reflections e poi la coda di riverbero vera e propria.

      non hai impressione, in questo secondo esempio, che la stanza si sia ampliata?

      ovvio che, se vuoi un effetto particolare e non convenzionale, non sei obbligato a lavorare con le early reflections; e altrettanto ovvio è che se usi SOLO le early reflections, annullando la coda vera e propria di riverberazione, puoi rinforzare il suono dandogli una “short chamber” molto interessante per determinati tipi di esecuzione

      insomma, il realismo interessa fino a un certo punto… 😉

      Reply

      • Lorenzo

        |

        mille grazie! proverò!

        Reply

        • Luigi Agostini

          |

          Grazie Lorenzo,

          per complementare il prezioso contributo di Enrico, vorrei aggiungere che il tempo impiegato dalle prime riflessioni per raggiungere le orecchie dell’ascoltatore dipende, oltre che dalle dimensioni dell’ambiente, anche dai materiali che costituiscono o ricoprono le pareti, il pavimento e il soffitto. Forse l’approssimazione più grossolana che siamo forzati ad accettare per salvaguardare la “vendibilità” di un riverbero digitale sta proprio nell’assumere che tutte le superfici virtuali siano dello stesso materiale. Prova a pensare quanto siano diverse due stanze con le stesse dimensioni, a livello di sonorità, se una di queste è completamente vuota e l’altra è arredata (e magari con tendaggi, tappezzeria e specchi vari…). Per non parlare delle forme, quanti di noi ascoltano musica in un cubo perfetto in realtà? Comunque alcuni plug-in e outboard hardware di alto livello offrono talvolta un minimo di controllo su tali aspetti della riverberazione, e anche nei miei prodotti, quando la capacità DSP che ho disposizione me lo permette, cerco sempre di legare il movimento 3D della sorgente nello spazio virtuale alla variazione delle prime riflessioni in intensità e tempo di arrivo anche in funzione dell’assorbimento dei materiali… per le forme irregolari degli ambienti, purtroppo, è ancora troppo presto, perlomeno in tempo reale… A disposizione se hai altre domande, ciao, Luigi

          Reply

          • Lorenzo

            |

            Grazie mille per la risposta.
            😀

            Reply

Leave a comment

Inserisci il numero mancante: *

ga('send', 'pageview');