Audio 3D. Convolvo ergo sum

Written by Luigi Agostini on . Posted in Recording

Con il termine Convoluzione, in matematica, viene identificata un’operazione tra due funzioni diverse che ne genera una terza. La nuova funzione viene vista come la versione modificata di una delle due funzioni di partenza. La si può considerare una forma evoluta della correlazione incrociata. Dal punto di vista dinamico, per meglio dire temporale, la convoluzione di due funzioni A e B in pratica è la somma, ripetuta quante volte si vuole in istanti diversi, del valore della funzione A in un momento qualsiasi, per il valore di B in un momento precedente o successivo al momento qualsiasi, per la misura dell’intervallo di tempo che passa dal momento qualsiasi al momento precedente o successivo al momento qualsiasi.

Di Luigi Agostini

Qualsiasi pensiero abbiate formulato in questo momento, avete ragione, non avrei mai potuto fare il professore di matematica. Mi serviva la definizione precedente per farvi notare l’ennesima approssimazione (necessaria) insita nel concetto stesso che sta alla base della realizzazione di un riverbero a convoluzione.

Un po’ come nel campionamento, la qualità sta nel numero di istanti reali che registreremo per “applicarli” successivamente alla nostra forma d’onda nel caso della riverberazione simulata. Il fatto stesso di utilizzare una versione digitalizzata, e non potrebbe essere altrimenti, del campione audio utilizzato come risposta d’impulso dello spazio che vogliamo prendere come modello, rappresenta la prima approssimazione rispetto alla realtà. Una risposta d’impulso è una registrazione della riverberazione causata dalla conformazione e dalla costituzione di uno spazio acustico quando un impulso ideale viene riprodotto al suo interno. Un impulso ideale è un costrutto matematico, e non può esistere in realtà, dovrebbe essere infinitesimamente ristretto nel tempo. Pertanto, si devono utilizzare delle approssimazioni: il suono di una scintilla elettrica, lo scoppio di un palloncino, far schioccare le dita. Un’altra tecnica, il metodo di scansione sinusoidale, copre l’intera gamma di frequenze udibili generando una risposta d’impulso di miglior qualità. Si usa in pratica una sine sweep che viene poi sottoposta ad un processo di deconvoluzione per produrre una risposta di impulso. Questo approccio ha il vantaggio che tali suoni sono meno sensibili alla distorsione, tuttavia richiede una elaborazione più laboriosa e complicata per produrre una risposta all’impulso utilizzabile. Comunque sia, per applicare l’effetto di riverberazione, la risposta d’impulso digitalizzata diviene la funzione A del metodo suddetto. Il processo di convoluzione moltiplica ogni sample del file audio da elaborare (funzione B, anch’essa digitalizzata) con i sample del file risposta d’impulso. Approssimazione su approssimazione si arriva al risultato finale. Ma come suona? Abbastanza bene, lo sapete anche voi; ma da lì a dire che un riverbero a convoluzione sia la soluzione definitiva del problema, ne abbiamo ancora di strada da fare… Ma perché stiamo parlando di convoluzione, cosa ci combina con l’audio 3D? Abbiamo detto nei precedenti articoli che per simulare idealmente un ambiente tridimensionale si dovrebbero calcolare e riprodurre tutte le possibili riflessioni generate dall’infrangersi di varie forme d’onda su tutti gli ostacoli presenti nell’ambiente stesso: pareti, pavimento, soffitto ed eventuali colonne, mobili, vetri e tendaggi… Servirebbe un processore dedicato alla riverberazione dotato di una capacità di calcolo impensabile attualmente, perlomeno dal punto di vista pratico ed economico. Ecco com’è successo che la convoluzione, agli occhi furbi dei commerciali più accaniti, sia baluginata come la nuova gallina dalle uova d’oro. I vari sistemi che vantano “Three-dimensional virtual halls based on multi-sampled impulse responses” e “Impulse Response Library obtained by 3D auralization technique.”, cito come si autodefiniscono per non fare nomi, arrivano in realtà dopo la polvere. Il nostro, in quanto italianissimo, Angelo Farina, aveva già realizzato soluzioni molto più potenti e complete più di dieci anni fa. Vi invito a visitare la sua pagina web a questo indirizzo .

Vi renderete subito conto che il professore, con i suoi Aurora e Ramsete, sta percorrendo una viaparallela al mainstream commerciale (andate nell’area pubblica del sito e provate i plugin che mette a disposizione gratuitamente) che pur inglobando da tempo il processo di convoluzione lo demistifica e lo sottomette alle leggi della fisica, alla realtà dei fatti, affrontando il problema della simulazione 3D alla radice, cioè tenendo conto che sempre di una simulazione si tratta.

La strada da percorrere, come cerco di far capire da sempre a tutti gli sviluppatori con cui ho cercato di lavorare da quindici anni a questa parte, è quella che prevede un approccio più scientifico al problema, che, mantenendo un atteggiamento comprensivo nei confronti degli artisti dotati di una formazione di diverso stampo culturale (interfaccia user friendly), possa arrivare a fornire una sorta di CAD audio in tempo reale. Tale sistema, per forza di cose hardware più software, dovrà tener conto per quanto possibile di tutti gli elementi che costituiscono il “Suono” di un ambiente, limitando al massimo le approssimazioni inevitabili dovute ai limiti della tecnologia del momento. Una sorta di CATT o EASE in tempo reale che metta a disposizione anche, scusate l’autocitazione, una interfaccia veloce e semplice da usare come quelle che sto producendo ultimamente, con creazione ed editing delle traiettorie virtuali, time line e markers, compatibilità ASIO e ReWire, export in tutti i formati più utili 3D e non, etc. etc.

Se volete approfondire l’argomento fate una visitina alla pagina che raccoglie tutti i paper scritti da Angelo

e date un’occhiata alle date degli stessi. Meno esterofilia ragazzi, sul muro davanti alla mia vecchia sede in centro a Livorno in via delle Galere, chi di voi è mai venuto a trovarmi lo sa, campeggiava una scritta fatta con le bombolette spray:

“Spengete la TV, accendete il cervello”. Arrogante ma vera, l’ho letta tante di quelle volte che forse proprio per questo, sto ancora cercando di tenerlo acceso più tempo che posso…

Tags: ,

Trackback from your site.

Comments (2)

  • Massimo Liverani

    |

    Ottimo articolo, una domanda: il bellissimo plugin acoustic mirrror della Sony (ex Sonic Foundry) funziona a convoluzione secondo te? io credo di si perchè basandosi proprio sugli sweep applica un algoritmo su di un altro. Comunque, sono dell’ idea invece che saresti stato un ottimo professore di matematica. Complimenti ancora. Massimo Liverani

    Reply

    • Enrico Cosimi

      |

      bisogna vedere: se acoustic mirror ti permette di scegliere tra IR diverse, allora funziona per convoluzione, altrimenti fa solo riferimento a algoritmi preconfigurati (senza che questo sembri denigratorio, eh?)
      Luigi è un grande… :-)

      Reply

Leave a comment

Inserisci il numero mancante: *