Audio 3D. Convolvo ergo sum

Written by Luigi Agostini on 10 agosto 2012. Posted in Recording

Con il termine Convoluzione, in matematica, viene identificata un’operazione tra due funzioni diverse che ne genera una terza. La nuova funzione viene vista come la versione modificata di una delle due funzioni di partenza. La si può considerare una forma evoluta della correlazione incrociata. Dal punto di vista dinamico, per meglio dire temporale, la convoluzione di due funzioni A e B in pratica è la somma, ripetuta quante volte si vuole in istanti diversi, del valore della funzione A in un momento qualsiasi, per il valore di B in un momento precedente o successivo al momento qualsiasi, per la misura dell’intervallo di tempo che passa dal momento qualsiasi al momento precedente o successivo al momento qualsiasi.

Di Luigi Agostini

Qualsiasi pensiero abbiate formulato in questo momento, avete ragione, non avrei mai potuto fare il professore di matematica. Mi serviva la definizione precedente per farvi notare l’ennesima approssimazione (necessaria) insita nel concetto stesso che sta alla base della realizzazione di un riverbero a convoluzione.

Un po’ come nel campionamento, la qualità sta nel numero di istanti reali che registreremo per “applicarli” successivamente alla nostra forma d’onda nel caso della riverberazione simulata. Il fatto stesso di utilizzare una versione digitalizzata, e non potrebbe essere altrimenti, del campione audio utilizzato come risposta d’impulso dello spazio che vogliamo prendere come modello, rappresenta la prima approssimazione rispetto alla realtà. Una risposta d’impulso è una registrazione della riverberazione causata dalla conformazione e dalla costituzione di uno spazio acustico quando un impulso ideale viene riprodotto al suo interno. Un impulso ideale è un costrutto matematico, e non può esistere in realtà, dovrebbe essere infinitesimamente ristretto nel tempo. Pertanto, si devono utilizzare delle approssimazioni: il suono di una scintilla elettrica, lo scoppio di un palloncino, far schioccare le dita. Un’altra tecnica, il metodo di scansione sinusoidale, copre l’intera gamma di frequenze udibili generando una risposta d’impulso di miglior qualità. Si usa in pratica una sine sweep che viene poi sottoposta ad un processo di deconvoluzione per produrre una risposta di impulso. Questo approccio ha il vantaggio che tali suoni sono meno sensibili alla distorsione, tuttavia richiede una elaborazione più laboriosa e complicata per produrre una risposta all’impulso utilizzabile. Comunque sia, per applicare l’effetto di riverberazione, la risposta d’impulso digitalizzata diviene la funzione A del metodo suddetto. Il processo di convoluzione moltiplica ogni sample del file audio da elaborare (funzione B, anch’essa digitalizzata) con i sample del file risposta d’impulso. Approssimazione su approssimazione si arriva al risultato finale. Ma come suona? Abbastanza bene, lo sapete anche voi; ma da lì a dire che un riverbero a convoluzione sia la soluzione definitiva del problema, ne abbiamo ancora di strada da fare… Ma perché stiamo parlando di convoluzione, cosa ci combina con l’audio 3D? Abbiamo detto nei precedenti articoli che per simulare idealmente un ambiente tridimensionale si dovrebbero calcolare e riprodurre tutte le possibili riflessioni generate dall’infrangersi di varie forme d’onda su tutti gli ostacoli presenti nell’ambiente stesso: pareti, pavimento, soffitto ed eventuali colonne, mobili, vetri e tendaggi… Servirebbe un processore dedicato alla riverberazione dotato di una capacità di calcolo impensabile attualmente, perlomeno dal punto di vista pratico ed economico. Ecco com’è successo che la convoluzione, agli occhi furbi dei commerciali più accaniti, sia baluginata come la nuova gallina dalle uova d’oro. I vari sistemi che vantano “Three-dimensional virtual halls based on multi-sampled impulse responses” e “Impulse Response Library obtained by 3D auralization technique.”, cito come si autodefiniscono per non fare nomi, arrivano in realtà dopo la polvere. Il nostro, in quanto italianissimo, Angelo Farina, aveva già realizzato soluzioni molto più potenti e complete più di dieci anni fa. Vi invito a visitare la sua pagina web a questo indirizzo .

Vi renderete subito conto che il professore, con i suoi Aurora e Ramsete, sta percorrendo una viaparallela al mainstream commerciale (andate nell’area pubblica del sito e provate i plugin che mette a disposizione gratuitamente) che pur inglobando da tempo il processo di convoluzione lo demistifica e lo sottomette alle leggi della fisica, alla realtà dei fatti, affrontando il problema della simulazione 3D alla radice, cioè tenendo conto che sempre di una simulazione si tratta.

La strada da percorrere, come cerco di far capire da sempre a tutti gli sviluppatori con cui ho cercato di lavorare da quindici anni a questa parte, è quella che prevede un approccio più scientifico al problema, che, mantenendo un atteggiamento comprensivo nei confronti degli artisti dotati di una formazione di diverso stampo culturale (interfaccia user friendly), possa arrivare a fornire una sorta di CAD audio in tempo reale. Tale sistema, per forza di cose hardware più software, dovrà tener conto per quanto possibile di tutti gli elementi che costituiscono il “Suono” di un ambiente, limitando al massimo le approssimazioni inevitabili dovute ai limiti della tecnologia del momento. Una sorta di CATT o EASE in tempo reale che metta a disposizione anche, scusate l’autocitazione, una interfaccia veloce e semplice da usare come quelle che sto producendo ultimamente, con creazione ed editing delle traiettorie virtuali, time line e markers, compatibilità ASIO e ReWire, export in tutti i formati più utili 3D e non, etc. etc.

Se volete approfondire l’argomento fate una visitina alla pagina che raccoglie tutti i paper scritti da Angelo…

e date un’occhiata alle date degli stessi. Meno esterofilia ragazzi, sul muro davanti alla mia vecchia sede in centro a Livorno in via delle Galere, chi di voi è mai venuto a trovarmi lo sa, campeggiava una scritta fatta con le bombolette spray:

“Spengete la TV, accendete il cervello”. Arrogante ma vera, l’ho letta tante di quelle volte che forse proprio per questo, sto ancora cercando di tenerlo acceso più tempo che posso…

Tags: audio 3D, Convoluzione

Trackback from your site.

Comments (2)

Massimo Liverani

10 agosto 2012 at 10:00 | #

Ottimo articolo, una domanda: il bellissimo plugin acoustic mirrror della Sony (ex Sonic Foundry) funziona a convoluzione secondo te? io credo di si perchè basandosi proprio sugli sweep applica un algoritmo su di un altro. Comunque, sono dell’ idea invece che saresti stato un ottimo professore di matematica. Complimenti ancora. Massimo Liverani

Reply
- Enrico Cosimi
  
  10 agosto 2012 at 10:51 | #
  
  bisogna vedere: se acoustic mirror ti permette di scegliere tra IR diverse, allora funziona per convoluzione, altrimenti fa solo riferimento a algoritmi preconfigurati (senza che questo sembri denigratorio, eh?)
  Luigi è un grande…
  
  Reply

Tag più popolari

Nuovi Articoli

Archivio Articoli

Ultimi commenti

Luca Sasdelli

13 marzo 2024 | #

E dopo ben dieci anni, allungo il thread!

La String Melody (Logan/Hohner) deve la sua qualità leggendaria a due fattori: il primo è la presenza di un generatore di inviluppo AR per ogni nota (sic!), in contrasto con lo standard Eminent/ARP che usava un unico EG per tutto, con la facoltà nell’ARP Omni2 di scegliere il trigger ad ogni pressione di tasto (per uno dei peggiori effetti esistenti, musicalmente parlando).

Il secondo fattore è il chorus: a tre linee di ritardo come Eminent/ARP, però pilotato in modo molto intelligente, che descrivo qui di seguito.

Eminent e ARP, su Eminent-310, Solina, Omni e Quadra, usano tre linee di ritardo BBD, ciascuna con un proprio LFO e i tre LFO (triangolari) sono tarati su periodi primi fra loro, per cui in teoria (e con taratura perfetta) non presentano ciclicità. Il sistema quindi si basa sulla ricerca della massima casualità.

Logan/Hohner invece usa un sistema di LFO molto particolare: sono due oscillatori sinusoidali trifase, le cui onde a 0°, 120° e 240° vengono sommate e distribuite in modo ineguale fra le tre BBD. In questo modo, ognuna delle linee di ritardo è modulata in modo armonico con le altre due, creando un mix decisamente più amalgamato rispetto a Eminent.

Nicola

7 marzo 2024 | #

gentile Enrico, grazie per il suggerimento la KeySteppro adesso mi permette di pilotare bene il vecchio ms20, ho solo un ultimo problema;

l’ms20 risponde tutto 1semitono sotto, devo quindi re-intonarlo, potrebbe essere normale? (o imputabile ai cavi “2metri”)

Nicola

6 marzo 2024 | #

graziemille!

enrico cosimi

23 gennaio 2024 | #

no, su apple non gira più dai tempi del 10.5;
su windows gira ancora…
in ogni caso, le quotazioni sono drogate dalla rarità

daniele

23 gennaio 2024 | #

Salve Prof,

ha senso oggi l’acquisto di un nord modular G2?
I prezzi vanno dai 1500 € a quasi 3000 €, l’editor non versione demo gira sui sistemi operativi attuali?

grazie

Enrico Cosimi

19 novembre 2023 | #

no, la larghezza di due oscillatori indirizzati in due canali di uscita ce l’hai solo – appunto – con due canali di uscita

Enrico Cosimi

19 novembre 2023 | #

eh eh, per comprare macchine più complicate c’è sempre tempo… 😀

Enrico Cosimi

19 novembre 2023 | #

nessun rischio

Enrico Cosimi

19 novembre 2023 | #

no, hai bisogno dell’hardware clavia

Enrico Cosimi

19 novembre 2023 | #

hydrasynth explorer

Enrico Cosimi

19 novembre 2023 | #

io direi hydrasynth explorer

Enrico Cosimi

19 novembre 2023 | #

in realtà, DOVREBBE essere stata superata: hanno aggiunto un ulteriore parametro di gain, ma nonostante questo comunque non ti assordi…
😉

Enrico Cosimi

19 novembre 2023 | #

non ho capito molto: la traccia midi contiene le note che devono essere eseguite dallo strumento; se l’apparecchio NON supporto l’audio-over-midi (perché lavora nel dominio analogico), è necessario avere ANCHE una traccia audio che riceve il segnale frutto dell’esecuzione midi

ovviamente, dopo la registrazione, occorrerà riallineare manualmente la traccia audio alla traccia midi perché – inevitabilmente – risulterà IN RITARDO rispetto al midi..

Enrico Cosimi

19 novembre 2023 | #

se vai nei parametri GLOBAL del M-32, puoi decidere che l’uscita ASSIGN emetta il Clock convertito dal MIDI ricevuto; a quel punto, usi il collegamento ASSIGN OUT – ADVANCE IN per clockare la DFAM (devi solo premere RUN sulla DFAM per automatizzare la partenza…)

Enrico Cosimi

19 novembre 2023 | #

verifica con l’editor librarian gratuito COSA ALTRO C’E’ dentro la macchina!!!
Tira fuori tutto, aggiungi il tuo file e spara nuovamente dentro il banco

Enrico Cosimi

19 novembre 2023 | #

devi prendere l’uscita PITCH della Keystep e collegarla all’ingresso KYBD VCO1+VCO2 IN della patchbay, praticamente “sotto” al potenziometro di VOLUME

Enrico Cosimi

19 novembre 2023 | #

non ho capito molto: probabilmente, hai solo condiviso i messaggi di start/stop MIDI ma le due macchine continuano a viaggiare ciascuna con il proprio bpm interno. verifica CON ASSOLUTA CERTEZZA di aver messo uno dei due apparecchi in external midi clock…

Enrico Cosimi

19 novembre 2023 | #

ASSOLUTAMENTE Audio Out

Enrico Cosimi

19 novembre 2023 | #

Salve Daniele,
il Voice Stealing è una tecnica “di furto delle voci di polifonia” che serve a garantire l’esecuzione delle note anche quando “tecnicamente” i canali di voce disponibili sono terminati: ad esempio, dentro l’Oberheim a 8 voci, cosa deve succedere quando abbassi una NONA NOTA tenendo premute le altre otto precedentemente eseguite…

Non esiste una risposta unica; a seconda delle opinioni di chi sviluppa, lo strumento può:
– rubare la voce più vecchia
– rubare la voce più acuta
– rubare la voce più bassa
– non fare nulla (niente voice stealing) e rimanere silenzioso

daniele

14 novembre 2023 | #

Salve Prof.

cos’è e a cosa serve il voice stealing?

thanks

L	M	M	G	V	S	D
« Ago
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Comments (2)

Leave a comment