Audio 3D. Il “viaggio allucinante” del riverbero

Written by Luigi Agostini on 30 maggio 2012. Posted in Recording

Riprendiamo a parlare di registrazione e mastering in 3D dopo “l’avvento” in ambito commerciale, che vi ho segnalato nell’articolo precedente, del suono “nell’emisfero alto”(sic). Per ricapitolare velocemente, vorrei addentrarmi con voi nei meandri del percorso DSP che un segnale mono deve compiere per acquisire una posizione virtuale nello spazio condiviso con i suoi ascoltatori.

Di Luigi Agostini

I meno giovani tra di voi ricorderanno forse il film Viaggio allucinante (Fantastic Voyage, 1966) diretto da Richard Fleisher. Fate finta di esser stati ridotti alla stessa dimensione di un elettrone e aiutatemi a inseguire il nostro segnale all’interno dei circuiti elettronici che tanto amiamo…

Il primo evento non è una sorpresa, abbiamo già parlato della clonazione del segnale in più copie da assegnare ad un certo numero di diffusori disposti su due livelli di altezza, come minimo. Ogni diffusore cambierà continuamente il volume di emissione del clone a lui assegnato in base alla posizione virtuale assegnata al segnale originale per mezzo dell’interfaccia utente. Lo stesso diffusore riceverà continuamente anche le informazioni temporali necessarie per correggere la sua posizione rispetto all’ascoltatore (ITD e Delay vari).

Se adesso guardate in alto alle vostre spalle potete vedere un semplice filtro posizionato a monte del percorso: il suo compito è quello di tener conto delle variazioni in frequenza causate dalla velocità virtuale impressa al malcapitato segnale (effetto Doppler). Ma la spazializzazione che ascolteremo a questo punto del viaggio, pur efficace e preferibile nella maggior parte delle situazioni in cui l’ambiente sia già molto riverberato, risulterà al contempo fredda ed irreale. Questo perché istintivamente siamo portati a confrontare il ricordo di una sensazione provata realmente con una simulazione. Oltretutto, una simulazione digitale, quindi per forza di cose approssimata e limitata.

La nostra sorgente audio, nella realtà, era una forma d’onda molto complessa, con il suo bel transiente d’attacco, le prime riflessioni e la riverberazione principale e quella diffusa causate dalla presenza delle pareti, del soffitto e del pavimento, oppure dal terreno e dagli ostacoli che incontrava in campo aperto.

Ora che l’abbiamo estrusa, trafilata, frammentata in 48000 (se va bene) scalini congelati nel tempo e successivamente elaborata attraverso i funambolici percorsi dei più astrusi algoritmi DSP partoriti da menti contorte (la mia per prima…), del suo fascino originale resta ben poco: è ormai l’ombra di se stessa, un surrogato digitale appunto.

L’unica possibilità che abbiamo è cercare di creare virtualmente parte delle riflessioni che la sorgente avrebbe causato muovendosi in un ambiente reale simile a quello fornito dalla nostra interfaccia utente (leggi software di gestione). Abbiamo soltanto un piccolissimo problema in termini di risorse a nostra disposizione. Le riflessioni da riprodurre sono nell’ordine delle migliaia soltanto nella parte diffusa, per non parlare della completa casualità di gran parte di queste…

Il nostro segnale audio, a questo punto del suo “viaggio allucinante”, diventerà la pietra di paragone con cui ricreare il maggior numero possibile di copie diverse per intensità e tempo di emissione (volume e delay). Tali differenze saranno determinate dalla dimensione dell’ambiente, dai materiali che rivestono o costituiscono pareti, soffitto e pavimento, dalla posizione nello spazio della sorgente e dell’ascoltatore, e dalla lunghezza dei percorsi che le copie effettueranno per raggiungere le orecchie dell’ascoltatore. Praticamente, nella realtà non si prova nemmeno a contare il numero di riflessioni generate da una vibrazione acustica, sono quasi infinite e dipendono inoltre dalle capacità uditive del soggetto ascoltatore.

Per capirci: quanti di voi sanno giocare a biliardo possono paragonare la componente principale del suono che raggiunge per prima l’ascoltatore ad un tiro diretto sul bersaglio, le prime riflessioni a un colpo di sponda, le seconde alla doppia sponda e così via immaginando fino ad esaurimento quasi totale dell’energia originale della sorgente audio. Quasi, perché la soglia standardizzata per l’identificazione del tempo di riverbero non è “meno infinito” ma 60 db. Il riverbero in pratica è il tempo che deve trascorrere perché il livello di un suono decada di 60 dB all’interno di un ambiente chiuso. Prima approssimazione, accettabile, ma soltanto la prima di una lunga lista.

Seconda approssimazione: l’orecchio umano non riesce a distinguere due suoni se essi sono percepiti a meno di 0.1 secondi di distanza uno dall’altro. (Ma le vibrazioni non interessano anche il tatto?).

Terza approssimazione: la velocità del suono nell’aria a 20 °C è di circa 340 m/s e questo valore viene assunto come default. Circa e solo a quella temperatura, senza contare umidità e inquinamento.

Quarta approssimazione: la fonte sonora e l’ascoltatore dovrebbero essere nello stesso punto di fronte all’ostacolo che crea le riflessioni. No comment.

Quinta approssimazione: di conseguenza, in uno spazio aperto si può parlare di riverbero solo quando l’ostacolo si trova a meno di 17 metri dalla fonte del suono, perché il percorso dell’onda sonora (dalla fonte all’ostacolo e ritorno) sarà inferiore a 34 metri e il suono impiegherà meno di un decimo di secondo per tornare al punto di partenza confondendosi nell’orecchio dell’ascoltatore con il suono originario. Se l’ostacolo si trova a più di 17 metri di distanza dalla fonte, allora suono diretto e suono riflesso distano tra loro di più di 1/10 di secondo risultando quindi come due suoni distinti (eco). Ma in uno spazio chiuso ed ampio, come ad esempio una chiesa, si possono udire le innumerevoli riflessioni delle pareti lunghe a volte anche più di 17 metri che decrescono di intensità fino al silenzio. Il riverbero, in realtà, è un fenomeno complesso e affascinante che sfugge alle capacità di calcolo e razionalizzazione dell’uomo e dei suoi computer… pensate adesso alla complessità di realizzazione di una simulazione che includa un effetto anche soltanto simile ad un riverbero tridimensionale.

Vedremo nel prossimo articolo quali approssimazioni sono state accettate e utilizzate nel lexicon, nel senso latino del termine, di tutti i produttori di riverberi digitali 3D, e cominceremo a parlare anche di convoluzione…

Tags: dsp, riverberazione, riverbero, viaggio allucinante

Trackback from your site.

Comments (5)

Lorenzo

30 maggio 2012 at 10:53 | #

Moooooolto molto molto molto interessante.
Una domanda: nei parametri di moltissimi riverberi è presente il dosaggio delle “early reflections”; ma cosa sono, a livello fisico, queste early reflections?

Reply
- Enrico Cosimi
  
  31 maggio 2012 at 11:16 | #
  
  le “early reflections” sono le “prime riflessioni”, cioè l’insieme dei primi rimbalzi che l’energia prodotta dalla sorgente sonora realizza sbattendo contro le pareti della stanza in cui ci si trova; ovviamente, la loro quantità è definita arbitrariamente negli algoritmi di riverbero, permettendo così di differenziare la loro presenza/ampiezza/distanza dal segnale originale in maniera indipendente da quello che poi è la coda di riverbero vera e propria (composta dalla somma assai più densa di tutti gli altri rimbalzi…)
  
  fai un esperimento, meglio se con un segnale “secco e corto”: prova a regolare una reverb time bello significativo – diciamo 2.5 secondi – e metti a ZERO il livello delle early reflections; il risultato è abbastanza innaturale… appena finisce il suono originale, hai la coda di riverbero densa; adesso, prova a mettere un livello significativo per le early reflections e regolale ad una “distanza” di 100-200 millisecond; noterai che prima senti il suono secco, poi dopo una breve pausa arrivano le early reflections e poi la coda di riverbero vera e propria.
  
  non hai impressione, in questo secondo esempio, che la stanza si sia ampliata?
  
  ovvio che, se vuoi un effetto particolare e non convenzionale, non sei obbligato a lavorare con le early reflections; e altrettanto ovvio è che se usi SOLO le early reflections, annullando la coda vera e propria di riverberazione, puoi rinforzare il suono dandogli una “short chamber” molto interessante per determinati tipi di esecuzione
  
  insomma, il realismo interessa fino a un certo punto… 😉
  
  Reply
  - Lorenzo
    
    1 giugno 2012 at 16:49 | #
    
    mille grazie! proverò!
    
    Reply
    - Luigi Agostini
      
      3 giugno 2012 at 10:50 | #
      
      Grazie Lorenzo,
      
      per complementare il prezioso contributo di Enrico, vorrei aggiungere che il tempo impiegato dalle prime riflessioni per raggiungere le orecchie dell’ascoltatore dipende, oltre che dalle dimensioni dell’ambiente, anche dai materiali che costituiscono o ricoprono le pareti, il pavimento e il soffitto. Forse l’approssimazione più grossolana che siamo forzati ad accettare per salvaguardare la “vendibilità” di un riverbero digitale sta proprio nell’assumere che tutte le superfici virtuali siano dello stesso materiale. Prova a pensare quanto siano diverse due stanze con le stesse dimensioni, a livello di sonorità, se una di queste è completamente vuota e l’altra è arredata (e magari con tendaggi, tappezzeria e specchi vari…). Per non parlare delle forme, quanti di noi ascoltano musica in un cubo perfetto in realtà? Comunque alcuni plug-in e outboard hardware di alto livello offrono talvolta un minimo di controllo su tali aspetti della riverberazione, e anche nei miei prodotti, quando la capacità DSP che ho disposizione me lo permette, cerco sempre di legare il movimento 3D della sorgente nello spazio virtuale alla variazione delle prime riflessioni in intensità e tempo di arrivo anche in funzione dell’assorbimento dei materiali… per le forme irregolari degli ambienti, purtroppo, è ancora troppo presto, perlomeno in tempo reale… A disposizione se hai altre domande, ciao, Luigi
      
      Reply
      - Lorenzo
        
        3 giugno 2012 at 14:07 | #
        
        Grazie mille per la risposta.
        😀
        
        Reply

Tag più popolari

Nuovi Articoli

Archivio Articoli

Ultimi commenti

Luca Sasdelli

13 marzo 2024 | #

E dopo ben dieci anni, allungo il thread!

La String Melody (Logan/Hohner) deve la sua qualità leggendaria a due fattori: il primo è la presenza di un generatore di inviluppo AR per ogni nota (sic!), in contrasto con lo standard Eminent/ARP che usava un unico EG per tutto, con la facoltà nell’ARP Omni2 di scegliere il trigger ad ogni pressione di tasto (per uno dei peggiori effetti esistenti, musicalmente parlando).

Il secondo fattore è il chorus: a tre linee di ritardo come Eminent/ARP, però pilotato in modo molto intelligente, che descrivo qui di seguito.

Eminent e ARP, su Eminent-310, Solina, Omni e Quadra, usano tre linee di ritardo BBD, ciascuna con un proprio LFO e i tre LFO (triangolari) sono tarati su periodi primi fra loro, per cui in teoria (e con taratura perfetta) non presentano ciclicità. Il sistema quindi si basa sulla ricerca della massima casualità.

Logan/Hohner invece usa un sistema di LFO molto particolare: sono due oscillatori sinusoidali trifase, le cui onde a 0°, 120° e 240° vengono sommate e distribuite in modo ineguale fra le tre BBD. In questo modo, ognuna delle linee di ritardo è modulata in modo armonico con le altre due, creando un mix decisamente più amalgamato rispetto a Eminent.

Nicola

7 marzo 2024 | #

gentile Enrico, grazie per il suggerimento la KeySteppro adesso mi permette di pilotare bene il vecchio ms20, ho solo un ultimo problema;

l’ms20 risponde tutto 1semitono sotto, devo quindi re-intonarlo, potrebbe essere normale? (o imputabile ai cavi “2metri”)

Nicola

6 marzo 2024 | #

graziemille!

enrico cosimi

23 gennaio 2024 | #

no, su apple non gira più dai tempi del 10.5;
su windows gira ancora…
in ogni caso, le quotazioni sono drogate dalla rarità

daniele

23 gennaio 2024 | #

Salve Prof,

ha senso oggi l’acquisto di un nord modular G2?
I prezzi vanno dai 1500 € a quasi 3000 €, l’editor non versione demo gira sui sistemi operativi attuali?

grazie

Enrico Cosimi

19 novembre 2023 | #

no, la larghezza di due oscillatori indirizzati in due canali di uscita ce l’hai solo – appunto – con due canali di uscita

Enrico Cosimi

19 novembre 2023 | #

eh eh, per comprare macchine più complicate c’è sempre tempo… 😀

Enrico Cosimi

19 novembre 2023 | #

nessun rischio

Enrico Cosimi

19 novembre 2023 | #

no, hai bisogno dell’hardware clavia

Enrico Cosimi

19 novembre 2023 | #

hydrasynth explorer

Enrico Cosimi

19 novembre 2023 | #

io direi hydrasynth explorer

Enrico Cosimi

19 novembre 2023 | #

in realtà, DOVREBBE essere stata superata: hanno aggiunto un ulteriore parametro di gain, ma nonostante questo comunque non ti assordi…
😉

Enrico Cosimi

19 novembre 2023 | #

non ho capito molto: la traccia midi contiene le note che devono essere eseguite dallo strumento; se l’apparecchio NON supporto l’audio-over-midi (perché lavora nel dominio analogico), è necessario avere ANCHE una traccia audio che riceve il segnale frutto dell’esecuzione midi

ovviamente, dopo la registrazione, occorrerà riallineare manualmente la traccia audio alla traccia midi perché – inevitabilmente – risulterà IN RITARDO rispetto al midi..

Enrico Cosimi

19 novembre 2023 | #

se vai nei parametri GLOBAL del M-32, puoi decidere che l’uscita ASSIGN emetta il Clock convertito dal MIDI ricevuto; a quel punto, usi il collegamento ASSIGN OUT – ADVANCE IN per clockare la DFAM (devi solo premere RUN sulla DFAM per automatizzare la partenza…)

Enrico Cosimi

19 novembre 2023 | #

verifica con l’editor librarian gratuito COSA ALTRO C’E’ dentro la macchina!!!
Tira fuori tutto, aggiungi il tuo file e spara nuovamente dentro il banco

Enrico Cosimi

19 novembre 2023 | #

devi prendere l’uscita PITCH della Keystep e collegarla all’ingresso KYBD VCO1+VCO2 IN della patchbay, praticamente “sotto” al potenziometro di VOLUME

Enrico Cosimi

19 novembre 2023 | #

non ho capito molto: probabilmente, hai solo condiviso i messaggi di start/stop MIDI ma le due macchine continuano a viaggiare ciascuna con il proprio bpm interno. verifica CON ASSOLUTA CERTEZZA di aver messo uno dei due apparecchi in external midi clock…

Enrico Cosimi

19 novembre 2023 | #

ASSOLUTAMENTE Audio Out

Enrico Cosimi

19 novembre 2023 | #

Salve Daniele,
il Voice Stealing è una tecnica “di furto delle voci di polifonia” che serve a garantire l’esecuzione delle note anche quando “tecnicamente” i canali di voce disponibili sono terminati: ad esempio, dentro l’Oberheim a 8 voci, cosa deve succedere quando abbassi una NONA NOTA tenendo premute le altre otto precedentemente eseguite…

Non esiste una risposta unica; a seconda delle opinioni di chi sviluppa, lo strumento può:
– rubare la voce più vecchia
– rubare la voce più acuta
– rubare la voce più bassa
– non fare nulla (niente voice stealing) e rimanere silenzioso

daniele

14 novembre 2023 | #

Salve Prof.

cos’è e a cosa serve il voice stealing?

thanks

aprile 2024
L	M	M	G	V	S	D
« Ago
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Comments (5)

Leave a comment