Carpentier 2016 OLOFONIA IT Holophonic Sound in Ircam's Concert Hall

Thibaut Carpentier,∗ Natasha
Barrett,† Rama Gottfried,∗∗ e

Il suono olofonico nella
Markus Noisternig∗ sala da concerto
�Unità mista di ricerca UMR9912:
Laboratorio STMS IRCAM-CNRS-UPMC
Istituto di ricerca e coordinamento
dell'IRCAM: Pratiche
acustico/musicale
1 place Igor Stravinsky, 75004 Paris,
tecnologiche ed
{France thibaut.carpentier,
markus.noisternig }@ircam.fr
estetiche
†Istituto di Musicologia, Università di
Oslo
Postboks 1017 Blindern, 0315 Oslo,
Norvegia
nlb@natashabarrett.org
��Centro per la nuova musica e l'audio
Tecnologie
Dipartimento di Musica
Università della California, Berkeley
1750 Arch Street, Berkeley, California
94709, USA
rama.gottfried@berkeley.edu
Abstract: Questo articolo presenta un resoconto sulle pratiche tecnologiche ed estetiche della sala per performance
ad acustica variabile, Espace de Projection, presso l'Institut de Recherche et Coordination Acoustique/Musique. La
sala è circondata da un array di 350 altoparlanti per la riproduzione del campo sonoro utilizzando approcci olofonici
come la sintesi del campo d'onda e l'Ambisonics di ordine superiore. In primo luogo presentiamo il progetto e
l'implementazione del sistema audio e discutiamo le sfide delle architetture hardware e software. Segue una
discussione sulle tecniche di composizione spaziale, sugli approcci estetici e sulle metodologie di composizione di
musica informatica per array di altoparlanti ad alta densità, esplorate attraverso gli esempi paradigmatici di brani
prodotti da due residenze di ricerca per artisti.
Uno spazio per la proiezione del suono suono. Ciascuno dei 171 gruppi di tre pertiche può
essere controllato in modo indipendente con
L'Espace de Projection ("Espro") è la sala ad un'interfaccia remota. Per modificare il volume e la
acustica variabile dell'Institut de Recherche et forma della sala, tre sezioni del soffitto possono
Coordination Acoustique/Musique (IRCAM). Con essere variate in altezza e una tenda a rullo può
una capacità da 250 a 350 posti, lo spazio è essere utilizzata per dividere acusticamente gli
utilizzato come sala da concerto, studio di spazi in sottoregioni. Il volume della sala è quindi
registrazione e sala per esperimenti acustici. È stato variabile, con uno spazio a pavimento di 24 m
progettato e costruito da Peutz et Associe´s con 15,5 m e
l'intento di fornire la massima variabilità possibile u n ' altezza compresa tra 1,5 e 10,5 m.× Questa
in termini di forma, volume e caratteristiche configurabilità spaziale permette di modificare in
acustiche (Peutz 1978). Le pareti e il soffitto sono modo indipendente
costituiti da prismi ruotabili (chiamati "periactes", di varie caratteristiche acustiche, ad esempio si
dal greco periaktos, vedi Figura 1) con tre diverse possono ottenere tempi di riverbero da 0,ł sec a
superfici di materiale che assorbono, riflettono o oltre 3 sec.
diffondono il suono incidente. A complemento della notevole flessibilità
architettonica di questa sala, è stato recentemente
Computer Music Journal, 40:4, pp. 14-34, Inverno 201ł
installato un array di altoparlanti ad alta densità
doi:10.11ł2/COMJ a 00383 (HDLA) che circonda l'interno della sala
◯c 2017 Massachusetts Institute of Technology. (Noisternig, Carpentier e Warusfel 2012a,b).
14 Rivista di musica per

computer
L'ambizione di questo nuovo sistema elettroacustico
è duplice: (1) offrire un'apparecchiatura
all'avanguardia per la ricerca sperimentale
Carpentier et al. 15
Figura 1. Vista
dell'Espace de Projection.
I periactes rotanti sono
visibili sulle pareti e sui
soffitti. c ⃝
IRCAM, foto:
Jean-Pierre Armand.
scopo primario
sull'audio spaziale e sulla cognizione spaziale
uditiva e (2) fornire strutture uniche per le
performance artistiche che integrano l'audio
immersivo.
Il rapido aumento della potenza di calcolo
disponibile e la rapida evoluzione delle tecnologie
di interfacciamento audio hanno portato a una
nuova generazione di sistemi di spazializzazione
del suono con un elevato numero di canali di
riproduzione. Diversi istituti di computer music
ospitano oggi HDLA con decine o addirittura
centinaia di canali disponibili (ad esempio, Zmo¨
lnig, Sontacchi e Ritsch 2003; Alcorn, Corrigan e
Rebelo 2005; Ramakrishnan, Gossmann e Bru¨
mmer 200ł; Amatriain et al. 2007; Wilson e
Harrison 2010), nei quali si possono osservare due
tipologie principali: il modello ad acusmonium e
l'approccio di riproduzione del campo sonoro. Lo
computer
dei sistemi di acusmonium è per la diffusione di
opere acusmatiche, eseguite dal vivo
controllando il livello dei segnali indirizzati
agli altoparlanti, che sono considerati come
"sorgenti strumentali". Al contrario, l'approccio
del campo sonoro è progettato per sintetizzare
suoni virtuali, astratti dalla disposizione degli
altoparlanti, e mira a rendere il sistema di
diffusione un processo di rendering
"trasparente". Senza prendere posizione nei
dibattiti estetici che possono sorgere su queste
due categorie, si è deciso di concentrarsi su
quest'ultimo approccio per l'HDLA appena
installato nell'Espro.
Le sezioni che seguono illustrano
brevemente la teoria delle tecniche di
riproduzione del campo sonoro e presentano i
progetti hardware e software dell'HDLA di
Espro.
La sintesi del campo d'onda utilizza le equazioni
Approcci alla riproduzione del suono spaziale
integrali di Kirchhoff-Helmholtz per determinare
la pressione sonora in qualsiasi punto di un
I sistemi audio spaziali mirano a sintetizzare
volume chiuso e privo di sorgenti.
sorgenti sonore virtuali controllando le indicazioni
uditive percepite da uno o più ascoltatori. Ciò
consente di manipolare la localizzazione percepita
dei suoni virtuali e gli effetti di riverbero associati.
È possibile utilizzare tre approcci principali alla
riproduzione del suono, che definiamo "percettivo",
"binaurale" e "olofonico".
L'approccio percettivo sintetizza sorgenti
fantasma che emulano i principali indizi uditivi
(differenze di livello e di tempo interaurali) e si
basa sulle proprietà psicoacustiche dell'udito
umano per produrre l'illusione di un suono
proveniente da una particolare direzione. Questo
approccio comprende la stereofonia e le sue
estensioni, come il panning di ampiezza della base
vettoriale (Pulkki 1997), ed è noto per soffrire di un
"sweet spot" limitato.
L'approccio binaurale, i n v e c e , ricrea le
indicazioni uditive campionando lo spazio uditivo e
non si basa su alcun modello percettivo o fisico. Gli
spunti di localizzazione vengono riprodotti
mediante un filtraggio spaziale con le funzioni di
trasferimento legate alla testa dell'ascoltatore.
Questa tecnica, tuttavia, è limitata alla riproduzione
in cuffia.
Più recentemente, l'approccio olofonico ha
suscitato un notevole interesse nella comunità
HDLA. Questa tecnica mira a sintetizzare campi
d'onda acustici fisicamente corretti,
indipendentemente da qualsiasi modello uditivo.
Tale ricostruzione olofonica può essere realizzata
su un'area estesa in due o tre dimensioni e può
quindi essere utilizzata per presentare il suono
spaziale a un vasto pubblico. Il campo sonoro
generato viene determinato mediante formalismi
matematici che risolvono l'equazione d'onda
all'interno dell'area di riproduzione. La sintesi del
campo d'onda (WFS) e l'Ambisonica di ordine
superiore (HOA) si basano rispettivamente su
formulazioni integrali e modali dell'equazione
d'onda. Queste due tecnologie sono utilizzate in
modo intensivo per l'elaborazione spaziale del
suono nell'Espro.
Sintesi del campo d'onda

computer
data la distribuzione continua di sorgenti secondarie
monopolo e dipolo sulla superficie limite del
volume. La forza di ciascuna sorgente monopolare
è determinata dalla componente normale della
velocità delle particelle delle sorgenti primarie,
mentre la forza di ciascun dipolo è determinata
d a l l a pressione delle sorgenti primarie. Berkhout
e colleghi hanno formulato diverse approssimazioni
(e termini correttivi associati) che consentono
un'implementazione pratica del principio WFS
(Berkhout 1988; Berkhout, de Vries e Vogel 1993).
In particolare, hanno dimostrato che solo la
distribuzione della pressione delle sorgenti
secondarie può essere
e che questo può essere ottenuto con array lineari di
trasduttori (invece degli array di superficie previsti
dalla teoria). In pratica, ciò consente la sintesi e il
controllo di campi sonori coerenti all'interno di
un'area delimitata da array di altoparlanti. Ogni
altoparlante è pilotato dal segnale della sorgente
primaria e vengono applicati ritardi e filtri per
sintetizzare correttamente il fronte d'onda in base
alla posizione della sorgente. Tuttavia, il WFS
presenta una limitazione intrinseca: La
discretizzazione dell'array crea un aliasing spaziale
e, di conseguenza, la ricostruzione olofonica è
garantita solo al di sotto della frequenza determinata
dalla distanza tra gli altoparlanti.
La sintesi in campo d'onda non solo copre
un'ampia platea con un campo sonoro coerente, ma
offre anche un'interessante tavolozza di figure
spaziali (Baalman 2007). Le sorgenti virtuali
possono essere sintetizzate ovunque "dietro" l'array
di altoparlanti e creando un fronte d'onda circolare
con la corretta direzione di arrivo. Per le sorgenti
virtuali infinitamente lontane, viene simulato un
fronte d'onda planare. Infine, le sorgenti
"focalizzate" possono essere rese davanti all'array,
dando l'impressione di una sorgente puntiforme
all'interno della stanza.
Etienne Corteel (2007) ha dimostrato che è
possibile controllare ulteriormente le caratteristiche
di radiazione delle sorgenti virtuali. Manipolando
l'apertura e l'orientamento della sorgente si può
ottenere una radiazione naturale.
modifica del livello e del colore del suono diretto,
oltre a una maggiore interazione con l'ambiente di
ascolto.
Ambisonici di ordine superiore

Introdotta per la prima volta da Michael Gerzon
negli anni '70, l'ambisonica ha conosciuto un'intensa
diffusione.
Figura 2. HDLA array 3-D (75 diffusori
nell'Espro: (1) quattro controllati in modo
array lineari orizzontali indipendente); (3) otto
(280 diffusori controllati subwoofer (non
in modo indipendente); (2) raffigurati).
rettangolo
L'HOA compensata in campo vicino (NFC-HOA) tenta

attività di ricerca dopo l'introduzione delle
di risintetizzare correttamente i fronti d'onda curvi di
rappresentazioni di ordine superiore da parte di
sorgenti virtuali a distanze diverse. Il
J e ´ r o ˆ me Daniel (2001). L'ambisonica di ordine
superiore espande il campo sonoro tridimensionale
in un insieme di funzioni base, le armoniche
sferiche. I coefficienti di espansione (chiamati
anche coefficienti spettrali d'onda o modali)
rappresentano la pressione sonora su una sfera e
possono essere sintetizzati o derivati da
registrazioni con array di microfoni sferici. Questi
coefficienti sono utilizzati per codificare i segnali
nel dominio Ambisonics e sono indipendenti dal
sistema di riproduzione.
Per la riproduzione Ambisonics, i flussi audio
codificati devono essere decodificati rispetto alla
configurazione degli altoparlanti. Nelle
implementazioni pratiche, lo spettro d'onda viene
troncato all'ordine massimo possibile per un
insieme di altoparlanti. La decodifica di segnali di
ordine superiore su un array di altoparlanti di
ordine inferiore può provocare una sfocatura
dovuta alla riduzione della risoluzione spaziale.
L'ambisonica di alto ordine è stata
successivamente riformulata per eliminare le
limitazioni implicite nell'assunzione d i onde
piane (Daniel 2003; Daniel e Moreau 2004).
computer
La realizzazione pratica di NFC-HOA
richiede tuttavia l'uso di funzioni di
regolarizzazione, che hanno un impatto sul
campo sonoro riprodotto, sulle indicazioni di
distanza uditiva e sulla percezione della
distanza relativa, come discusso da Favrot e
Buchholz (2012).
HDLA nell'Espro
Questa sezione illustra gli aspetti software e

hardware dell'HDLA nell'Espro dell'IRCAM e
fornisce informazioni sull'architettura, la
progettazione, la costruzione e
l'implementazione del sistema.
Implementazione hardware
Installato tra il 2008 e il 2011, l'HDLA
dell'Espro circonda la sala con un array di 350
altoparlanti, composto da quattro array lineari
orizzontali utilizzati principalmente per WFS e
HOA 2-D, e da un array a semisfera
ottimizzato per HOA 3-D (Noisternig,
Carpentier e Warusfel 2012a,b).
La struttura dell'array è illustrata nella Figura
2. Le quattro matrici orizzontali sono
composte da un totale di 280
Figura 3. Proiezione di
una distribuzione ottimale
di sorgenti su una sfera
circoscritta alle pareti
dell'Espro.
altoparlanti a controllo indipendente (88 canali per L'array HOA è composto da 75 altoparlanti
l'array anteriore e ł4 in ciascuno degli altri) a posizionati sul soffitto e sulle pareti. L'anello
un'altezza di 2,2 m. La distanza tra gli altoparlanti è inferiore è formato da 2ł altoparlanti, di cui 1ł sono
di 1ł cm negli array anteriori e posteriori, mentre integrati negli array laterali WFS. La disposizione
gli altoparlanti sono separati da 29 cm negli array geometrica corrisponde a un emisfero superiore
laterali. La distanza tra i diffusori anteriori e proiettato sulle pareti della sala a forma di cubo
posteriori corrisponde a una frequenza di aliasing (vedi Figura 3), utilizzando la compensazione digitale
spaziale di circa 1 kHz, sufficientemente elevata dei ritardi di propagazione e dei livelli di ampiezza
per garantire una corretta riproduzione dei segnali per riallineare il sistema come un emisfero virtuale
di ritardo di fase interscolastici nell'area di ascolto. centrato al centro della sala.
La scelta del tipo e della posizione dei diffusori è La distribuzione spaziale degli altoparlanti è
stata in parte dettata da vincoli meccanici e di stata ottenuta mediante simulazioni numeriche per
sicurezza: I cabinet dovevano essere montati tra diversi schemi di discretizzazione sulla sfera, per
gruppi di periactes, e quindi erano limitati a una trovare una distribuzione ottimale adatta alla
dimensione esterna di 20 cm per non ostacolare il riproduzione HOA.
movimento dei periactes o i ponti di luce della sala. Utilizzando il numero di condizione della matrice
I diffusori Amadeus PMX-5 ES/A utilizzati per di decodifica HOA come misura di qualità,
l'array sono diffusori coassiali compatti con un Noisternig, Carpentier e Warusfel (2012b) hanno
woofer al neodimio da 5,25 pollici e un driver a dimostrato che la struttura ad array implementata è
compressione con diaframma da 1,5 pollici. I adatta alla riproduzione HOA 3-D fino al nono
diffusori passivi sono utilizzati per gli array laterali ordine.
e gli amplificatori di potenza (Lab.Gruppen Per la pre-produzione e la post-produzione
C20:8X) sono collocati in uno spazio plenum dietro dell'HOA è stato installato un array di emisferi
i periactes. Per la riproduzione del suono a banda con 24 altoparlanti in uno degli studi
intera, i segnali audio al di sotto dei 100 Hz sono dell'IRCAM.
inviati tramite crossover a otto subwoofer (serie Q
di db-audio). I gruppi di diffusori sono collegati in
cascata e alimentati con flussi di audio digitale Rendering audio spaziale
tramite il protocollo EtherSound. Un cluster di cinque computer situati in una stanza
computer
isolata acusticamente accanto all'Espro restituisce i
segnali audio all'HDLA in tempo reale (vedi Figura
4). In
Figura 4. Struttura
dell'elaborazione audio e
del routing del segnale. I
numeri tra parentesi
indicano il numero di
canali audio trasmessi.
quindi di utilizzare diversi canali di uscita.

Nella configurazione di base, ogni computer (Apple
Mac Pro, ciascuno con un'interfaccia RME MADI a
bassa latenza) è assegnato a un array di componenti
del sistema (cioè, un computer per ogni array WFS
e un computer per l'array HOA). L'Espro e la sala
server sono collegati da cavi in fibra ottica, che sono
collegati a una×rete 8 ł4
I/O MADI bridge utilizzato per replicare e
instradare fino a 128 canali audio come segnali×di
ingresso a ciascun renderer audio. Dopo
l'elaborazione, un MADI a 512
Una matrice di routing MADI a 512
canali (8 porte) distribuisce i canali di uscita audio
ai diffusori. Ciò consente di combinare i singoli
canali verso qualsiasi destinazione di uscita e
computer
sistemi audio simultaneamente (ad esempio,
WFS per la riproduzione del suono
bidimensionale e HOA per la riproduzione del
suono spaziale tridimensionale). La latenza
complessiva di andata e ritorno può essere
inferiore a 1,5 msec (2 32 campioni a ×
48 kHz). Per la sincronizzazione di tutti i
dispositivi viene utilizzato il Word Clock.
Tutti i processori sono collegati in rete per il
controllo remoto, in genere attraverso il
protocollo Open Sound Control (Wright
2005).
La maggior parte delle produzioni di Espro
utilizza la suite software Spat per la
spazializzazione in tempo reale (Jot e Warusfel
1995). Sviluppato all'IRCAM, Spat è una
libreria modulare e scalabile in C++ per la
spazializzazione del suono e il riverbero
artificiale,
l'elaborazione NFC-HOA. Sappiamo che le
ed è distribuito principalmente come una serie di realizzazioni pratiche dei filtri NFC richiedono
oggetti esterni per Max/MSP. Il software fornisce una regolarizzazione per evitare una forte spinta
un quadro unificato per l'elaborazione multicanale, alle basse frequenze. Nella sua versione attuale,
coprendo un'ampia gamma di algoritmi di Spat implementa solo il metodo di
spazializzazione a cui si accede attraverso regolarizzazione proposto da Daniel e Moreau
interfacce di controllo percettivo di alto livello (2004), anche se Favrot e Buchholz (2012) hanno
(Carpentier, Noisternig e Warusfel 2015). In successivamente dimostrato che una versione
particolare, la codifica e la decodifica HOA 2-D e modificata della regolarizzazione di Tikhonov
3-D sono supportate senza alcuna limitazione
sull'ordine Ambisonics massimo, poiché tutti gli
algoritmi sono implementati con formule ricorsive.
Spat fornisce anche diverse strategie di decodifica.
Gli approcci di decodifica tradizionali (vedi Daniel
2001) consistono nel campionamento
dell'eccitazione armonica sferica in corrispondenza
delle posizioni degli altoparlanti (decodificatore a
campionamento) o nell'accoppiamento con le
posizioni degli altoparlanti (decodificatore a
campionamento).
i modi di eccitazione di un campo sonoro continuo
a quelli degli altoparlanti (mode matching). Poiché
queste tecniche non funzionano in modo
soddisfacente con array di altoparlanti distribuiti in
modo non uniforme, Zotter, Pomberger e
Noisternig (2012) hanno proposto un
decodificatore Ambisonics "energy-preserving".
Questo decodificatore evita il problema dell'energia
delle sorgenti virtuali che varia con la direzione di
arrivo, anche in presenza di regioni con scarsa
copertura di altoparlanti, pur presentando una bassa
deviazione direzionale. Questo metodo si è rivelato
efficace per quanto riguarda il layout Espro, come
discusso più avanti in questo articolo. Inoltre, il
modulo di decodifica Spat può eseguire la
decodifica a doppia banda, con frequenza di
crossover regolabile, e in ciascuna banda si possono
applicare le opzioni in fase o max-rE (Daniel 2001).
Spat fornisce numerose utilità per migliorare
l'elaborazione e il flusso di lavoro dell'HOA, tra cui
le trasformazioni nel dominio spaziale di Fourier
(ad esempio, la ponderazione delle componenti
armoniche sferiche per sfocare l'immagine spaziale
o le matrici di trasformazione per ruotare in modo
efficiente la scena sonora tridimensionale); la
conversione tra vari schemi di normalizzazione
(N3D, SN3D, FuMa, ecc.); l'ordinamento delle
componenti HOA in base a
a diverse convenzioni (ACN, SID); e la codifica di
array di microfoni sferici. Spat supporta inoltre
computer
(MTReg) riproduce il campo sonoro su un'area più
ampia e corrisponde più accuratamente al
decadimento dell'ampiezza del campo di pressione
di una sorgente puntiforme. Il vantaggio del
metodo di Daniel e Moreau è che esistono filtri
efficienti a risposta impulsiva infinita per
l'implementazione in tempo reale di NFC-HOA,
cosa che non è possibile utilizzando MTReg.
La libreria Spat include anche oggetti Max per il
rendering WFS in tempo reale e supporta la sintesi
di sorgenti sonore direzionali e focalizzate (cioè, di
fronte all'array). I filtri per la sintesi del campo
d'onda dipendono non solo dalla configurazione
dell'array, ma anche dalla posizione e dalla
direttività della sorgente, per cui un insieme di filtri
viene precalcolato per una fitta griglia di possibili
posizioni della sorgente, per mantenere il carico
della CPU il più basso possibile. Il rendering in
tempo reale viene elaborato in tre fasi: In primo
luogo, la direttività della sorgente è sintetizzata dalla
combinazione lineare di filtri corrispondenti a
modelli elementari (armoniche circolari); quindi,
vengono utilizzati ritardi e guadagni per generare il
fronte d'onda in base alla posizione della sorgente;
infine, viene equalizzata la risposta in frequenza dei
trasduttori dell'array.
Lavorare con HDLA e flussi multicanale di
grandi dimensioni comporta una certa complessità.
Gli strumenti di elaborazione audio tradizionali sono
spesso inadeguati per un flusso di lavoro di questo
tipo, quindi la libreria Spat fornisce diversi
strumenti per affrontare compiti comuni, come: l'I/O ~
dei file (spat.sfplay e spat.sfrecord ~
supportano la riproduzione e la registrazione di file
audio fino a 250 canali, corrispondenti all'attuale
limite di Max/MSP, e supportano il formato WAV
RFł4, che consente di superare il consueto limite di
4 GB per le dimensioni dei file); l'allineamento au-
tomatico del tempo e del livello di un insieme
arbitrario di altoparlanti in base alla loro
disposizione geometrica; il bus multicanale (invio e
ricezione) senza cavi patch; il monitoraggio
binaurale di qualsiasi flusso multicanale.
Uso estetico di Espro HDLA
Dall'installazione dell'HDLA, numerose produzioni

artistiche hanno utilizzato il sistema, coprendo
un'ampia gamma di forme (concerti elettroacustici,
spettacoli teatrali, musica generativa incarnata e
danza).
caratteristiche spaziali.
performance, installazioni interattive, progetti
video, ecc.) In particolare, la ricerca dei
compositori del programma di residenza di ricerca
musicale dell'IRCAM presenta una prospettiva
interessante sulla natura, le metodologie e le
prospettive della computer music per gli HDLA. In
effetti, la residenza di ricerca fornisce un contesto
unico in cui compositori e scienziati collaborano su
questioni comuni, all'incrocio tra creatività artistica
e scoperta scientifica. Questi progetti congiunti
culminano nella creazione di nuove opere d'arte e
nello sviluppo di strumenti multifunzionali di cui
beneficiano non solo i loro autori, ma anche l'intera
comunità della computer music. Nel 2012, Natasha
Barrett e Rama Gottfried hanno intrapreso una
residenza di ricerca con l'obiettivo di sperimentare
tecniche innovative per la composizione spaziale,
sfidare le possibilità dell'ambiente hardware e
software dell'Espro e infine rivelare il potenziale
artistico degli HDLA. Sebbene abbiano seguito
strategie molto distinte, ma complementari, e
ricercato estetiche musicali diverse, gli approcci e
le metodologie che hanno sviluppato forniscono
una visione paradigmatica dell'uso degli HDLA per
la computer music. Barrett si è concentrato
sull'applicazione pratica, percettiva e compositiva
dell'HOA mentre lavorava a una composizione
acusmatica pura. Gottfried ha esplorato l'uso e
l'abuso creativo delle tecniche di elaborazione del
segnale WFS e HOA dal punto di vista della pratica
di performance elettroacustica in tempo reale. Nelle
due sezioni seguenti, ciascuno di loro presenta i
principali risultati delle proprie residenze di ricerca.
Natasha Barrett: Spazio tangibile e iperrealtà

Il mio lavoro ha analizzato le implicazioni
compositive di una maggiore impressione
percettiva di distanza e chiarezza spaziale, e il
modo in cui le immagini tridimensionali possono
impregnare scene musicali astratte o surreali con i
dettagli spaziali idiomatici dei paesaggi del mondo
reale. Ero particolarmente interessato alle
manifestazioni musicali dello spazio "tangibile"
animato da un comportamento di movimento
realistico e al modo in cui un accoppiamento
della tangibilità spaziale e dell'identità sonora
possono influenzare la nostra percezione delle
computer
La complessità del problema è tale, tuttavia, che le
Motivazione compositiva soluzioni possono essere rivelate anche attraverso
l'indagine compositiva. La composizione in tre
Questi interessi sono nati dalle mie precedenti parti Hidden Values è esemplificativa dei miei
composizioni Ambisonics che esploravano la risultati.
struttura spaziomusicale.
Nei miei primi lavori (Barrett 2002) ho
scoperto che le tecniche di Am- bisonics erano
più adatte a concetti spaziali tridimensionali
rispetto al panning o alle performance di
diffusione sonora, e da quel periodo ho
sviluppato un approccio compositivo alla
struttura spaziale indipendente dai diffusori.
Dal punto di vista musicale, in questo lavoro ho
sperimentato l'immersione, la separazione del
suono, le traiettorie in movimento, la proiezione
di relazioni spaziali reali e la conservazione
dello spazio musicale composto dopo che
l'opera ha lasciato lo studio.
Il lavoro successivo si è incentrato
sull'immaginario spaziale e su come la
chiarezza angolare dell'HOA sfidi il
compositore a evitare punti monofonici nello
spazio, offrendo al contempo una "realtà
potenziata" o "iperrealtà" nell'ascolto
acusmatico (Barrett 2010). Le tecniche
sviluppate durante la residenza del 2012 hanno
ampliato questo lavoro con quattro aree di
ricerca.
1. Area di ascolto: L'HOA è in grado di
riprodurre immagini spaziali stabili su
un'ampia area di ascolto e quali sono le
variazioni che gli ascoltatori
sperimentano per i diversi tipi di
materiale a seconda della posizione in
cui sono seduti?
2. Immagini sonore: Un HDLA cambia
l'approccio alla composizione di
immagini sonore?
3. HOA compensato in campo vicino: in
che modo NFC-HOA riesce a
stabilizzare la posizione della
sorgente e ad arricchire la nostra
percezione di distanza e profondità?
4. Fedeltà di registrazione in ordini
superiori e inferiori: Le registrazioni di
ordine superiore riproducono più
accuratamente gli ambienti spaziali reali
rispetto alle registrazioni di primo
ordine e, in caso affermativo, quali sono
le sfide per il loro utilizzo come fonti
compositive?
Anche se alcune risposte possono essere
trovate in modelli matematici, questi modelli
non sono progettati per catturare le nostre
esperienze percettive, né p o s s o n o
affrontare il contesto dei materiali musicali. Il
contrastanti. I suoni vocali sono interessanti in
Dopo aver inizialmente preso in considerazione quanto le trasformazioni di tempo, frequenza e
gli esecutori dal vivo, mi sono presto reso conto ampiezza possono cambiare l'identità del
che la nostra percezione visiva, che influenza il proprietario, ma raramente mascherano una voce.
nostro udito spaziale (come il noto effetto di ven-
trilinguismo; si veda Radeau e Bertelson 1974),
avrebbe distratto sia le mie indagini spaziali che la
percezione dei risultati da parte degli ascoltatori. Il
lavoro è diventato quindi una composizione
acusmatica, in cui un'indagine libera del suono
spaziale nella pratica compositiva poteva essere
ottenuta eliminando gli spunti causali visivi.
Da allora il mio lavoro si è sviluppato fino a
esplorare immagini spaziali tangibili, direttamente
collegate alla performance fisica umana, attraverso
un preciso tracciamento del movimento e la
sonificazione dei dati in 3-D (Barrett 2015).
Materiali sonori e HOA
Le proiezioni ambisoniche tridimensionali del nono

ordine e quelle orizzontali del dodicesimo ordine
sono state il punto di partenza dei miei test. In un
lavoro precedente avevo sperimentato come
l'inclusione di parametri psicoacustici, piuttosto che
delle sole armoniche sferiche che rappresentano la
distribuzione dell'energia s u l l a superficie di una
sfera, creasse una presenza uditiva "nello spazio"
(Barrett 2010). In quest'ottica, l'interfaccia
spat.oper, che gestisce la correlazione tra le
componenti psicoacustiche della proiezione
spaziale, è stata utilizzata per controllare sia la
codifica psicoacustica che quella HOA. Alcuni
fattori di interesse sono stati l'attenuazione
dell'ampiezza legata alla distanza e l'emulazione
dell'assorbimento dell'aria per ciascuna sorgente,
un ritardo derivato dalla distanza della sorgente,
l'effetto Doppler e, per i suoni vicini, una corretta
ponderazione della componente omnidirezionale,
che dà l'impressione che l'ascoltatore sia immerso
nel suono (simile al W-panning proposto da
Menzies 2002). Il modello di riverberazione
utilizzato da Spat è stato eliminato a favore di
ambienti registrati e della convoluzione della
risposta all'impulso 3-D.
Per i test sono state scelte due classi di suoni:
suoni vocali e una selezione di strumenti a
percussione sufficientemente trasportabili tra
luoghi di registrazione con acustiche naturali
computer
fonte. In assenza di altri spunti ambientali o di
stanza, le trasformazioni sono quindi più probabili.
di influenzare la nostra comprensione della distanza
piuttosto che dell'identità. I suoni delle percussioni
sono per molti versi l'opposto: Semplici
trasformazioni sonore possono alterare sia l'identità
del suono sia le nostre ipotesi di prossimità.
A queste fonti è stata applicata una serie di
trasformazioni sonore comuni: allungamento e
trasposizione spettrale, allungamento temporale,
ricampionamento e trasposizione su nastro, brassage
e granulazione. La variazione temporale è stata
controllata con tre metodi: processi algoritmici che
cambiavano gradualmente nel tempo, parametri
controllati manualmente o da dati di automazione e
la stratificazione e la miscelazione di molti suoni per
creare nuovi oggetti sonori composti che
mostravano una morfologia temporale timbrica. I
suoni risultanti si sono evoluti su scale temporali che
vanno dai millisecondi ai minuti, creando variazioni
rapide e dinamiche che alludono ai gesti fisici
dell'uomo, producendo strati sonori simultanei a
spirale spettrale e generando continuità tra punti
statici, immagini sonore e texture immersive.
Soprattutto, il comportamento temporale, di
ampiezza e timbrico è stato sincronizzato con la
spazializzazione codificata nell'HOA. Questa
sincronizzazione si è ispirata al modo in cui
percepiamo il suono spaziale nel mondo reale. Ad
esempio, per favorire l'illusione di un suono che si
muove rapidamente nello spazio d'ascolto, la
vicinanza spaziale e la velocità di movimento
sarebbero state associate a cambiamenti nel
filtraggio spettrale, nel volume e nella diffusione
dell'immagine. Al contrario, campi immersivi
densamente granulati creerebbero uno spazio,
piuttosto che definire un oggetto in uno spazio. In
questo modo, lo sviluppo spaziale e spettrale era
incarnato in ogni suono.
La libreria Spat, come la maggior parte dei
software di spazializzazione multicanale, presenta
all'utente un front-end che mappa un suono
monofonico in un punto dello spazio. È quindi utile
descrivere tre approcci all'imaging:
1. La decorrelazione del segnale può far sì che

l'immagine sonora sembri cambiare di
dimensione. Conosciuta come tecnica
standard nell'elaborazione stereo, e
analogamente nell'HOA, dividendo un suono
mono in più copie e decorrelando
parzialmente ogni segnale, è possibile
ottenere un'immagine
monitorando un ordine di decodifica appropriato per
controllato per espandersi e contrarsi, o l'array a portata di mano. (Le implicazioni musicali di
esistere come una nuvola di punti che un monitoraggio spaziale deprezzato sono discussi in
occupano un azimut e una profondità Barrett 201ł).
specifici rispetto all'ascoltatore.
2. Le sorgenti sonore possono essere registrate
con microfoni multipli in cui ogni segnale
occupa una posizione nel campo sonoro. Le
somiglianze in ogni segnale si fondono in
un'immagine. Ho riassunto per la prima
volta questa tecnica in un lavoro precedente
(Barrett 2010), ma qui ho sviluppato un
approccio scalabile per la registrazione di
piccoli strumenti acustici e di ambienti più
grandi, complessi, interni ed esterni.
3. I singoli grani sonori possono essere
codificati spazialmente, compresa
l'emulazione della distanza. Nei processi di
granulazione e brassage, i grani possono
essere definiti in modo univoco e
individuale, a livello globale attraverso un
controllo statistico o in una trasformazione
temporale tra stati diversi (Barrett 201ł).
Materiali di prova e tipi di decodificatori
La natura artistica del progetto e la complessità dei

materiali musicali hanno reso irrealistici i test di
decodifica scientificamente accurati. Lo studio è
stato quindi informale. Oltre a verificare la capacità
di un decodificatore di proiettare il risultato
desiderato, sono state effettuate ulteriori valutazioni
per verificare se il suono gravitava su un singolo
altoparlante e se l'immagine appariva stabile in una
zona che si estendeva per il 50% del campo di
altoparlanti. Tutto il lavoro è stato svolto con
l'acustica variabile dell'Espro impostata sul tempo
di riverbero minimo.
Il lavoro di preparazione e composizione ha
comportato un accesso limitato all'Espro ed è stato
svolto principalmente nell'HOA Studio che ospita
una semisfera Am- bisonics del quarto ordine, oltre
che nel mio studio domestico su un array
orizzontale. Per sentirsi a proprio agio dal punto di
vista compositivo, il flusso di lavoro ha integrato
Nuendo (una workstation audio digitale familiare),
la libreria Spat in esecuzione in Max/MSP e un
modo per spostarsi senza soluzione di continuità tra
gli spazi componendo in HOA del nono ordine e
computer
decodifica è stata testata utilizzando tutti gli
Nell'Espro, i parametri di decodifica altoparlanti e un sottoinsieme più corretto di 24
ottimali sono risultati essere il decodificatore a altoparlanti (gli artefatti udibili si creano quando
doppia banda, in fase, max-rE , con una
frequenza di crossover compresa tra 200 Hz e
400 Hz, a seconda del materiale sorgente.
Anche se inferiore a quella suggerita in
letteratura (cfr. Gerzon 1975), questa
frequenza ottimizza il contrasto tra campi
diffusi e sorgenti puntiformi. I risultati per la
decodifica 2-D nell'Espro sono stati gli stessi
di quelli per il 3-D, anche se il
Anche il decodificatore mode-matching ha
ottenuto risultati particolarmente buoni. Nello
studio HOA, il decodificatore 3D mode-
matching è stato paragonabile al metodo
energy-preserving. Lo studio è dotato di un
semipoliedro regolare sul quale la
conservazione dell'energia è paragonabile al
mode matching quando "rispecchia"
virtualmente la matrice di diffusori sotto
l'equatore per migliorare il condizionamento
della matrice di decodifica. Il primo metodo
offre un leggero miglioramento della
Impressione tridimensionale di immagini
spaziali "nello spazio", indipendenti dai
diffusori.
Test degli ordini di decodifica
Il formato 3-D del nono ordine contiene 100

armoniche sferiche e la codifica spaziale si
traduce in un file audio a 100 canali, che
richiede risorse significative per la lettura, la
scrittura, il mixaggio e il masterizzazione. È
stato quindi utile testare il formato 3D del
nono ordine rispetto agli ordini inferiori. Ho
applicato lo stesso approccio descritto nella
sezione precedente e ho concluso che,
attraverso test alla cieca con colleghi
(tutti ascoltatori esperti), che il 3-D del settimo
ordine (un formato a 4 canali) produceva la
stessa impressione del 3-D del nono ordine.
Sebbene la sfocatura angolare del nono ordine
sia inferiore a quella del settimo ordine,
nell'Espro è probabile che le riflessioni della
stanza e le piccole imperfezioni nella posizione
e nella risposta dei diffusori aggiungano
maggiori imprecisioni. In due dimensioni, il
dodicesimo ordine ha offerto un miglioramento
rispetto agli ordini inferiori, soprattutto per le
scene complesse, il che potrebbe essere dovuto
alla nostra maggiore consapevolezza dello
spazio orizzontale e al minore impatto delle
riflessioni della stanza su una de-codifica
orizzontale. Il quarto ordine 3-D ha creato
risultati notevolmente sfocati, anche se la
contesto artificiale, mentre in un concerto il
utilizzando un numero eccessivo di altoparlanti, movimento spaziale si ridimensiona e i
come dimostrato da numerosi studi; si veda Zotter, cambiamenti relativi alla "scala umana" fanno
Pomberger e Noisternig 2010). Nello studio HOA, parte di questa trasformazione. Indagini sulla
tuttavia, il 3D del quarto ordine è stato percepito cognizione incarnata e sugli oggetti gestuali-sonori
come simile al 3D del settimo ordine nell'Espro.
Finché l'ascoltatore si trova in posizione centrale, lo
studio offre chiari vantaggi compositivi in termini
di ambiente asciutto e controllato. Nel passaggio tra
gli spazi dello studio e quelli dell'HDLA, le
differenze più evidenti riguardavano il riverbero
naturale della sala e la dinamica spaziale, dove un
suono che percorre 24 metri attraverso la sala da
concerto ne percorre solo 5 attraverso lo studio
nello stesso tempo. In un contesto tradizionale di
diffusione sonora stereo, l'esecutore regolerebbe la
velocità di movimento e la dinamica del volume in
modo adeguato all'espressione della musica. Nel
contesto dell'Ambisonics, possiamo considerare
due opzioni.
In primo luogo, la codifica e la decodifica in
tempo reale, in cui i suoni composti e il movimento
spaziale composto sono memorizzati separatamente
come gamme audio e dati di controllo. I dati
spaziali e di volume possono essere scalati per ogni
spazio, in modo da garantire che la distanza
assoluta percorsa sia costante tra sale da concerto di
dimensioni diverse. Nel mio lavoro ho
sperimentato questo approccio solo per scoprire che
la complessità tecnica della composizione finale era
troppo elevata. Se ogni immagine sonora
consisteva in cinque-dieci punti spaziali
sincronizzati con una trasformazione spettro-
spaziale e 100 immagini sonore venivano mixate e
montate nel corso dell'opera, la scala delle risorse
in tempo reale era irrealistica, così come le richieste
organizzative del processo compositivo. È facile
capire che ci sono chiari vantaggi rispetto
all'approccio compositivo tradizionale, che consiste
nel mixare e rimbalzare continuamente per creare
nuovi oggetti sonori composti.
In alternativa, possiamo considerare le
differenze come una caratteristica dell'esperienza
del concerto. Seguendo la tradizione acusmatica,
un approccio cauto al riverbero artificiale in
studio è accoppiato
con l'aspettativa che lo spazio di un concerto
aggiunga riverbero ed energia ai contrasti dinamici,
come gli attacchi e i rapidi movimenti nello spazio.
Possiamo inoltre riconoscere che lo studio è un
computer
(Godøy 200ł) sottolineano la mia esperienza
personale: l'espressione musicale è preservata e il
carattere di ogni spazio concertistico aggiunge
l'emozione di un'esperienza unica.
Prova della codifica a campo vicino
Sebbene WFS sia in grado di sintetizzare sorgenti

virtuali dietro e davanti all'array di altoparlanti, è
interessante indagare quanto NFC- HOA sia in
grado di ottenere risultati simili, anche se eravamo
consapevoli di varie limitazioni dell'NFC.
spiegata in precedenza in questo articolo. Nella
decodifica 2-D del dodicesimo ordine su 2ł
altoparlanti, c'era disaccordo tra gli ascoltatori
sulla vicinanza delle sorgenti focalizzate. Per alcuni
ascoltatori, la sorgente sembrava librarsi all'interno
dell'array di altoparlanti, aumentando il senso di
intimità, ma non c'era alcuna differenza evidente
tra una distanza
di 3 o ł metri (o rispettivamente il 25% e il 50% del
raggio dell'Espro). L'individuazione di una distanza
assoluta per i suoni focalizzati all'interno dell'array
di altoparlanti non era quindi realistica - e non
sorprende, considerando la nostra scarsa capacità di
giudicare la distanza per i suoni del mondo reale
(Kolarik et al. 201ł), per cui è più utile considerare il
contrasto di distanza. Per le sorgenti situate
all'esterno del campo di altoparlanti, la stabilità
dell'immagine è migliorata.
Uno spiacevole inconveniente del flusso di lavoro
NFC-HOA è che le fasi di codifica e decodifica non
sono più indipendenti: Il raggio dell'array di
altoparlanti deve essere specificato nella codifica.
Per risolvere questo problema, è stato testato uno
strumento di adattamento del raggio, che viene
aggiunto alla fase di decodifica e che ha dimostrato
di funzionare con successo per compensazioni
comprese tra il 50% e il 200%. In studio non si è
notata alcuna differenza tra HOA e NFC-HOA.
Inoltre, lo studio stesso è già un ambiente intimo,
dove i contrasti tra vicino e lontano saranno meno
evidenti che nell'Espro.
La composizione dei valori nascosti
Dal punto di vista tematico, la composizione

esplora il dramma e la metafora associati a tre
antiche invenzioni
sorgenti di ordine inferiore decodificate su altoparlanti
familiari nella nostra vita quotidiana: l'ombrello, la di ordine superiore.
correzione della vista e la serratura, che formano tre per proiettare campi sonori volutamente vaghi e
movimenti, chiamati L'ombrello, I tubi ottici e La immersivi. Inoltre, la decodifica solo in fase, anziché a
serratura. doppia banda, ha favorito questo risultato, ma ha
comportato un compromesso tra l'effetto immersivo e
l'effetto di diffusione del suono.
Fonti sonore
Sono stati preparati degli schizzi musicali per i due
interpreti (il soprano Evdokija Danajloska e il
percussionista Gilles Durot). Una prima sessione di
registrazione ha avuto luogo in uno studio asciutto,
da cui sono stati sviluppati brevi estratti
campionati. Una seconda serie di schizzi
compositivi è stata poi registrata, questa volta
nell'ampio spazio del foyer del Centre Pompidou.
Altri materiali sono stati registrati all'aperto. Per
tutte le sessioni sono stati utilizzati un Eigenmike
(campo sonoro tridimensionale del quarto ordine),
un microfono soundfield (campo sonoro
tridimensionale del primo ordine), microfoni
cardioidi vicini e lontani e microfoni
omnidirezionali per registrazioni simultanee e
sincronizzate da utilizzare nella tecnica di imaging
spaziale descritta in precedenza.
Sviluppo musicale
I materiali musicali sono stati sviluppati in modo
simile ai suoni di prova dei codificatori e dei
decodificatori. In particolare, per le fonti di
percussione trasformate, il gesto e l'energia dietro
l'articolazione, piuttosto che l'identità della fonte,
hanno plasmato il discorso spaziomusicale. Inoltre,
i complessi campi sonori registrati sia dal
microfono soundfield che dall'Eigenmike hanno
fornito alla musica ambienti tridimensionali
completi che era difficile creare con altri mezzi. La
decodifica delle registrazioni del primo ordine su
tutti i 75 diffusori confondeva però l'immagine
spaziale e riduceva le dimensioni dell'area di
ascolto stabile. La mia soluzione è stata quella di
utilizzare il decodificatore Harpex, un metodo non
lineare che separa i segnali simultanei e rende il
campo sonoro utilizzando un metodo di panning
(Berge e Barrett 2010). Ha prodotto una buona
separazione angolare per alcuni campi sonori, ma si
è rivelato meno ottimale per risultati immersivi
generali. Per quest'ultimo, trasformando il difetto in
vantaggio, è stato utilizzato l'effetto sfocato delle
computer
Nyquist nelle frequenze digitali.
uno spazio instabile nell'ampia e stabile area di
ascolto HOA. Dal punto di vista musicale,
tuttavia, finché HOA ha aggiunto chiarezza e
riferimenti spaziali, questa instabilità si è
rivelata una variazione positiva per ogni luogo
di ascolto.
Utilizzando Harpex per decodificare il
segnale del primo ordine e il decodificatore che
preserva l'energia per il segnale del quarto
ordine, i due microfoni hanno prodotto una
separazione delle sorgenti altrettanto chiara.
Tuttavia, si sono riscontrate notevoli differenze
spaziali e spettrali, che hanno messo in dubbio
quale registrazione e decodifica fosse più vicina
alla realtà. In generale, l'Eigenmike ha prodotto
un maggiore senso di "spaziosità". Per
migliorare ulteriormente il campo sonoro, ho
sviluppato una soluzione ibrida applicando
tecniche di beam-forming per estrarre le
sorgenti e la loro posizione nello spazio,
ricodificando queste sorgenti ex-tracted in
settimo ordine e riproducendo il risultato
simultaneamente alla registrazione 3-D
originale. In questo strato HOA ho incorporato
anche altri segnali microfonici monofonici,
nonché trasformazioni sonore musicali delle
sorgenti estratte (risolvendo i problemi di
distorsione dell'immagine normalmente
associati alle trasformazioni delle sorgenti
registrate in 3D). La tecnica ha facilitato un
controllo più accurato della distanza e della
prossimità, combinando microfoni spot e NFC-
HOA in contrasto con, tra le altre tecniche, le
registrazioni a distanza e la convoluzione della
risposta all'impulso.
Sintesi
Le tecniche che ho sviluppato hanno applicato
l'ambisonica di ordine molto alto per creare un
discorso spaziale preciso, tendendo gli estremi
di vicino e lontano e integrando i campi sonori
tridimensionali registrati in un approccio ibrido
di codifica, decodifica e composizione. Per
ottenere questo risultato, sei tipi di materiali
codificati, organizzati in strati musicali, sono
stati legati a sei decodificatori paralleli,
riassunti nella Tabella 1. Queste considerazioni
tecniche sono state integrate nel mio flusso di
lavoro compositivo, una cui astrazione è
riassunta nella Figura 5.
Rama Gottfried: Spazio timbrico e timbro spaziale

Come lo spostamento dell'intervallo quando
si esagera con il clarinetto, o l'aliasing di
Tabella 1. Integrazione compositiva del flusso di lavoro tecnico
Formato HOA Materiali musicali Risultato HDLA
Settimo ordine 3-D Punti statici e gesti in movimento Spazio tridimensionale articolato con
precisione
(Emisfero completo) Immagini (forme a più punti), in movimento e statiche "Immagini volumetriche "tangibili
Campi granulari di 3ł0 gradi Campi ad alto dettaglio e immersivi
Estrazioni ricodificate da registrazioni in campo sonoro Articolazioni su registrazioni reali
Dodicesimo ordine Punti statici e gesti in movimento Come il settimo ordine 3-D, ma
2-D aggiunge
(solo in orizzontale) Immagini (forme multipunto), in movimento e statiche peso verso il basso del campo sonoro
Primo ordine 3-D Registrazioni del campo sonoro e decoder Harpex Separazione delle sorgenti in panning
(Emisfero completo) IR registrati in campo sonoro e decodificatori a risparmio Sfocatura immersiva e imprecisa
energetico
Quarto ordine 3-D Registrazioni Eigenmike Scena reale immersiva, basso livello
di dettaglio
(Sottoinsieme della
matrice)
NFC-HOA/WFS Suoni intimi (timbro, volume e identità); bisogni Comparsa di sorgenti più vicine al
fronte
(solo in orizzontale) per accettare il "ripiegamento" nello strato HOA 2-D degli altoparlanti
quando NFC o
WFS non è disponibile
"sfocata", a seconda dell'accuratezza del rendering

modulazione, gli artefatti della costruzione di un del campo sonoro. Scalando i tempi di ritardo fino
sistema sono la sua impronta digitale unica a 10 secondi si produceva un'onda sonora in
(Cascone 2000). Pertanto, la progettazione di un accelerazione o decelerazione attraverso l'array
sistema strumentale può essere vista come una WFS. Utilizzando suoni granulari brevi, ogni
forma di composizione che incarna determinate altoparlante è stato articolato separatamente, il che
possibilità di espressività e struttura musicale ha appiattito spazialmente il suono sulla posizione
(Chadabe 1984; Wessel 200ł). Lavorando per degli altoparlanti.
scoprire le possibilità uniche di WFS e HOA come
"strumenti", la mia residenza all'IRCAM ha cercato
di sviluppare una tavolozza di materiale estetico
spaziale esplorando l'uso - e l'abuso creativo - degli
strumenti e dei processi di rendering disponibili.
Tecniche specifiche del sistema: Sintesi del campo

d'onda
Dopo aver esplorato gli approcci tradizionali al

rendering, ho iniziato a sperimentare la
manipolazione razionale e irrazionale dei valori di
ritardo e guadagno del WFS.
Ho scoperto che alterando la struttura del filtro
WFS, la posizione della sorgente diventava
computer
e ha creato un movimento lineare lungo le pareti
dello spazio.
La differenza nella struttura del ritardo tra una
sorgente puntiforme standard, situata dietro l'array
WFS, e una sorgente "focalizzata", situata davanti
all'array, è particolarmente evidente con questa
tecnica. Quando una sorgente si trova dietro l'array, i
tempi di ritardo si irradiano naturalmente dal centro
della sorgente sonora, mentre quando la sorgente è
resa davanti all'array, i tempi di ritardo sono più
lunghi,
Si utilizza un approccio al ritardo di tipo "time
reversal", con i ritardi che iniziano ai bordi
dell'array e si dirigono verso il centro della sorgente
virtuale. Utilizzando lo schema di ritardo della
sorgente, ho scoperto che introducendo
improvvisamente i valori di ritardo e guadagno
originali, non modificati e sincronizzati con l'ultimo
ritardo della serie, la sfocatura temporale e
l'appiattimento dei suoni contro i diffusori potevano
passare al suono che "saltava fuori" dai diffusori
verso l'interno dello spazio. Ho chiamato questo
fenomeno "focus delay" (vedi Figura ł). Questo
approccio crea un cambiamento dinamico nella
percezione del luogo da parte dell'ascoltatore,
collegando prima il suono con la fisicità dei
diffusori e poi rendendo improvvisamente la
sorgente virtuale focalizzata all'interno della stanza,
diversi metri davanti all'array.
Figura 5. Ibridazione di dominio codificato; le comandi di vincoli pratici e il "pezzo"
approcci compositivi e linee tratteggiate sincronizzazione e musicale o il livello viene
tecnici n e l flusso di mostrano il punto in cui controllo spaziale. A un renderizzato e reinserito
lavoro. Le linee solide la composizione entra nel certo punto del processo nel flusso di lavoro come
mostrano il flusso di dominio di decodifica; e compositivo, la un
lavoro all'interno della le linee tratteggiate complessità della codifica sorgente HOA del settimo
composizione e nella indicano lo scambio di spaziale supera ordine.
Ho anche lavorato allo sviluppo di un nuovo

Tecniche specifiche del sistema: Ambisonica ad alto
strumento per disegnare le distribuzioni di energia
ordine
spaziale, sia a mano che con tecniche video generative,
rappresentando così la distribuzione di energia come
Un elemento unico del rendering HOA è l'uso di
una mappa di pixel che potesse
armoniche sferiche per rappresentare la
distribuzione spaziale. Nei miei esperimenti, ho
riscontrato che il più
Le manipolazioni del dominio sferico che hanno
avuto successo dal punto di vista percettivo sono
state quelle che hanno utilizzato armoniche sferiche
di ordine molto basso. Uno di questi approcci di
elaborazione è stato quello di suddividere una
sorgente sonora in più livelli di frequenza,
utilizzando un banco di filtri gammatone, e poi di
ruotare ogni regione di frequenza separatamente
utilizzando armoniche sferiche di basso ordine.
Questo approccio è stato utilizzato nella mia
composizione Fluoresce, discussa più avanti in
questo articolo. Utilizzato per elaborare
spazialmente un suono complesso e sostenuto di
archi, l'approccio ha funzionato per separare, sia
sonoramente che spazialmente, il suono nelle sue
componenti polifoniche, mentre l'unità del suono
avrebbe contemporaneamente legato le componenti
spaziali separate insieme a livello percettivo.
computer
poi essere decomposti in armoniche sferiche e
renderizzati tramite HOA (vedi Figura 7).
Questi strumenti miravano a sviluppare metodi
per uscire dalla concezione dello spazio basata
sui punti in qualcosa di più flessibile dal punto
di vista scultoreo, e il risultato poteva essere
descritto come una sorta di texture spaziale
relativa all'input video e alla risoluzione HOA.
Raggruppamento e relazioni relative alle fonti
Raccogliendo queste tecniche che avevo

sviluppato, ho iniziato a esplorare il
raggruppamento di sorgenti puntiformi ad alta
risoluzione e forme di ordine inferiore per
creare "oggetti spaziali" dinamici che potessero
essere percepiti come forme coese.
Un primo esperimento di successo sul
raggruppamento delle sorgenti è stato quello di
definire un oggetto spaziale a più sorgenti
utilizzando il modello percettivo-direttivo delle
librerie Spat per stabilizzare il movimento
relativo del gruppo ori- mentando un perimetro
di sorgenti verso il centro di una forma
geometrica. Con l'ascoltatore all'esterno della
forma, la forma è stata percepita come situata a
una certa distanza dall'ascoltatore, sentita
prevalentemente come un'immagine di
un'immagine di un'immagine di un'immagine di
un'immagine di un'immagine di un'immagine di
un'altra immagine.
Figura 6. La tecnica del
"ritardo di messa a fuoco",
che combina i tempi di
ritardo WFS scalati e non
scalati.
per creare movimenti di gruppo in 3D con un

approccio simile all'elaborazione del segnale basato
sulla posizione spaziale relativa.
Espandendo questo approccio di elaborazione per i

gruppi di sorgenti geometriche, in seguito ho
utilizzato l'algoritmo di flocking "boids"
(Reynolds 1987).
riflessioni precoci e riverbero tardivo con segnale

diretto attenuato. Poi, man mano che l'ascoltatore
entrava nell'anello di punti, la direttività si
orientava verso l'ascoltatore, aumentando il livello
del percorso del segnale diretto, producendo una
maggiore separazione tra i punti e creando una
sensazione distinta di essere all'interno della forma.
Dopo il successo di questo esperimento, ho iniziato
a estendere l'approccio, utilizzando l'elaborazione
del segnale con modelli percettivi per definire
"entità" di gruppo stabili.
In un altro esperimento, ho creato una matrice di
sorgenti in un quadrato bidimensionale nel piano
dell'array WFS, con ciascuna sorgente dotata di
ritardo e filtro passa-banda indipendenti. Il tempo
di ritardo e la frequenza centrale sono stati calcolati
in base alla posizione relativa di ciascuna sorgente
nel gruppo. Attivando la matrice con un segnale
audio monofonico, l'energia sonora si propagava in
ogni punto in base al suo tempo di ritardo e alla
frequenza del filtro. Il movimento ondulatorio del
gruppo è stato quindi creato compensando le
posizioni dei punti della matrice con coordinate
sferiche 3-D e proiettandole sul piano 2-D della
matrice WFS. Inoltre, variando il tempo di
interpolazione del ritardo, ho scoperto che potevo
accentuare gli spostamenti della frequenza naturale
di ciascun punto e aumentare la continuità
percettiva del gruppo nel suo complesso.
computer
Spazio timbrico ¿ Timbro spaziale
Nel processo di sviluppo delle tecniche di rendering

spaziale "strumentale", è emerso chiaramente che la
programmazione necessaria per lavorare con i
sistemi HDLA ha l'effetto collaterale di separare la
forma spaziale dal suo contenuto sonoro. Questo è
problematico, perché la morfologia stessa di un
suono ha una forte influenza sulla nostra percezione
della resa spaziale, ma questa separazione crea
anche l'opportunità di riflettere sulla relazione tra
suono e resa spaziale.
Nel suo lavoro fondamentale sullo "spazio
timbrico", David Wessel (1979) ha dimostrato che,
rappresentando spazialmente le caratteristiche
percettive del timbro, si potevano formare relazioni
stabili da utilizzare per creare organizzazioni
sintattiche del timbro. David Huron (1989) ha
utilizzato una rappresentazione spaziale simile per
descrivere la tessitura musicale in termini di
sincronia d'insorgenza e di movimento dei
sembianti, in quello che chiama "spazio della
tessitura". Nel dominio spaziale, una
rappresentazione simile è stata sviluppata da Gary
Kendall (2007) per descrivere il raggruppamento
percettivo basato sul numero e sulla correlazione
delle sorgenti.
Lavorando con il materiale per violoncello
sviluppato con Se´verine Ballon per il mio e´tude
Fluoresce basato su WFS e HOA, mi sono reso
conto che sembrava esserci un'affinità tra certi tipi di
timbri strumentali e le morfologie di elaborazione
spaziale. I timbri complessi creati da tecniche
strumentali influenzate dal rumore tendono ad avere
uno spettro di frequenze ampiamente distribuito, in
cui la gamma bassa può essere inferiore a 20 Hz,
confondendo il confine tra timbro strumentale e
tessitura contrappuntistica. Allo stesso modo, un
progetto di elaborazione spaziale può essere
considerato qualitativamente come un "timbro
spaziale" o una tessitura spazio-temporale, in cui
una sorgente puntiforme o un'onda piana potrebbe
corrispondere a un'onda di tipo "atipico".
Se un algoritmo di flocking è legato a una linea
monofonica, un algoritmo di flocking potrebbe
implicare un'organizzazione polifonica, e viceversa.
Da questo punto di vista, lo spazio di tessitura di
Huron può essere utilizzato come metodo di
descrizione comune tra timbri e tessiture sonore e
spaziali. Per esempio, I
Figura 7. Mappa e
rappresentazione sferica
della distribuzione
dell'energia basata sulla
decomposizione dei dati
video in
HOA del terzo ordine.
riflessioni precoci codificate al terzo ordine (ł00

ha riscontrato che l'arco circolare del violoncello
sorgenti in totale). Eseguendo tre istanze di Max per
(un suono che oscilla tra il rumore e l'intonazione)
ogni macchina server, sono stato in grado di utilizzare
si è adattato bene alla tecnica delle armoniche
il parallelo
sferiche di basso ordine descritta in precedenza,
poiché entrambe le texture hanno un alto grado di
sincronia all'inizio e una varianza che si muove
lentamente, in quello che Huron chiama
"movimento sembiante". D'altra parte, le texture
granulari più rumorose si adattano bene
all'approccio boids, dove entrambe le texture hanno
un basso grado di sincronia all'inizio e di
movimento sembiante.
Realizzazione tecnica di Fluoresce
A causa del numero di canali renderizzati e delle

richieste di calcolo in tempo reale per
l'elaborazione spaziale, durante la prototipazione
del sistema sono stati necessari test approfonditi
per trovare una soluzione efficiente per distribuire i
calcoli sui processori disponibili. La Figura 8
illustra il flusso audio e di dati del sistema. Una
singola istanza di Max/MSP era in grado di
renderizzare circa 25 sorgenti in WFS o 25 sorgenti
in Ambisonics del settimo ordine, ciascuna con 24
computer
I core della CPU per gestire le spese di
elaborazione del modello di sorgente
d'immagine HOA, i "ritardi di messa a fuoco"
WFS, i filtri gammatone ad armonica sferica
di basso ordine e tre stormi di "Boid", con
l'utilizzo totale della CPU di ciascun server in
media intorno al 70%.
È stata riscontrata una netta differenza
percettiva tra le sorgenti renderizzate sull'array
WFS, molto compatto, e l'array HOA, più
uniformemente distribuito nello spazio. La
presenza fisica dell'array WFS e la sua
maggiore risoluzione spaziale hanno conferito
alle sorgenti una maggiore chiarezza e
un'articolazione quasi tattile rispetto all'HOA
del settimo ordine. Per fondere la resa
dell'HOA e del WFS, le sorgenti sono state
sottoposte a dissolvenza incrociata tra i due
sistemi, in base alla loro posizione. Le sorgenti
situate orizzontalmente all'interno del perimetro
della stanza e verticalmente entro 5 metri
dall'array WFS sono state rese come sorgenti
focalizzate. Il riverbero e le sorgenti esterne
alla regione delle sorgenti focalizzate WFS
sono state gestite dall'array HOA 3D.
Rappresentazione nella composizione spaziale
Componendo per sistemi HDLA come WFS e

HOA, ci viene richiesto di trovare forme
spaziali e
Figura 8. Progettazione contenente materiale Il computer client calcola i
del flusso audio e dei dati precomposto in Ableton guadagni e i ritardi
per la composizione Live e Max for Live (al necessari per coordinare i
Fluoresce. Cinque centro), controllato in quattro array WFS e l'array
computer di rendering (fila tempo reale da input dal HOA.
in basso) controllati dal vivo dal violoncello in
computer client scena e dal pedale MIDI (a
sinistra).
come la traiettoria di una singola sorgente e con

processi che sfruttano appieno le tecniche di
curve di automazione a punto di interruzione
rendering ad alta risoluzione disponibili. Come
utilizzate per controllare inviluppi separati per
discusso in precedenza, la correlazione tra
ciascuna sorgente.
morfologie timbriche e spaziali è una
considerazione importante per creare una scena
spaziale percettivamente coerente, tuttavia i
requisiti tecnici della composizione per i sistemi di
rendering spaziale tendono a separare il suono dalla
forma spaziale. Questo pone una domanda che
merita di essere approfondita: In che modo un
compositore che desidera comporre con lo spazio
dovrebbe affrontare la rappresentazione simbolica
della relazione tra suono e forma spaziale? Il
movimento spaziale viene creato prevalentemente
nel contesto delle workstation audio digitali, dove il
movimento spaziale è tipicamente rappresentato
computer
(ad esempio, azimut, elevazione e distanza). Per
questo motivo, il compositore deve spesso pensare
in termini di singoli parametri piuttosto che di una
rappresentazione spaziale tridimensionale completa.
alla già citata separazione tra suono e forma
spaziale. Lo sviluppo di strumenti digitali per la
creazione di partiture con una maggiore flessibilità
può aiutare a superare queste sfide, fornendo una
piattaforma per riflettere graficamente sulla
relazione tra morfologie sonore e spaziali.
Come un foglio di carta bianco, un ambiente di
composizione dovrebbe fornire all'autore uno
spazio aperto per sviluppare rappresentazioni
simboliche in grado di comunicare i dettagli di
forma e contenuto al lettore, che interpreta i
simboli. Il lettore potrebbe essere un esecutore
umano, un musicologo,
di rendering in modo cogente e coerente, fondendo
o sistema di rendering computazionale. Un sistema forma spaziale e sonora. I progressi nell'elaborazione
di notazione digitale ideale dovrebbe affrontare del segnale spaziale ci permettono oggi di controllare
tutti e tre questi contesti. Alcuni progressi facilmente un gran numero di sorgenti virtuali, onde
sperimentali verso un sistema di notazione "a piane e manipolare registrazioni di microfoni HOA, il
pagina bianca" sono stati raggiunti durante la mia tutto in tempo reale. Concepire...
residenza all'IRCAM, utilizzando l'ambiente di
progettazione grafica Adobe Illustrator e il formato
di file Scalable Vector Graphics come notazione
leggibile dall'uomo e ricca di dati (vedi Gottfried
2015).
Conclusioni e prospettive
In questo articolo viene illustrata
l'implementazione d e l l 'HDLA per il sistema di
riproduzione sonora tridimensionale installato
nell'Espro dell'IRCAM, una sala da concerto ad
acustica variabile dedicata sia alla scienza che
all'arte.
Attraverso due relazioni di residenza d'artista
abbiamo esplorato le possibilità e le sfide affrontate
lavorando con questo sistema per la composizione
musicale e la performance artistica e abbiamo
discusso le direzioni per la futura ricerca scientifica
ed estetica.
Gli HDLA sono in grado di restituire esperienze
spaziali ad alta risoluzione ben oltre le possibilità
dei sistemi di diffusione tradizionali. Utilizzando
approcci olo-fonici come il WFS e l'HOA, gli
HDLA forniscono un mezzo per espandere l'area di
ascolto ottimale fino a includere un pubblico
numeroso; inoltre alcune tecniche, come le sorgenti
focalizzate WFS e l'NFC-HOA, forniscono immagini
spaziali ad alta risoluzione con una maggiore
percezione della profondità, ponendo il suono e il
suo comportamento in una relazione intima con
l'ascoltatore. La recente produzione e la ricerca
sperimentale presso l'IRCAM e altre sedi
dell'HDLA suggeriscono molte potenziali
applicazioni creative di queste tecnologie, e il
crescente interesse di artisti e istituzioni testimonia
l'importanza di ulteriori sviluppi.
Sfide compositive e ricerca percettiva
Con l'aumento dell'uso degli HDLA, siamo

chiamati a padroneggiare e applicare le tecnologie
computer
computazionali di qualsiasi
In realtà, questi progressi ci incoraggiano ad
allontanarci dai "suoni come punti" e ad
orientarci verso i "suoni come immagini", un
senso rafforzato di realismo fisico che espande
le possibilità compositive al dominio
scultoreo. Allo stesso modo, siamo portati a
preoccuparci dell'interdipendenza percettiva
tra forma spaziale e sonora. Sebbene il basso
livello
Gli approcci computazionali all'HDLA
forniscono già un alto grado di flessibilità di
controllo, ma la composizione di HDLA
potrebbe trarre grande beneficio da strumenti di
authoring di alto livello che tengano conto del
contesto psicoacustico e multimodale della
percezione dell'ascoltatore.
Sfide tecniche
Dal punto di vista dell'implementazione,

rimangono diverse aree che meritano un
ulteriore sviluppo. Il rendering con NFC-HOA
ha il potenziale per creare effetti di prossimità
simili a quelli di WFS, anche se rimangono
irrisolti i problemi di stabilità numerica nel
rendering dell'intera gamma del continuum
vicino-distante. Ci sono altre questioni che
riguardano la percezione della distanza nel
contesto.
Esistono anche sfide per la diffusione e la
portabilità delle opere tra le sedi degli HDLA.
Gli spazi che ospitano gli HDLA differiscono
notevolmente per dimensioni, condizioni
acustiche e configurazioni tecniche. Gli artisti
devono quindi adattare il loro lavoro a ogni
situazione di ascolto. Sebbene siano state
descritte diverse strategie tecnologiche e
compositive (cfr. Peters, Marentakis e
McAdams 2011), non esiste ancora una
procedura chiara per presentare la computer
music in una varietà di sistemi HDLA. Gli studi
futuri che analizzano gli effetti dell'ambiente
acustico sulla qualità di riproduzione degli
HDLA potrebbero migliorare questi aspetti, in
particolare prendendo in considerazione gli
aspetti cognitivi della percezione
dell'ascoltatore (ad esempio, l'interazione con le
indicazioni visive o propriocettive).
È inoltre evidente la necessità di ambienti
compositivi e strumenti di produzione audio più
flessibili per lavorare con gli HDLA. Le
tecniche di spazializzazione di alta qualità e ad
alta risoluzione, come WFS e HOA, superano
di gran lunga il numero di canali bus
tipicamente disponibili nelle comuni DAW e
consumano rapidamente le risorse
personal computer. Per soddisfare le esigenze di L'installazione del sistema di spazializzazione in
concetti di rendering spaziale di alta qualità Espro è stata realizzata con il supporto finanziario
all'interno del paradigma DAW, l'architettura del della Re´gion Ile-de-France (SESAME,
bus deve essere estesa per consentire un numero Convenzione n.
significativamente maggiore di canali di uscita. Nel
paradigma in tempo reale, il calcolo parallelo
dovrebbe essere sfruttato in modo più efficace per
gestire l'elaborazione intensiva del segnale digitale
con un numero elevato di canali.
Conservazione, diffusione e scambio di idee
La questione della portabilità è anche fortemente

legata alle specifiche del formato dei media. Il
supporto convenzionale dei file audio basati sui
canali sembra
non è adatto agli HDLA e alle opere multicanale di
massa. Per soddisfare le esigenze della produzione
audio spaziale, sono necessari nuovi formati
descrittivi. Recentemente sono stati proposti e
standardizzati diversi formati di contenitori. Ad
esempio, l'Audio Definition Model (ITU-R
BS.207ł) è uno standard aperto che supporta la
codifica basata su oggetti (cioè tracce audio
associate a metadati descrittivi) e l'archiviazione
HOA. Un formato multimediale flessibile come
questo potrebbe contribuire a facilitare
un maggiore scambio di dati audio spaziali,
favorendo infine una più ampia adozione degli
HDLA e la diffusione delle opere d'arte.
Allo stesso modo, nuovi schemi di notazione e la
rappresentazione simbolica degli attributi spaziali
possono aiutare a documentare gli approcci
concettuali alla forma sonora spaziale e al contesto.
Anche se le descrizioni del design spaziale non
potranno mai sostituire l'esperienza reale del
rendering HDLA, una maggiore presenza di
rappresentazioni simboliche basate sulla partitura
potrebbe potenzialmente fornire un mezzo per
comunicare l'intenzione dell'autore su carta per
futuri studi accademici e artistici. Con l'aumento
della conservazione e dello scambio di idee e
approcci alla composizione spaziale, vengono
stimolate nuove idee per usi ancora impensati degli
HDLA.
Ringraziamenti
computer
I-0ł-207/R), il Centre National de la Recherche
Scientifique (CNRS) e l'Universite´ Pierre et Marie
Curie (UPMC); è stato sostenuto in parte dal
programma Recherche et Innovation en
Audiovisuel et
Programma Multime´dia dell'Agence Nationale de la
Recherche francese (ANR RIAM 004 02 "EarToy").
Le residenze degli artisti sono state finanziate
dall'IRCAM, dall'Oslo Cultural Grant for
International Collaboration, dal Consiglio Culturale
Norvegese e dal premio George Ladd "Prix de Paris"
per la composizione dell'Università della California,
Berkeley.
Gli autori sono particolarmente grati a Olivier
Warusfel per il suo sostegno e la sua guida
perspicace.
Rama Gottfried desidera inoltre ringraziare i suoi
collaboratori, Se´verine Ballon e Julien A l e ´ o n a r d ,
per il loro contributo all'e´tude Fluoresce, e
riconoscere la mentalità del compianto David
Wessel, che lo ha ispirato e aiutato a riflettere su
molte delle idee contenute in questo articolo.
Riferimenti
Alcorn, M., C. Corrigan e P. Rebelo. 2005. "SARC:

Studio Report". In Proceedings of the International
Computer Music Conference, pp. 519-522.
Amatriain, X., et al. 2007. "Audio immersivo e musica
nell'Allosfera". In Proceedings of the International
Computer Music Conference, pp. 27ł-283.
Baalman, M. A. 2007. "Sintesi del campo d'onda e
musica elettroacustica: State of the Art 2007". In
Proceedings of the International Computer Music
Conference, pp. 457-4ł4.
Barrett, N. 2002. "Strategie di composizione spazio-
musicale". Organised Sound 7(3):313-323.
Barrett, N. 2010. "Espansione del kernel: Una
composizione spaziale tridimensionale che combina
diverse tecniche di spazializzazione ambisoniche". In Atti
del Simposio internazionale sull'ambisonica e l'acustica
sferica. Disponibile online all'indirizzo ambison-
ics10.ircam.fr/drupal/files/proceedings/presentations
/O17 10.pdf. Accesso a gennaio 201ł.
Barrett, N. 2015. "Creazione di immagini spaziali-
musicali tangibili da gesti fisici di performance". In
Proceedings of the International Conference on New
Interfaces for Musical Expression, pp. 191-194.
Barrett, N. 201ł. "Un viaggio musicale verso array
permanenti di altoparlanti ad alta densità". Computer
Music Journal 40(4):1-12.
studio". Studio Sound 17(8):24-2ł.
Berge, S. e N. Barrett. 2010. "Espansione di onde
piane ad alta risoluzione angolare". In Atti del
Simposio internazionale sull'ambisonica e l'acustica
sferica. Disponibile online all'indirizzo ambison-
ics10.ircam.fr/drupal/files/proceedings/presentations
/O15 18.pdf. Accesso a settembre 201ł.
Berkhout, A. 1988. "Un approccio olografico al controllo
acustico". Journal of the Audio Engineering Society
3ł(12):977-995.
Berkhout, A., D. de Vries e P. Vogel. 1993. "Controllo
acustico mediante sintesi del campo d'onda". Journal
of the Acoustical Society of America 93(5):27ł4-2778.
Carpentier, T., M. Noisternig e O. Warusfel. 2015.
"Vent'anni di IRCAM Spat: Looking Back, Looking
Forward". In Proceedings of the International Computer
Music Conference, pp. 270-277.
Cascone, K. 2000. "L'estetica del fallimento: le tendenze
'post-digitali' nella musica informatica
contemporanea". Computer Music Journal 24(4):12-
18.
Chadabe, J. 1984. "Composizione interattiva: Una
panoramica".
Computer Music Journal 8(1):22-27.
Corteel, E. 2007. "Sintesi di sorgenti direzionali
mediante sintesi del campo d'onda, possibilità e
limiti". EURASIP Journal on Advances in Signal
Processing 2007(1). Disponibile online all'indirizzo
link.springer
.com/content/pdf/10.1155%2F2007%2F90509.pdf.
Accreditato a settembre 201ł.
Daniel, J. 2001. "Rappresentazione di campioni acustici,
applicazione alla trasmissione e alla riproduzione di
suoni complessi in un testo multime´dia". Tesi di
dottorato, Universite´ de Paris VI.
Daniel, J. 2003. "Codifica spaziale del suono con effetto di
campo vicino: introduzione di filtri per la codifica della
distanza e di un nuovo formato ambisonico praticabile".
In Atti del
la Conferenza internazionale AES: Signal Processing
in Audio Recording and Reproduction. Disponibile
online all'indirizzo www.aes.org/e-
lib/browse.cfm?elib=12321. Accesso a settembre 201ł.
Daniel, J. e S. Moreau. 2004. "Ulteriore studio della
codifica del campo sonoro con Ambisonics di ordine
superiore". In Proceedings of the 116th AES
Convention. Disponibile online all'indirizzo
www.aes.org/e-lib/browse.cfm?elib=12789 (è richiesta
la sottoscrizione). Accesso a settembre 201ł.
Favrot, S. e J. Buchholz. 2012. "Riproduzione di sorgenti
sonore vicine mediante Ambisonics di ordine superiore
con array di altoparlanti pratici". Acta Acustica United
with Acustica 98:48-ł0.
Gerzon, M. 1975. "Ambisonica: Parte seconda, tecniche di

computer
Godøy, R. I. 200ł. "Oggetti gestuali-sonori:
Embodied Extensions of Schaeffer's Conceptual
Apparatus". Organised Sound 11(2):149-157.
Gottfried, R. 2015. "La transcodifica da SVG a OSC
come piattaforma per la prassi notazionale e la
performance elettronica".
In Atti della Conferenza internazionale sulle
tecnologie per la notazione e la rappresentazione
musicale,
pp. 154-1ł1.
Huron, D. 1989. "Caratterizzazione delle tessiture
musicali". In Proceedings of the International
Computer Music Conference, pp. 131-134.
Jot, J.-M. e O. Warusfel. 1995. "Un processore
sonoro spaziale in tempo reale per applicazioni
musicali e di realtà virtuale". In Proceedings of the
International Computer Music Conference, pp.
294-295.
Kendall, G. S. 2007. "Il gioco artistico
dell'organizzazione spaziale: Attributi spaziali,
analisi della scena e schemi spaziali uditivi". In
Proceedings of the International Computer Music
Conference, pp. ł3-ł8.
Kolarik, A. J., et al. 201ł. "La percezione della
distanza uditiva nell'uomo: A Review of Cues,
Development, Neu- ronal Bases, and Effects of
Sensory Loss". Attention, Perception, and
Psychophysics 78(2):373-395.
Menzies, D. 2002. "W-Panning e O-Format,
strumenti per la spazializzazione degli oggetti".
In Atti della Conferenza internazionale AES:
Virtual, Synthetic, and En-
audio per l'intrattenimento. Disponibile online
all'indirizzo www.aes.org/e-
lib/browse.cfm?elib=11151 (è necessario
l'abbonamento).
Accesso a settembre 201ł.
Noisternig, M., T. Carpentier e O. Warusfel. 2012a.
"Dispositivo di spazializzazione sonora 3D
all' Espace de Projection dell'IRCAM: Un Re´seau
de 345 haut-parleurs pour une restitution par WFS
et HOA". Acoustique et Techniques 71:30-39.
Noisternig, M., T. Carpentier e O. Warusfel. 2012b.
"Espro 2.0: Implementazione di un array di 350
altoparlanti circostanti per la riproduzione del
campo sonoro". In Atti della Conferenza AES UK:
Spatial Audio in Today's 3D World. Disponibile
online su www.aes.org
/e-lib/browse.cfm?elib=18121 (è richiesta la
sottoscrizione). Accesso a settembre 201ł.
Peters, N., G. Marentakis e S. McAdams. 2011.
"Tecnologie attuali e pratiche compositive per la
spazializzazione: A Qualitative and Quantitative
Analysis". Computer Music Journal 35(1):10-
27.
Peutz, V. M. A. 1978. "L'acustica variabile
dell' Espace de projection dell'IRCAM (Parigi)". In
Proceedings of the 5¥th AES Convention.
Disponibile online all'indirizzo www.aes.org/e-
lib/browse.cfm?elib=3044 (è richiesta la
sottoscrizione). Accesso a settembre 201ł.
Pulkki, V. 1997. "Posizionamento di sorgenti sonore al Birmingham ElectroAcoustic Sound Theatre".
virtuali mediante il panning di ampiezza della base Suono organizzato 15(3):239-250.
vettoriale". Jour- nal of the Audio Engineering Wright, M. 2005. "Controllo del suono aperto: An
Society 45(ł):45ł- 4łł. Enabling Technology for Musical Networking".
Radeau, M. e P. Bertelson. 1974. "I postumi del Organised Sound 10(3):193-200.
ventriloquio". Quarterly Journal of Experimental Zmo¨ lnig, J. M., A. Sontacchi e W. Ritsch. 2003.
Psychology 2ł(1):ł3-71. "L'IEM-Cube, un sistema di ri-produzione
Ramakrishnan, C., J. Gossmann e L. Bru¨ mmer. 200ł. "Il perifonico". In Atti della Conferenza internazionale
regno di ZKM". In Proceedings of the International AES sull'audio multicanale: The New Re- ality.
Conference on New Interfaces for Musical Expression, Disponibile online all'indirizzo www.aes.org/e-
pp. 140-143. lib/browse
Reynolds, C. W. 1987. "Greggi, mandrie e scuole: Un .cfm?elib=12295 (è richiesta la sottoscrizione). Accesso
modello comportamentale distribuito". ACM SIGGRAPH a settembre 201ł.
Computer Graphics 21(4):25-34. Zotter, F., H. Pomberger e M. Noisternig. 2010.
Wessel, D. 1979. "Lo spazio timbrico come struttura di "Decodifica ambisonica con e senza mode
controllo musicale". Computer Music Journal 3(2):45- matching: un caso di studio con l'emisfero". In Atti
52. del Simposio internazionale sull'acustica
Wessel, D. 200ł. "Un approccio enattivo alla ambisonica e sferica. Disponibile su...
performance della computer music". In Actes des linea a www.researchgate.net/publication/228łł9508.
Rencontres musicales pluridisciplinaires: Le Feedback Accesso a settembre 201ł.
dans la cre´ation musicale, pp. 93-98. Zotter, F., H. Pomberger e M. Noisternig. 2012.
Wilson, S. e J. Harrison. 2010. "Ripensare il BEAST: "Decodifica ambisonica che preserva l'energia". Acta
Recenti sviluppi nella composizione multicanale Acus- tica United with Acustica 98:37-47.

computer

Carpentier 2016 OLOFONIA IT Holophonic Sound in Ircam's Concert Hall

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Carpentier 2016 OLOFONIA IT Holophonic Sound in Ircam's Concert Hall

Caricato da

Copyright:

Formati disponibili

Thibaut Carpentier,∗ Natasha

Barrett,† Rama Gottfried,∗∗ e

14 Rivista di musica per

Sintesi del campo d'onda

Ambisonici di ordine superiore

L'HOA compensata in campo vicino (NFC-HOA) tenta

Questa sezione illustra gli aspetti software e

quindi di utilizzare diversi canali di uscita.

Uso estetico di Espro HDLA

Dall'installazione dell'HDLA, numerose produzioni

Natasha Barrett: Spazio tangibile e iperrealtà

Materiali sonori e HOA

Le proiezioni ambisoniche tridimensionali del nono

1. La decorrelazione del segnale può far sì che

Materiali di prova e tipi di decodificatori

La natura artistica del progetto e la complessità dei

Test degli ordini di decodifica

Il formato 3-D del nono ordine contiene 100

Prova della codifica a campo vicino

Sebbene WFS sia in grado di sintetizzare sorgenti

La composizione dei valori nascosti

Dal punto di vista tematico, la composizione

Rama Gottfried: Spazio timbrico e timbro spaziale

"sfocata", a seconda dell'accuratezza del rendering

Tecniche specifiche del sistema: Sintesi del campo

Dopo aver esplorato gli approcci tradizionali al

Ho anche lavorato allo sviluppo di un nuovo

Raggruppamento e relazioni relative alle fonti

Raccogliendo queste tecniche che avevo

per creare movimenti di gruppo in 3D con un

Espandendo questo approccio di elaborazione per i

riflessioni precoci e riverbero tardivo con segnale

Nel processo di sviluppo delle tecniche di rendering

riflessioni precoci codificate al terzo ordine (ł00

Realizzazione tecnica di Fluoresce

A causa del numero di canali renderizzati e delle

Rappresentazione nella composizione spaziale

Componendo per sistemi HDLA come WFS e

come la traiettoria di una singola sorgente e con

Sfide compositive e ricerca percettiva

Con l'aumento dell'uso degli HDLA, siamo

Dal punto di vista dell'implementazione,

Conservazione, diffusione e scambio di idee

La questione della portabilità è anche fortemente

Alcorn, M., C. Corrigan e P. Rebelo. 2005. "SARC:

52 Rivista di musica per

54 Rivista di musica per

Potrebbero piacerti anche