Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Con il termine di “Hard Disk Recording” (HDR) si intende l’utilizzo di un computer1, con
annesso disco rigido, per la registrazione ed il trattamento del segnale audio.
Prerequisito necessario è naturalmente la presenza di una Scheda Audio installata all’interno o
all’esterno del PC: grazie infatti a quest’ultima il segnale analogico proveniente dall'esterno
viene convertito in segnale digitale pronto per essere elaborato. La qualità di questa
conversione dipenderà essenzialmente dalle caratteristiche tecniche della scheda audio
utilizzata: si parte come già accennato dalle schede audio “entry level” tipo Sound Blaster o
Terratec fino ad arrivare a quelle professionali tipo Rme, Digidesign, Motu, CreamWare, ecc.
I dati prodotti dalla scheda audio vengono dunque memorizzati sull’Hard Disk del computer: in
questo modo i campioni acquisiti sono pronti per essere manipolati attraverso tutte le tecniche
tipiche dell’audio editing.
Il trattamento che ne deriva viene detto non lineare e non distruttivo: “non lineare” significa
che possiamo avere un accesso “casuale” ai campioni senza essere soggetti alla linearità del
tempo come nell’editing su nastro, mentre “non distruttivo” significa che il segnale originale
resta integro e non viene alterato dalle successive manipolazioni (in altre parole possiamo
sempre “ritornare indietro” al file originale oppure all’editing precedente).
Ricordiamo inoltre che l'operazione di campionamento del suono produce una gran quantità di
dati digitali per cui avremo bisogno di un supporto per la memorizzazione di generose
dimensioni (oggigiorno non ci sono praticamente più problemi in questo senso), con un
accesso molto rapido ed una velocità di rotazione almeno pari o superiore ai 5400 rpm. Ad
esempio 1 minuto di registrazione stereo a 44.1KHz/16 bit produce circa 10MB di dati.
Naturalmente il computer su cui si opererà dovrà essere anche dotato di un buon quantitativo
di memoria RAM: generalmente almeno 512MB o meglio ancora 1GB.
Scheda Audio
• “digital signal processor” (DSP) – coprocessore che si occupa dei calcoli necessari per
l’audio (in pratica “alleggerisce” il processore principale del computer gestendo per lui
tutta o parte della mole di dati dell’audio digitalizzato)
• “digital to analog converter” (DAC) – chip che si occupa di convertire il segnale audio
da digitale ad analogico (segnale in uscita)
• “analog to digital converter” (ADC) – chip che si occupa di convertire il segnale audio
da analogico a digitale (segnale in ingresso)
• “read-only-memory” (ROM) o “Flash memory” – per memorizzare eventuali dati
(campioni)
• “musical instrument digital interface” (MIDI) – per la connessione con periferiche
esterne di tipo Midi (tastiere, expander e campionatori, surface control, ecc.)
• jack vari per la connessione con altoparlanti e microfoni, line-in e line-out (tra cui anche
connettori interni vari)
• spesso nelle schede “Entry Level” è presente anche una porta per il collegamento con il
joystick o con una frusta Midi
1
Per la precisione il termine HDR presuppone essenzialmente la presenza di un “disco rigido” su cui salvare i dati:
esistono infatti anche dei registratori digitali (quindi non computer completi) con integrato un disco rigido che
permettono il salvataggio, la riproduzione e qualche piccola operazione di editing della forma d’onda digitale.
1
Principali tipi di connessione:
• connettore XLR o Cannon (Extra Long Run): connettore tripolare con corpo in
metallo utilizzato nell’audio professionale per le linee bilanciate2. Il nome fa
riferimento all'attitudine del bilanciato a consentire collegamenti fra apparecchi
anche molto distanti fra loro senza pericolo di captare interferenze (almeno fino a
100m).
Si usa per portare segnali analogici bilanciati (1 canale) o digitali (segnale AES/EBU
a 2 canali, vedi più avanti la descrizione).
• ADAT (Alesis Digital Audio Tape): usa connessioni ottiche di tipo Toslink (Toshiba
link). Un singolo cavo porta 8 canali audio in formato digitale fino a 48Khz/24bit,
oppure 4 canali a 96Khz/24bit in modalità S/Mux II (inventata da Sonorus) oppure 2
canali a 192Khz/24bit con S/Mux IV;
• S/PDIF (Sony Philips Digital Interface Format): connettore ottico oppure coassiale
(RCA, Toslink o anche minijack) con segnale in formato Digitale. La lunghezza ideale
del cavo è intorno a 1 metro ma riesce a raggiungere anche i 5/6 metri. Un singolo
cavo porta 2 canali di audio digitale fino a 96kHz/24bit. E’ utilizzato nei sistemi
“home”.
Si usa attualmente sfruttare il formato S/PDIF per trasportare segnali audio digitali
multicanale (5.1 o 7.1) compressi in formato AC3 ("Dolby Digital") o DTS (Digital
Theatre System) per applicazioni Home Theatre;
• TDIF (Tascam Digital Interface Format): usa un connettore DB25 (come quello per
la porta parallela della stampante nel pc) e trasporta 16 canali in formato digitale (8
in e 8 out);
• MADI (Multichannel Audio Digital Interface): usa connessioni BNC (fino a 50/100
metri) o su fibra ottica (Toslink, fino a 2 km). Un singolo cavo porta 64 canali di
audio digitale fino a 48kHz/24bit, oppure 32 canali di audio digitale fino a
96kHz/24bit. Si stanno introducendo anche i formati "16 canali a 192kHz/24bit" e "8
2
note sul Segnale Audio Bilanciato:
Il principio della connessione bilanciata si basa sulla trasmissione contemporanea di un segnale audio su due linee
(conduttori) differenti, una delle quali però invertita di fase (180°). All'ingresso dell'apparecchio ricevente quest'ultima
viene ripristinata ed i due segnali miscelati: ogni eventuale rumore captato durante il processo di trasmissione,
trovandosi dopo la miscelazione nel ricevitore in opposizione di fase, viene soppresso (in altre parole: quando i segnali
audio sono in controfase durante il passaggio nel cavo, captano entrambi eventuali interferenze le quali si presentano
durante questo tragitto IN FASE; quando i due segnali vengono rimessi in fase dal ricevitore, le interferenze vengono
ora a trovarsi in controfase e quindi eliminate). Viene utilizzato in tutti i sistemi audio professionali e si basa su un
cavo a 3 conduttori (due linee + massa). Il principio della connessione sbilanciata invece si basa sul trasporto del
segnale su cavo a 2 conduttori: uno per il segnale stesso e l’altro per la massa. Viene usato nei sistemi Entry Level
(non sopprime le eventuali interferenze).
2
canali a 384kHz/24bit";
Il Protocollo MIDI
Il termine MIDI, come già detto, è l'acronimo di Musical Instrument Digital Interface ed è un
protocollo di comunicazione, concepito nel 1983, che consente di pilotare un dispositivo
musicale tramite un dispositivo controllore.
Introduciamo il principio di funzionamento considerando una tastiera elettronica dotata di
un'interfaccia MIDI che la collega ad un computer: il computer è dotato di un software midi
(ovvero un sequencer tipo Cubase, vedi avanti) in grado di 'registrare' gli impulsi che
provengono dalla tastiera memorizzando anche gli istanti di tempo in cui arrivano. Dunque
possiamo eseguire un pezzo musicale sulla tastiera e 'registrarlo' come informazioni digitali sul
computer.
È importante capire che il computer non registra l’eventuale suono che esce dalla tastiera ma
dei codici corrispondenti alle note che vengono suonate ed i loro riferimenti temporali (i dati
sono rappresentati sotto forma di codice binario).
Il protocollo Midi non è cambiato dall'anno della sua creazione, anche se ha subito notevoli
estensioni, e questo fa sì che dispositivi molto vecchi siano ancora in grado di comunicare con i
dispositivi moderni e continuino dunque ad essere utilizzabili senza problemi.
Un messaggio MIDI è composto da una serie di bit ordinati secondo uno schema comune per
tutti i messaggi. La figura seguente mostra un tipico esempio:
Come si vede l’intero messaggio è composto da tre byte (1 byte = 8 bit) racchiusi tra due bit
ciascuno, uno iniziale di start (0) ed uno finale di stop (1). Il primo dei 3 byte è definito come
status byte ed ha la funzione di indicare il tipo di messaggio ed il canale midi che lo riceverà.
I bit 2, 3 e 4 dello status byte infatti indicano il tipo di messaggio, ed essendo in totale 3 bit
possono rappresentare 8 (23) tipi diversi di messaggio, mentre gli ultimi 4 bit dello status byte
identificano il canale midi e siccome tale canale viene rappresentato attraverso 4 bit, possiamo
avere un massimo di 16 (24) canali disponibili. Ricordarsi infatti che una porta midi può portare
al massimo 16 canali. Uno status byte ha sempre il primo bit posto a 1.
Dopo lo status byte abbiamo due data byte ossia due byte che trasportano informazioni
numeriche relative al messaggio definito nello status byte. Un data byte ha sempre il primo
bit posto a 0. Nel nostro caso, gli ultimi 7 bit del primo data byte descrivono la nota suonata
e con 7 bit possiamo discriminare 128 (27) note, il che generalmente è sufficiente se si pensa
che un pianoforte, che è uno degli strumenti con l'estensione maggiore, ha 88 note.
3
Nell’esempio stiamo suonando la nota 64 (Data byte 1 = 1000000) ovvero il Mi4. Il secondo
data byte indica la velocità (velocity) della nota ossia l'intensità con cui è stata suonata. Tutte
le recenti tastiere dotate di interfaccia MIDI possiedono un controllo chiamato soft-touch che
trasforma in un valore l'intensità con cui si è premuto un determinato tasto. In questo modo è
possibile riprodurre il tocco della mano sui tasti e quindi la dinamica dell’esecuzione. Il valore
viene associato come già detto alla velocità perché molti sistemi soft-touch si basano sulla
velocità con cui viene premuto il tasto avendo come presupposto che maggiore è la velocità,
maggiore sarà l'intensità. Nel nostro caso il valore della velocità è pari a 90 (Data byte 2 =
1011010).
Ovviamente il significato dei dati contenuti nei data byte varia a seconda del tipo di status byte
che stiamo considerando: nel nostro esempio lo status byte indicava un tipo di messaggio
‘Note on’ destinato al canale 4.
Riassumendo brevemente:
Channel Messages:
[1 0 0 0 c c c c ] [0 n n n n n n n] [0 v v v v v v v]
[1 0 0 1 c c c c ] [0 n n n n n n n] [0 v v v v v v v]
3. Polyfonic aftertouch (key pressure): dopo che un tasto è stato premuto, può essere ancora mosso per
creare un effetto vibrato. Questo messaggio trasporta informazioni circa questo movimento. È raramente
implementato perché richiede un sensore per ogni tasto e dunque risulta abbastanza costoso.
4
I tre bit che identificano il tipo di messaggio sono: 010
[1 0 1 0 c c c c ] [0 n n n n n n n] [0 p p p p p p p]
4. Channel pressure (aftertouch): Come il precedente solo che viene implementato un solo sensore per
tutta la tastiera-sintetizzatore. Un movimento su un tasto applicherà una vibrazione a tutte le note
suonate in quel momento sul canale in questione. Il controllo può essere applicato anche ad altre
grandezze come un tremolo o la frequenza di taglio di un filtro.
[1 0 1 1 c c c c ] [0 n n n n n n n] [0 p p p p p p p]
5. Program change: Con questo comando è possibile cambiare il suono assegnato ad un canale con un
altro suono.
[1 1 0 0 c c c c ] [0 p p p p p p p] [0 - - - - - - -]
6. Control change: utilizzato per controllare parametri relativi al canale in questione come: volume,
modulazione (applicata dal joystick presente su molte tastiere), pan. Per esempio per realizzare un
volume crescente su un certo strumento suonato su un certo canale, possiamo mandare una serie di
questi messaggi con valori di volume sempre crescenti.
[1 1 0 1 c c c c ] [0 n n n n n n n] [0 v v v v v v v]
dove: c = canale midi (4 bit), n = codice del controllo (volume, pan ecc) (7 bit), v = valore (7 bit)
7. Pitch Bend: permette di eseguire il bending di una nota, cioè dei cambiamenti nella frequenza del
suono. In questo caso 128 diverse sfumature di bending sono poche soprattutto in un bending lento e
potrebbero generare un effetto 'scaletta'. Per questo vengono impiegati anche i 7 bit del secondo data
byte portando la risoluzione del bending a 14 bit ossia a 16.384 gradazioni diverse.
[1 1 1 0 c c c c ] [0 B B B B B B B] [0 b b b b b b b]
dove: c = canale midi (4 bit), B = primi 7 bit del valore di bending, b = ultimi 7 bit
• OMNI ON corrisponde al control change con data byte uguale a 124 (01111100) e indica che i dati
saranno ricevuti da tutti i 16 canali midi;
• OMNI OFF corrisponde al control change con data byte uguale a 125 (01111101) e indica che i dati
saranno ricevuti dal solo canale midi scelto nello status byte;
• MONO corrisponde al control change con data byte uguale a 126 (01111110) e impone sul canale la
possibilità di eseguire soltanto una nota per volta;
5
• POLY corrisponde al control change con data byte uguale a 127 (01111111): quando è attivato consente
di eseguire più note contemporaneamente (quindi accordi) su un singolo canale.
System messages:
I messaggi di sistema hanno i primi 4 bit dello status byte sempre uguali a 1111, mentre i secondi 4 bit, non essendo
destinati in questo caso alla selezione del canale, identificano il tipo di messaggio.
Il secondi 4 bit possono definire 16 messaggi di sistema (24), ma ne sono utilizzati attualmente solo 11. Questi si
dividono in tre sottoclassi: common messages, real time messages, system exclusive messages.
1. Common messages
Sono i messaggi che danno istruzioni generali relative a tutto il sistema.
• MIDI TIME CODE QUARTER FRAME sono messaggi di Time Code, nel formato Ore, Minuti, Secondi e
Frame. Otto messaggi (con status byte 11110001 e un data byte), ogni quarto di frame, identificano una
locazione SMPTE.
• SONG POSITION POINTER indica il punto di una sequenza MIDI in cui deve posizionarsi il puntatore
durante la riproduzione. Lo status byte è 11110010, seguito da due data byte.
• SONG SELECT seleziona una song tra quelle disponibili nel dispositivo. Lo status byte è 11110011, ha un
solo data byte.
• TUNE REQUEST ha il compito di eseguire l'intonazione tra due dispositivi. Status byte 11110110.
• MIDI CLOCK sono messaggi analoghi ai MIDITIME CODE QUARTER FRAME, ma non danno un tempo
assoluto, bensì relativo. I messaggi sono inviati 24 volte ogni quarto, con una velocità dipendente dal
valore del quarto. Lo status byte è 11111000. non ci sono data byte.
• START/CONTINUE/STOP controllano i puntatori di tutti i dispositivi MIDI collegati. Start (11111010) pone
i puntatori nella posizione iniziale, Continue (11111011) determina la ripresa della riproduzione, Stop
(11111100) la interrompe.
• ACTIVE SENSING è un messaggio inviato ogni 300 millisecondi per tenere attiva la connessione tra
master e slave, in sua assenza lo slave abbandona la connessione. Lo status byte è 11111110, non c'è
data byte.
• SYSTEM RESET riporta tutti i dispositivi MIDI collegati ai valori predefiniti. Status byte 11111111.
6
Lo standard “General Midi”
Lo standard GM (General Midi) definisce una “mappatura” del Midi che contiene un set di 128
suoni divisi in 16 famiglie (compresa una famiglia di percussioni sul canale 10) che è possibile
assegnare a ciascun canale attravero il messaggio di Program Change (vedi prima).
In questo modo una partitura MIDI creata secondo lo standard GM e ricavata utilizzando un
certo tipo di tastiera o modulo potrà essere suonata da un altro modulo senza che la
corrispondenza originale degli strumenti venga alterata. Senza questa specifica ogni canale
MIDI potrebbe riferirsi ad un qualsiasi strumento e dunque accadere che per esempio un suono
di trombone venga suonato da un altro modulo con un suono di marimba.
Con il protocollo GM si definisce dunque uno standard che, se rispettato, permette di evitare
questi inconvenienti.
Ricordarsi che il canale 10 è dedicato interamente alle percussioni: ogni numero di nota sul
canale 10 del Midi rappresenta un differente strumento a percussione.
[Solo a titolo informativo, vedere alla fine della tesi la mappatura midi del GM]
I supporti audio digitali più utilizzati possono essere divisi in tre categorie: magnetici, ottici e
magneto-ottici.
Questi supporti hanno caratteristiche simili a quelli destinati alla registrazione analogica. Viene
infatti sfruttato il principio dell'allineamento di particelle magnetiche secondo l'andamento del
segnale da memorizzare con la differenza che questo stavolta è un segnale digitale binario che
rappresenta i campioni estratti dal segnale analogico.
I supporti magnetici sono soggetti a vari tipi di interferenze che possono alterarne il contenuto
come quelle generate da televisori, cellulari (evitare di mettere un supporto magnetico nella
stessa borsa del cellulare), monitor dei computer, ecc. Vengono ancora largamente utilizzati in
quanto permettono un trasferimento di dati veloce a costi relativamente abbordabili. Dividiamo
questo tipo di supporti in due categorie: a testina magnetica rotante e a testina magnetica
fissa.
7
• DAT o R-DAT: Recording Digital Audio Tape. E' uno dei sistemi più utilizzati per
la produzione di master stereo ed è stato introdotto dalla Sony nel 1987. La
velocità di rotazione della testina è di 2000 rpm mentre la velocità del nastro è
di 8.15 mm/sec. Permette di registrare due canali (sinistro e destro) con una
frequenza di campionamento fino a 48 KHz. I bit di quantizzazione possono
essere 16, 20 o 24.
• ADAT: Alesis Digital Audio Tape. Ogni macchina ADAT può registrare 8 tracce e
si possono sincronizzare insieme fino a 16 macchine con un risultato di 128
tracce disponibili per la registrazione. La temporizzazione interna può essere
sincronizzata con un segnale SMPTE (Society of Motion Picture and Television) o
MTC (Midi Time Code) proveniente dall'esterno. La frequenza di campionamento
arriva fino a 48 KHz con una quantizzazione fino a 24 bit. Utilizza delle normali
videocassette S-VHS.
• Tascam DA-88: Utilizza il formato video Hi-8. Ha una testina rotante a 4 testine
e permette di registrare 8 tracce audio fino a 48 Khz e 16bit.
Il segnale viene memorizzato lungo la direzione longitudinale del nastro da testine fisse
e non in direzione obliqua come avveniva nel caso delle testine rotanti. I modelli più
utilizzati sono:
• DASH: Digital Audio Stationary Head - Sistema messo a punto dalla Sony. Sono
disponibili macchine che registrano dal 2 a 48 tracce. Le frequenze di
campionamento consentite arrivano fino a 48 KHz / 24 bit.
• DCC: Digital Compact Cassette – Sistema introdotto dalla Philips nei primi anni
’90 come alternativa al più costoso DAT. Permette di registrare i dati digitali su
una normale cassetta audio analogica (arriva fino a 48Khz/16bit).
Questi supporti sfruttano il principio della riflessione della luce per accedere ai dati
memorizzati: il supporto ottico infatti viene inciso utilizzando un raggio laser che crea dei
pozzi (pits) sulla sua superficie. Le parti che non vengono incise prendono invece il nome di
terre (lands): l'andamento delle incisioni che ne deriva segue pari passo quello del segnale
digitale da memorizzare. Semplificando molto il processo reale di conversione si può dire che
pozzi e terre indicano lo stato dei bit, ovvero i nostri consueti 1 e 0.
I dati sul CD sono distribuiti su un'unica traccia a spirale che parte dal centro del CD stesso
fino ad arrivare alla sua periferia.
• Lead In: Si trova nella parte più interna del disco e contiene una descrizione dei brani
presenti come il loro numero, la loro durata, la durata complessiva del disco, ecc.
• Data Block: Sono in sostanza i campioni del segnale digitale che rappresentano
l'informazione sonora vera e propria.
• Lead Out: Consiste in una serie di bit che indicano la fine del CD.
8
Se per esempio in una sequenza manca un campione, la sua ampiezza verrà estrapolata come
media del campione precedente con quello successivo. E' chiaro che più campioni
mancheranno più sarà approssimativa la loro ricostruzione: quando non è possibile eseguire il
calcolo, in quanto i campioni mancanti sono troppi, viene prodotto un silenzio finché la lettura
non ricomincia a funzionare correttamente.
• Red Book
CD Audio: alcune delle specifiche sono la codifica dei 16 bit di quantizzazione di tipo PCM (Pulse Code
Modulation – Audio digitale non compresso) e la frequenza di campionamento pari a 44.1 KHz.
• Yellow Book
CD-ROM: CD destinati alla memorizzazione di dati in diversi formati (audio, video, testo, immagini). Uno dei
parametri definiti dallo standard è la capacità fissata a 650Mb.
CD-ROM XA (eXtended Architecture): i dati vengono distribuiti sul disco in una modalità simile alla CIRC vista
per i CD-Audio.
• Green Book
CD-I: sono CD interattivi che contengono informazioni in diversi formati (audio, video, immagini).
Sony PlayStation: per i giochi della famosa consolle.
• Orange Book
Photo CD: e' un formato messo a punto dalla Kodak per la memorizzazione di immagini fotografiche.
CD-R: Compact Disc Recordable, sono CD su cui è possibile scrivere i dati una volta sola.
• White Book
Video CD: supporti per la memorizzazione di film in formato compresso MPEG. LaserDisc: supporti per la
memorizzazione di film. La dimensione è di 12''. Consente l'uso del Dolby Prologic.
• Blue Book
Enhanced Music CD:spesso chiamato soltanto CD-Enhanced, CD-Extra o semplicemente CD-Plus o CD+. Il CD
Enhanced Music è un CD con due sessioni. La prima sessione contiene i dati audio così come sono definiti
dallo standard CD Audio (Red Book), la seconda sessione contiene dati (Yellow Book). Sullo stesso CD, quindi,
oltre ai dati audio possono essere memorizzate anche delle informazioni.
Il DVD
Il DVD è un tipo di disco ottico il cui funzionamento è molto simile a quello dei normali CD ma
consente una capacità di immagazzinamento dei dati molto maggiore (attualmente 8.5 GB
equivalenti a circa 12 CD con i DVD normali oppure fino a 50GB con il Blu-Ray Disk o 30GB con
l'HD-DVD).
Rispetto ai CD il raggio laser utilizzato per i DVD è molto più sottile e luminoso: in questo
modo le dimensioni dei pits passano da 1,6 micron3 dei CD a 0,74 dei DVD permettendo in
questo modo di avvicinare le tracce e salvare come già detto molti più dati.
3. Supporti magneto-ottici
3
Equivale ad un milionesimo di metro o, equivalentemente, al millesimo di millimetro.
9
applicato, sia proprietà ottiche nel senso che sono in grado di riflettere la luce incidente.
Vediamo come vengono effettuate la registrazione e la riproduzione di tali supporti:
Registrazione
• Un laser di elevata potenza viene inviato verso il disco per riscaldarne una ben definita
zona ad una temperatura superiore a quella di Curie.
• Nel momento in cui il materiale della zona in questione fonde, le particelle magnetiche
si dispongono sulla superficie in maniera casuale.
• Una testina magnetica applica alla zona in questione un campo magnetico che segue
quello del segnale da memorizzare (sempre sotto forma di dati binari).
• Quando il laser si allontana dalla zona, questa si raffredda e le particelle magnetiche
restano orientate nella posizione indotta dalla testina magnetica.
Riproduzione
• In questa fase il supporto si comporta a tutti gli effetti come un supporto ottico e
dunque viene letto utilizzando un raggio laser come avviene per i normali lettori ottici.
Il MiniDisc
Da notare analizzando queste specifiche è che viene utilizzato un sistema di compressione dei
dati denominato ATRAC, ovvero Adaptive Transform Acoustic Coding. Questo sistema si basa
sul principio del mascheramento delle frequenze che teorizza la possibilità di trascurare le
informazioni relative a frequenze adiacenti ad altre che hanno ampiezza molto maggiore (per
maggiori dettagli rimando al corso di Psicoacustica).
Il sistema in linea di massima funziona e la qualità sonora del MiniDisc è decisamente elevata
nonostante l’atrac: la tecnologia impiegata tuttavia a causa dell'introduzione di una
compressione dei dati audio di tipo “lossy” (vedi più avanti) è quanto meno sconsigliabile nella
pratica audio professionale. Il MidiDisc infatti, come tutti gli altri sistemi che utilizzano
algoritmi per la compressione dei dati (come ad esempio il noto MP3) vanno impiegati in
contesti dove la qualità non è una necessità primaria.
10
Software audio: Registrazione e mixaggio digitale
Oltre all’hardware citato, il computer dedicato all’HDR dovrà essere necessariamente dotato di
uno o più software in grado di gestire i trattamenti che dobbiamo compiere sui segnali digitali.
In fase di registrazione per esempio avremo a disposizone una “schermata” che ci permetterà
di vedere in tempo reale le forme d'onda dei segnali che stiamo registrando ed il loro “livello”:
a seconda delle capacità hardware e software del nostro pc, potremo registrare più tracce
contemporaneamente (da cui il nome di MultiTrack Recording o Sistema di registrazione
Multitraccia).
Oltre ai controlli principali presenti nel programma come ad esempio il Mixer virtuale (con tutti
i vari fader, pan, solo, mute, gain, equalizer, ecc. tipici di un Mixer reale) avremo anche a
disposizione tutta una serie di funzionalità che fanno dell'HDR uno strumento estremamente
potente e di cui ormai pochi studi di registrazione possono farne a meno:
• - Editing: permette di fare praticamente di tutto sul segnale digitale. Tra i comandi più
noti citiamo le operazioni di Taglia, Copia, Incolla, Modifica inviluppo d’ampiezza,
FadeIn, FadeOut, CrossFade, Pitch Shift, Time Stretch, Effetti e Processori di segnale,
Equalizzazioni, Filtraggi, e così via.
• - Analisi: essenzialmente il programma consente di analizzare il suono sia a livello
statistico (Ampiezza di picco, RMS power, punti di Clip, Histogram, ecc.) sia come
rappresentazione spettrale (quindi per conoscere le frequenze che lo compongono: vedi
Spettrogramma e Sonogramma).
• - Automazione: Praticamente ogni parametro del mixer, degli effetti, dei processori di
segnale o dei vari plug-ins può essere controllato in modo automatico dal computer
(naturalmente previo tracciamento di un diagramma di comportamento o
interfacciamento a periferiche esterne).
- Plug-Ins: In inglese 'to plug' indica il gesto di infilare una spina nella presa e dunque
per astrazione il termine indica l'inserimento di una funzionalità aggiuntiva ad un
sistema preesistente.
Nel caso di un sistema software di HDR un plug-in è un programma aggiuntivo che
funziona all’interno del programma principale stesso.
Possiamo inserire così in un certo punto della nostra catena di audio editing un plug-in
che implementa ad esempio un effetto di riverbero: questo ci metterà a disposizione
una serie di parametri che potremo modificare e, come detto in precedenza, anche
automatizzare.
Migliore è la qualità dell'algoritmo implementato nel plug-in, migliore sarà il suono che
ne risulterà. Ogni plug-in realizza una manipolazione in tempo reale o quasi sul segnale
e nel farlo utilizza una parte della potenza di calcolo messa a disposizione dal sistema.
Questo significa che il numero di plug-in che potremo utilizzare contemporaneamente
dipenderà dalla potenza del nostro sistema HDR e principalmente dalla velocità del DSP,
del processore centrale e dalla quantità di RAM su cui potremo contare.
I plug-in possono essere della natura più varia: avremo a disposizione equalizzatori,
effetti, processori di segnale e più in generale la maggior parte dei moduli hardware che
esistevano già nel mondo analogico con la differenza che nei sistemi HDR è tutto in
formato virtuale digitale.
In tal senso, alcune case produttrici di effetti o processori di segnale che sono poi
diventati uno standard nell'equipaggiamento di uno studio di registrazione hanno messo
sul mercato dei plug-in che sono esattamente la versione software digitale del modulo
analogico hardware. Naturalmente si tratta di una simulazione e dunque la somiglianza
tra la versione analogica e quella digitale non sarà per forza totale, ma generalmente gli
algoritmi di simulazione riescono a fornire un suono realmente molto vicino a quello del
modulo originale.
11
Formato files audio e midi
Prima di parlare dei principali software audio e midi, dobbiamo citare ancora i principali formati
di salvataggio dei files e delle loro relative estensioni (.wav, .mid, ecc.)
Per “formato” dei files si intende come il computer salva i dati sui supporti di memorizzazione,
cioè in altre parole come “organizza” all’interno dei files le informazioni digitali.
Generalmente i files audio (ma anche quelli midi) contengono all’inizio un “header” cioè una
intestazione nella quale viene descritto il formato dei dati in esso contenuti: ad esempio il tipo
di file, la frequenza di campionamento, la quantizzazione in bit, il numero dei canali, la
lunghezza totale dei dati e così via.
• Lossless (cioè senza perdita): tali algoritmi consentono di mantenere l’integrità dei dati
i quali, una volta compressi, risultano assolutamente identici a quelli originali. Queste
tecniche vengono dette anche di compressione non distruttiva.
L’esempio più famoso è sicuramente quello del formato ZIP, utilizzabile per comprimere
qualsiasi tipo di dato; il rovescio della medaglia è che questi algoritmi difficilmente
riescono a raggiungere ratei di compressione elevati con elementi grafici o audio/video.
In alcuni casi limite il file ottenuto può avere addirittura dimensioni uguali o superiori a
quello originale.
Tra i migliori compressori lossless ricordiamo “Monkey's Audio” (www.monkeysaudio.com)
con il quale si ottengono ottimi rapporti di compressione senza nessuna perdita di
informazioni.
• Lossy (cioè con perdita): conosciute anche come tecniche di compressione distruttiva,
questi algoritmi raggiungono livelli eccellenti di compressione eliminando una parte
considerata non necessaria dell’informazione del flusso originale.
Ovviamente la selezione dell’informazione da mantenere segue regole ben precise per
non pregiudicare l’integrità apparente dell’output risultante: ne sono un esempio il
formato JPEG per le immagini (.jpg), MPEG 1/2/4 per lo streaming video (.mpg) ed i
vari formati di compressione audio che vedremo adesso.
12
- MES: formato sviluppato da AT&T con Dolby e l'istituto Fraunhofer: è l’ultima
generazione del formato MPEG.
- WMA:Windows Media Audio, formato audio compresso della Microsoft (è stato
concepito anche per proteggere i diritti d'autore): riguarda in realtà sia audio che video.
- OGG Vorbis:formato di compressione audio Open Source (ovvero viene fornito anche
il codice sorgente) creato dalla fondazione Xiph.Org. E’ completamente freeware4.
Per streaming si intende il trasferimento dei dati da un computer ad un altro in tempo “reale”.
Il caso più classico è l’ascolto della radio attraverso internet: in questo caso un computer
remoto, cioè il “server”, invia le informazioni audio ad un computer locale, il “client”, ovvero il
nostro computer connesso ad internet. I dati vengono compressi in modo da viaggiare più
velocemente sulla rete.
Con lo streaming Audio o Video l'utente non deve aspettare che il file venga totalmente
scaricato sul suo PC per poterlo ascoltare o visionare: infatti le informazioni vengono inviate in
un flusso continuo (stream) e vengono elaborate appena arrivano. L'utente necessita di un
software apposito, che decomprime le informazioni e invia il video e l'audio al monitor e alla
scheda audio rispettivamente.
1. Audio Editors
Sono softwares che permettono la manipolazione del segnale audio digitale dalla registrazione,
all’editazione fino al mastering finale. Tra i più famosi ricordiamo:
4
Freeware significa sotware completamente gratuito.
13
(Audition 1.5, Edit view)
o
14
o Nuendo: è un programma prodotto dalla Steinberg ed è un po’ il punto di riferimento
per quanto riguarda il mastering audio. Strumento multitraccia potentissimo, permette
tra l’altro di operare anche su files di tipo midi e video in contemporanea a tracce audio.
15
2. Sequencer (Editing Midi)
Il sequencer è un programma (ma può essere anche un dispositivo hardware tipo una tastiera
stand-alone) che consente di memorizzare una sequenza - da cui il nome - di note ed eventi di
uno strumento elettronico Midi per poi riprodurla a comando.
Come già detto, le note registrate non sono forme d'onda, bensì informazioni digitali sulla
posizione della nota sulla scala musicale, sulla sua dinamica, ecc., ovvero quelle che abbiamo
definito come “informazioni MIDI”.
Con questo sistema, il musicista può scegliere con quale strumento suonare la successione di
note semplicemente cambiando il “sound program” del canale Midi e dunque senza la necessità
di ri-registrare il tutto con uno strumento diverso.
Da citare ancora in questo ambiente la possibilità di utilizzare strumenti in formato Plug-In VST
(Virtual Studio Technology) capaci di emulare quasi alla perfezione i “fratelli” acustici tipici di
un’orchestra classica o di altri tipi di bands.
16
3. Softwares per l’Editoria Musicale
Sono dei programmi che permettono la rappresentazione su computer di uno spartito, dando la
possibilità di editare a livello grafico le note e tutti i simboli musicali ad esso correlati per poi
stamparle o inviarle sotto forma digitale ad un editore musicale.
I softwares di notazione musicale più conosciuti sono Finale della MakeMusic (ex CodaSoft) e
Sibelius della Sibelius Group.
I softwares di sintesi permettono la generazione del suono stesso partendo da moduli detti
“Unit Generator” o UG. Ne abbiamo già parlato nella tesi dedicata alla nascita della musica
informatica, citando anche l’autore del primo programma di generazione sonora (Music I)
ovvero Max Mathews che giustamente viene considerato il padre dell’informatica musicale.
17
Csound è disponibile per sistemi operativi Windows, MacOs e Unix/Linux.
• Max/Msp (Cycling): è un software di generazione audio che sfrutta anch’esso la
concatenazione di moduli (oscillatori, filtri, generatori di impulsi, controllori, ecc.), però
a differenza di Csound, nel quale dobbiamo scrivere manualmente un “listato” (degli
algoritmi), questi moduli sono di tipo “visuale” ovvero sono degli oggetti grafici movibili
e collegabili fra di loro attraverso dei cavi virtuali.
Max/Msp è orientato maggiormente alla generazione del suono in tempo reale, per
quanto naturalmente consente anche di salvare l’audio prodotto sotto forma di files
audio.
(Max/Msp Patch)
18
General Midi Table:
ORGAN GUITAR
17 Drawbar Organ 25 Nylon String Guitar
18 Percussive Organ 26 Steel String Guitar
19 Rock Organ 27 Electric Jazz Guitar
20 Church Organ 28 Electric Clean Guitar
21 Reed Organ 29 Electric Muted Guitar
22 Accoridan 30 Overdriven Guitar
23 Harmonica 31 Distortion Guitar
24 Tango Accordian 32 Guitar Harmonics
ENSEMBLE BRASS
49 String Ensemble 1 57 Trumpet
50 String Ensemble 2 58 Trombone
51 SynthStrings 1 59 Tuba
52 SynthStrings 2 60 Muted Trumpet
53 Choir Aahs 61 French Horn
54 Voice Oohs 62 Brass Section
55 Synth Voice 63 SynthBrass 1
56 Orchestra Hit 64 SynthBrass 2
REED PIPE
65 Soprano Sax 73 Piccolo
66 Alto Sax 74 Flute
67 Tenor Sax 75 Recorder
68 Baritone Sax 76 Pan Flute
69 Oboe 77 Blown Bottle
70 English Horn 78 Skakuhachi
71 Bassoon 79 Whistle
72 Clarinet 80 Ocarina
19
116 Woodblock 124 Bird Tweet
117 Taiko Drum 125 Telephone Ring
118 Melodic Tom 126 Helicopter
119 Synth Drum 127 Applause
120 Reverse Cymbal 128 Gunshot
Octave
Note
-1 0 1 2 3 4 5 6 7 8 9
C 0 12 24 36 48 60 72 84 96 108 120
C# / Db 1 13 25 37 49 61 73 85 97 109 121
D 2 14 26 38 50 62 74 86 98 110 122
D# / Eb 3 15 27 39 51 63 75 87 99 111 123
G# / Ab 8 20 32 44 56 68 80 92 104 116
A 9 21 33 45 57 69 81 93 105 117
–
A# / Bb 10 22 34 46 58 70 82 94 106 118
B 11 23 35 47 59 71 83 95 107 119
20
Bibliografia:
21