Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
.............................................................. 5
Fondamenti di acustica...........................
7
Fondamenti di psicoacustica...................
25
Digitalizzazione del suono.......................
47
Analisi del suono.......................................
65
Modifica del suono................
99
Sintesi del suono........................................
137
Analisi e sintesi della voce............ ..........
161
Compressione del suono.........................
175
Spazializzazione del suono......................
195
Architetture DSP per laudio..................
205
Bibliografia ................................................
241
Prefazione
Il contenuto di questo corso il risultato della sintesi di numerose argomentazioni,
distribuite su altrettanto numerose pubblicazioni, relative alle molteplici discipline che
concorrono alla
della problematica dellelaborazione dellinformazione del
segnale audio (suono): matematica, teoria dei segnali, acustica e psicoacustica, teoria dei
sistemi, elaborazione numerica dei segnali, architetture speciali di elaborazione del
segnale numerico, ecc. Rimando quindi ai riferimenti in bibliografia per un
approfondimento relativo ai fondamenti delle suddette tematiche di base.
Lobiettivo del corso di offrire allo studente le conoscenze necessarie e sufficienti per
affrontare la progettazione di applicazioni audio digitali (incluse le applicazioni vocali)
con un approccio di natura sistemistica, avvalendosi delle conoscenze informatiche,
nonch delle necessarie conoscenze matematiche e fisiche di base.
Algoritmi e modelli di elaborazione del segnale sono una importante componente di
conoscenza di base per chi deve affrontare lo studio dellaudio digitale. Queste
conoscenze devono essere completate sia dal punto di vista della specificit della natura
dellaudio digitale, sia esplorando le problematiche implementative.
Lo studio delle architetture di calcolo orientate aHelaborazione numerica del segnale
(DSP) unaltra importante componente di conoscenza di questo corso. Laudio digitale
implica unattivit di elaborazione numerica del segnale molto intensiva e
conseguentemente, la scelta della giusta architettura di calcolo numerico per realizzare
una specifica applicazione una conoscenza che lo studente deve avere per essere
preparato a soddisfare le richieste applicative dellindustria dellaudio digitale.
\
i
'
Introduzione
00101001010001
00101001001010
00101000100101
01010001011101
10010100010010
Copyright 2002-2003
Prof. Mario Malcangi
Introduzione
La tecnologia audio originariamente di natura analogica, in quanto analogica la natura
del suono e dei suoi meccanismi naturali di produzione. La variazione di tensione
elettrica che viene prodotta in uscita da un microfono non altro che unanalogia
elettronica della variazione di pressione delParia che caratterizza il suono che raggiunge
il microfono medesimo.
La tecnologia audio analogica, pur avendo raggiunto livelli di qualit sufficienti a
soddisfare le esigenze applicative professionali e di consumo, ha evidenziato notevoli
limiti applicativi, soprattutto nellintegrazione con altre tecnologie come la
comunicazione o lautomazione. La degradazione del segnale audio, ad esempio, non pu
_ess.ere_adeguatamente controllata ne! dominio analogico,, quindi la comunicazione
dellinformazione audio diventa problematica con le grandi distanze.
La tecnologia audio digitale, grazie allapplicazione delle metodologie di elaborazione
numerica dellinformazione, ha consentito di superare queste limitazioni intrinseche
dellelaborazione analogica del segnale audio, aprendo un ventaglio di applicazioni
virtualmente illimitato.
Le applicazioni della tecnologia audio digitale sono numerose e sempre pi diffuse in un
cotesto ove la tecnologia dellinformazione mette a disposizione piattaforme di
computing sempre pi potenti e adatte a soddisfare esigenze applicative emergenti come
laudio su Internet, le interfaccie uomo-macchina avanzate, i sistemi multimedia, i
dispositivi di comunicazione portatili, ecc.
;r,i
-N. ^
V,
'
Fondamenti di acustica
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Fondamenti di acustica
Natura del suono
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
rn i
minin mi mi
mi
, ,, ,i m*M**niit1fr'r
l'Il H' ni
m
ijn iiifHi i i t ninM
ni r i
fl
'''
I suoni sono parte integrante dellambiente entro cui viviamo, in parte graditi
(voce, m usica,...), in parte utili (campanello, sirena, ecc.), in parte sgraditi
(rumori).
Laspetto pi importante del suono la sua natura di segnale, cio di
informazione acustica. Linformazione che caratterizza il suono codificata
nella cosiddetta onda sonora.
Londa sonora il mezzo di trasporto dellinformazione acustica e consiste di
di compressione e di rarefazione del mezzo trasmissivo in cui si propaga. Le
infinite modalit di conformazione dellonda sonora consentono le altrettanto
infinite possibilit di produzione dei suoni.
Fondamenti di acustica
Parametri fisici del suono
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Londa sonora trasporta energia. Tale energia viene chiamata intensit sonora.
Lintensit di un campo sonoro lenergia trasmessa per unit di tempo in una
specifica direzione attraverso unarea unitaria normale a questa direzione.
DeciBel
Fondamenti di acustica
Effetti della propagazione del suono
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
10
Fondamenti di acustica
Potenza e Intensit in dB
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
11
Fondamenti di acustica
DeciBel
Attenuazione
Amplificazione
EquaLfzzazione
0dB
+12
-6
+30
+6
-6dB = x 0.5
+24
0dB
+18
-6
+12
-24
-12
+6
-30
-18
0dB
-12
+ 6dB = x 2
-18
27/01/2004
12
Copyright 2002-2003
Prof. Mario Malcangi
M[|
99
9_
Fondamenti di acustica
Decibel (cont.)
Sistema con
perdita
Sistema con
guadagno
+6 dB
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
13
Fondamenti di acustica
Misure acustiche
Le misure acustiche sono intese alla valutazione quantitativa del livello di pressione
sonora (SPL). La misura viene eseguita in dB utilizzando come riferimento la pressione
0,00002 Pascals rms. In questo caso la misura in dB viene identificata come dB(SPL).
Quando le misure acustiche riguardano limpressione soggettiva della percezione
dellintensit sonora (per esempio nelle misure di qualificazione dei livelli di
inquinamento acustico), allora si utilizza un filtro di ponderazione prima di eseguire le
misure. Il filtro di ponderazione riproduce la risposta in frequenza dellorecchio umano
(tipicamente pi sensibile alle frequenze medie). Il filtraggio di ponderazione pi comune
quello cosiddetto a pesatura A (A-weighting), da cui deriva il termine dB(A).
Quando per le misure si utilizzano apparecchiature che possono evidenziare perdita di
intensit per inserzione (insertion loss), allora necessario eseguire la calibrazione
della catena di misura eseguendo il cosiddetto audio level metering. Laggiustamento
della catena di misura viene eseguito in modo che il segnale audio non subisca n perdita,
ne guadagno nellattraversamento. Dato che difficile che un sistema si comporti
uniformemente a tutte le frequenze, viene eseguita la calibrazione della catena di misura
in modo tale che applicato in ingresso un tono puro a 1000 Hz con intensit pari a 0
dB(u), questo risulti in uscita sempre a 0 dB(u), cio senza perdita.
IVU (Volume Unit) meters sono gli strumenti di misura pi comuni presenti sulle
apparecchiature audio (ad esempio i registratori a nastro magnetico) che consentono di
valutare visivamente se il segnale di ingresso arriva allapparecchiatura senza perdita (o
guadagno). Questi non sono altro che voltmetri per corrente alternata (AC) con risposta
logaritmica. La risposta logaritmica comporta che la deflessione dellindicatore (ago,
barra, ecc.) sia proporzionale al volume percepito. La posizione 0 dB di un VU meter
indica la condizione di assenza di perdita per inserzione, quindi la condizione ottimale di
misura.
Fondamenti di acustica
Tono puro
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
15
I segnali audio trasportano informazioni che possono essere visualizzate in forma diretta o
indiretta nel tempo o in alternativa nel dominio della frequenza.
Sia nel dominio temporale, sia nel dominio frequenziale, le informazioni del segnale
audio sono le stesse, cambia solo la forma di rappresentazione.
Si definisce forma donda la variazione di ampiezza nel tempo caratteristica del
fenomeno acustico. Quella sinusoidale ad esempio la forma donda caratteristica del
tono puro.
Loscillogramma la rappresentazione grafica della forma donda nel dominio del
tempo.
Lo spettrogramma la rappresentazione grafica della forma donda nel dominio delle
frequenze.
<i
*
Fondamenti di acustica
Suoni complessi
I suoni reali hanno forma donda variamente modulata in ampiezza. Qualsiasi forma
donda, in accordo con la teoria dellanalisi armonica di Fourier, una composizione
lineare di toni puri di varia ampiezza, frequenza e fase.
I suoni complessi si suddividono in due categorie fondamentali:
Suoni periodici
Suoni aperiodici
I suoni periodici evidenziano una ripetitivit della forma donda. Questa ripetitivit
identifica il periodo, quindi la frequenza fondamentale (F0=l/T).
In accordo con la teoria dellanalisi armonica di Fourier, i suoni periodici sono
caratterizzati, oltre che dalla frequenza fondamemntale, anche da una ulteriore sequenza
di frequenze in rapporto armonico con la fondamentale (2,3,4, . . n volte la frequenza
fondamentale).
La sequenza di frequenze determinata dalla periodicit e dalla morfologia della forma
donda, porta alla rappresentazione nel dominio delle frequenze dei suoni periodici detta
uspettro armonico.
I suoni aperiodici, non evidenziano periodicit nella forma donda, quindi non hanno una
frequenza fodamentale caratterizzante. Lo spettro non dunque di natura armonica,
quindi le componenti frequenziali possono assumere qualsiasi valore diverso dalla
sequenza armonica.
I suoni periodici non esistono in natura come tali. Questi possono essere generati solo
artificialmente con apparecchiature elettroniche. In natura esistono comunque suoni
molto simili a quelli periodici, cio quasi periodici (sono ad esempio quasi periodici i
fonemi che compongono le parole e i suoni della maggior parte degli strumenti musicali).
Fondamenti di acustica
Strumenti di misura
Oscilloscopio
FF --------------r?-------------------- " "
___________________________________________________________________________
1 1..... .
.
____________________________
^Y ' '
________________ ;__________________________
______
_____ i
i ,
_
_____________________ _
A nalizzatore di spettro
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
18
I segnali audio possono essere visualizzati nel dominio del tempo con svariate
tecniche di rappresentazione grafica. Le pi efficaci e versatili sono quelle di
natura elettronica (in particolare quelle basate su computer).
Gli strumenti elettronici, in particolare quelli basati su computer, consentono
anche la rappresentazione grafica del segnale audio nel dominio delle frequenze.
La rappresentazione grafica del segnale audio consente la misura diretta
dell informazione.
Nel dominio temporale, lo strumento principale di rappresentazione grafica e
misura dellinformazione audio loscilloscopio; nel dominio lanalizzatore di
spettro.
Linformazione nei segnali audio nella variazione dampiezza nel tempo della
forma donda. Tale informazione varia istante per istante ed rappresentata
matematicamente come funzione continua del tempo (ampiezza istantanea):
Aj = A(t)
La rappresentazione deHinformazione di segnale richiede dunque la valutazione
di infiniti valori di ampiezza, uno per ogni istante di tempo.
Vi sono varie misure sintetiche dellampiezza di un segnale audio intese a fornire
una informazione finalizzata e sintetica:
Ampiezza massima: ampiezza massima (positiva o negativa) raggiunta dal
Fondamenti di acustica
Parametri nel dominio della frequenza
A(t) =
sin(2 Tift+tp^
f=irr
27/01/2004
Periodo
Copyright 2002-2003
Prof. Mario Malcangi
Fondamenti di acustica
Natura frequenziale del suono
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
21
Fondamenti di acustica
Modello armonico di Fourier
A(+ r/?.)
/
Copyright 2002-2003
Prof. Mario Malcangi*I
22
*
H
\1 V
Fondamenti di psicoacustica
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
25
Frequenza (Pitch)
.T
100
1000
10000
Hz
dB
120
90 60 -
Durata
30 -
0
Intensit (Loudness)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
26
Il suono esiste nella dimensione fisica (acustica) e come tale ha caratteristiche fisiche
specifiche:
Frequenza: numero di cicli (oscillazioni complete) per unit di tempo
Intensit: energia trasmessa per unit di tempo in una specifica direzione
Forma donda: struttura frequenziale del suono
Durata: intervallo di tempo di persistenza del suono
Dinamica: variazione dellintensit del suono caratterizzata essenzialmente da tre fasi,
eventualmente ripetute pi volte, lattacco, la tenuta e il decadimento.
Il suono fisico percepito dal sistema uditivo e da questo condizionato. Il sistema di
percezione uditiva non lineare, per cui non esiste una perfetta corrispondenza tra la
natura e lentit dei parametri acustici e quelli percepiti attraverso il sistema uditivo. Per
questo motivo, relativamente alla percezione uditiva, stato definito il modello
psicoacustico del suono. La psicoacustica, come lacustica, studia e definisce i parametri
costitutivi del suono, dal punto di vista percettivo. I parametri del suono non sono stimati
tramite strumenti, come in acustica, ma tramite la valutazione soggettiva. La
pisicoacustica definisce quindi la relazione tra i parametri acustici del suono e come
questi (in media) sono percepiti dagli esseri umani. I parametri psicoacustici che
consentono di descrivere compiutamente un suono sono:
Pitch: sensazione di altezza del suono legata alla frequenza
Loudness: sensazione quantitativa del suono legata allintensit
Timbro: sensazione di identificazione della natura del suono legata alla forma donda
(struttura frequenziale)
Durata-Dinamica: caratteristica percettiva che contribuisce allidentificazione del
timbro.
130
120
Concerto rock
no
100
90
80
Cabina di un aereo
70
Conversazione vivace
60
50
Citt di notte
40
30
Parlato sussurrato
Foglie che rotolano
20
IO
> 0
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
27
Fondamenti di psicoacustica
Sistema uditivo
Corteccia cerebrale
Padiglione
Area uditiva
Fibre nervose
Finestra
ovale
Canale
uditivo
Orecchio
esterno
1l
M|l
Il !H
Orecchio
medio
Ai| ! Ili 1
n 4
<N ^
Frequenze (Hz)
27/01/2004
Orecchio
interno
Copyright 2002-2003
Prof. Mario Malcangi
Sulla corteccia cerebrale vi sono le aree sensoriali, cio aree neurali che si sono
specializzate (durante levoluzione biologica) nella trasformazione degli stimoli sensitivi
in percezione. Si tratta di aree distinte, una per ogni tipo di sensazione sensoriale (visiva,
uditiva, olfattiva, tattile e gustativa). Larea sensoriale uditiva dedicata alla
trasformazione degli stimoli provenienti dallorgano uditivo attraverso le fibre nervose
del nervo acustico in percezioni acustiche primarie. Altre aree della corteccia cerebrale
sono dedicate allelaborazione di queste percezioni primarie ad alto livello. Ad esempio,
larea del parlato dedicata alla trasformazione testo-voce, alla identificazione del
parlatore, alla comprensione del parlato, ecc.
Fondamenti di psicoacustica
Sistema uditivo (cont.)
Elico trema
Membrana di Reissner
Membrana tettona
Scala vestibolare
Scala media
Membrana basilare
Scala timpanica
Finestra ovale
Apice
16 Hz
Finestra rotonda
27/01/2004
29
1
Fondamenti di psicoacustica
Sistema uditivo (cont.)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
30
Fondamenti di psicoacustica
Discriminazione della frequenza - Pitch
Fondamenti di psicoacustica
Discriminazione della frequenza - Pitch (cont.)
AF/FlI
50
100
10000
1000
Frequenza (Hz)
27/01/2004
32
Copyright 2002-2003
Prof. Mario Malcangi
Il test di discriminabilit del pitch viene eseguito generando due toni a frequenze
sufficientemente diverse tra loro da essere distintamente percepibili dal soggetto.'
La distanza ffequenziale viene gradualmente ridotta fino a quando il soggetto
riferisce di percepire un unico tono.
Il test di discriminabilit del pitch viene eseguito per tutte le frequenze e per vari
livelli di intensit, determinando un diagramma che evidenzia la natura
psicoacutica della percezione del pitch. Lorecchio maggiormente capace di
discriminare il pitch alle alte frequenze rispetto alle basse frequenze (
e
Biddulph, Jou rn al o f A coustical Society o f Am erica, Voi.
275, 1931).
n. 2, P a ri 1, p a g .
Fondamenti di psicoacustica
Discriminazione della frequenza - Pitch (cont.)
-o
I
g
Cl,
:
a
O
*5,
14001
1200
1000
s<1>
s
K
*
s
I
16
31
62
125
250
500
1000
2000
4000
8000
16000
Frequenza (Hz)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcang
33
La maggiore discriminabilit del pitch alle alte frequenze rispetto alle basse
frequenze anche evidenziata dal grafico cumulativo delle differenze di pitch
appena udibili: a circa 500 cicli al secondo la curva ha una crescita pi rapida in
quanto aumenta il numero di differenze appena percepibili.
Il totale delle differenze di pitch appena percepibili circa 1400.
Considerando che gli intervalli di pitch della scala musicale sono solo 120,
evidente che la musica tradizionale occidentale sfrutta pochissimo della capacit
percettiva dellorecchio umano relativamente al pitch (Lewis, U niversity o f Jow a
Studies in P syciology o f M usic, voi. 4, 1937).
Fondamenti di psicoacustica
Discriminazione della frequenza - Pitch (cont.)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
34
Psychology, Voi.
Questa caratteristica percettiva dipende dalla natura della risposta dinamica della
membrana basilare. La risposta di eccitazione della membrana basilare ad uno
stimolo sonoro di piccola durata con attacco e decadimento rapido (burst)
evidenzia un tempo di attacco e decadimento lento dovuto alle caratteristiche
risonanti dellorecchio. Uno stimolo audio troppo corto non consente allorecchio
di arrivare allo stato stazionario, quindi ad uno stato necessario alla formazione
della completa sensazione uditiva.
Fondamenti di psicoacustica
Discriminazione della frequenza - Pitch (cont.)
b
S3
.1
.2
.4
.8 1
8 10
20
Loudness (xlO4)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
35
Fondamenti di psicoacustica
Banda critica - Battimenti
tempo
Spetto a risoluzione
infinitesima
frequenza
frequenza
frequenza battimento
(fittizia)
tono singolo
con battimento
transizione
tono singolo
aspro
0
27/01/2004
distanza frequenziale
Copyright 2002-2003
Prof. Mario Malcangi
36
Fondamenti di psicoacustica
Percezione dellintensit (loudness) (cont.)
Copyright 2002-2003
Prof. Mario Malcangi
38
n.
Fondamenti di psicoacustica
Percezione dellintensit (loudness) (cont.)
1000
10000
Frequenza (Hz)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Fondamenti di psicoacustica
Percezione dellintensit (loudness) (cont.)
cq
a,
a
S,
a
sK
a
c
S
40
100
1000
10000
Frequenza (Hz)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
40
Fondamenti di psicoacustica
Mascheramento uditivo
10000
Frequenza (Hz)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
41
Fondamenti di psicoacustica
Timbro
Frequenza Hz
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
43
Fondamenti di psicoacustica
Durata
dB
if' l 1
1 j.u.11
Kie'"-i
JI uliiii!
m
Ijllf :
.i!21 .
iM
m
*i v;!YtFlit
r*i ft
4 (4 .
w::Aiiii
* i:!
-3
dB
-ili
iW
tM
irf.fi w'
il M
lu
il
N
l'M
iv V am
V
r 1 1J
111ilifu 'ni;
M
r*
Iti f
ir
f
li::
y
r
f
V
I
m
'M
4
Y
n
l
%
Jfl |f 1 *
Organo
.i
fINf I1 1
sec
4VM_l_
_
fi
1
~ rr
** i of.- . n i ! im ri
m
P ia n o f o r t e
*w1
'7i q-T,11-'-^
r*l !i
* io n ; i tr L'.ifli
i J cj-ii i**
V.
'
..j Wl p i.i.t,
fbli*, ;
H* flltt
fai. Ir
li l i f
i * ** *
... i
'ti1 iM, ] II
l ,\
M l i *i - M n L liltfH
sec
dB
i A , 4 * 4
I t t i
I * J i -
*|4*>
44
#M
lK
* '1
V f
( *li irifft
'1 I ffllff
sec
dB
fi
H
H t
Z."
M
M
r
w
/
4
-30
27/01/2004
sec
Copyright 2002-2003
Prof. Mario Malcangi
44
Fondamenti di psicoacustica
Perdita uditiva
00101001010001
00101001001010
00101000100101
01010001011101
10010100010010
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
47
LMnformazione, nel mondo fisico acustico, esiste sotto forma di segnale audio. Il
segnale audio la variazione di un parametro fisico (pressione) rispetto ad un altro
parametro fisico di natura indipendente (tempo e spazio).
I segnali audio, essendo portatori di informazione, sono oggetto di elaborazione da parte
dei sistemi, in particolare quelli di natura elettronica. Ne consegue la necessit di
trasformazione da natura meccanica del segnale audio in natura elettronica analoga.
Analogici sono definiti quindi i segnali nella loro rappresentazione elettronica. In
particolare, segnale analogico sinonimo di segnale contnuo. La discretizzazione del
segnale analogico porta alla definizione di segnale digitale (segnale numerico).
La trasduzione il meccanismo che consente di trasformare un segnale fisico qualsiasi in
segnale elettrico e viceversa. In particolare, la trasduzione da natura fisica qualsiasi a
natura elettrica si ottiene con i cosiddetti sensori, mentre la trasduzione da natura elettrica
a natura fisica qualsiasi si ottiene con gli attuatori.
Per esempio, per trasformare il segnale audio (natura meccanica) in segnale elettrico, si
usa il microfono (sensore meccano-elettrico), mentre, per trasformare il segnale elettrico
in segnale acustico, si usa laltoparlante (attuatore elettro-meccanico).
La trasduzione esclusivamente una trasformazione di natura fisica, quindi nulla cambia
relativamente airinfoimazione di segnale.
I sistemi elettronici consentono di elaborare Vinformazione di segnale, estraendo parte
dellinformazione, eliminando informazioni non desiderate, modificando
quantitativamente tale informazione, ecc.
La voce, per esempio un segnale che contiene informazioni di basso livello (intensit) e
di alto livello (parole, frasi, ecc.). Il riconoscimento automatico del parlato un esempio
di elaborazione del segnale.
Suono acustico
27/01/2004
fisso
Copyright 2002-2003
Prof. Mario Malcangi*Il
49
S u o n o e le ttr ic o
27/01 /2004
S u o n o a c u s tic o
Copyright 2002-2003
Prof. Mario MalcangiIl
50
0 1 2 3 5 1 0 - 3 - 1 18 24
Analogico
27/01/2004
Digitale
Copyright 2002-2003
Prof. Mario Malcangi
51
Campionatore
(Sampler)
Segnale PCM
campionamento
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
54
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
55
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
57
27/01/2004
Copyright 2002-2003
Prof. Mario MalcangiIl
58
Se il segnale a banda estesa viene limitato entro una frequenza massima non
superiore alla met della frequenza di campionamento, allora la sovrapposizione
tra la banda base e le bande replicate non avviene e quindi non vi aliasing.
"
a!
1 1 1 1
i
0
i
:
I
;
;
i
I[ 1
f
!I; i
!
1 2 2 3 3 3 2 2 2 2
l
2 bit
27/01/2004
!
:
!
l
ft
:
i
;
ft
2 2 = 4 livelli di quantizzazione
Copyright 2002-2003
Prof. Mario Malcangi*Il
SQNR m
SQNR
dB
B
27/01/2004
6.5
Copyright 2002-2003
Prof. Mario Malcangi
60
informazione
rappresentazione di valori reali con un numero finito di cifre. La quantizzazione produce
determinato
ampiezza
a altro segnale (rumore) che si somma linearmente al segnale
rumore di quantizzazione di natura statistica (rumore bianco)
quindi non separabile dal segnale quantizzato.
rumore
numerica. Per ogni cifra binaria utilizzata
quantizzazione si produce un miglioramento di 6 dB del rapporto segnale/rumore di
quantizzazione.
il rumore di quantizzazione non eliminabile, pu essere solo minimizzato.
Per ogni applicazione va stabilita la quantit minima di cifre che garantisce linefficacia
del rumore di quantizzazione sullinformazione contenuta nel segnale.
4
'
V?
SQNR = 20 logl0
A
-= 2 0 o g . - f - - = 20 log,0V = 205 log,02 = 20x0.301 s 65
2"
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
61
Q = V 2B
Il numero di bit di quantizzazione determina la quantit di livelli di
quantizzazione applicati alla gamma di ampiezza picco-picco.
.
-
' i
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
65
Lanalisi del suono consente di entrare nella microstnittura informativa del suono
per ottenerne la sua rappresentazione analitica. Le componenti informative del
segnale, misurate tramite le tecniche di analisi, sono la base di conoscenza che
consente di estrapolare modelli per la modifica dellinformazione acustica e per la
sua sintesi.
Quella di Fourier la pi importante delle tecniche di analisi frequenziale del
segnale audio, sia per la vicinanza al modello percettivo del suono, sia anche per
la relativa semplicit del modello matematico che ne consente una facile e
immediata aDDlicazione di natura numerica. La conoscenza del modello
armonica
corretta messa in opera, per evitare di generare insidiosi artefatti che inquinano la
misura dellinformazione di segnale.
La variabilit dinamica del segnale audio, sia quello musicale che quello vocale,
impone ladeguamento delle condizioni stazionarie di validit dellanalisi
armonica di Fourier alla dinamica del segnale audio. Lanalisi armonica di
Fourier a tempo breve un esempio di adattamento dinamico di un modello di
analisi stazionario, quale quello dellanalisi armonica di Fourier.
Altre tecniche di analisi sono proposte per lestrazione delle caratteristiche
informative del segnale audio allo scopo di ottenere una estrazione mirata di
specifiche informazioni (ad esempio le formanti fonetiche), oppure per
maggiormente avvicinarsi al modello fisico del suono.
Per approfondimenti: [Malcangi 03]
27/01/2004
Copyright 2002-2003
Prof. Mario MalcangiIl
68
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
69
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
70
impulso
tono puro
>
t
treno di impulsi
i m i .
-----
t
-11
>
t
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
73
Ogni suono ha la sua propria struttura armonica. Tale struttura armonica (spettro
frequenziale) rappresenta completamente il suono stesso, evidenziando
soprattutto le caratteristiche frequenziali.
Il tono puro per definizione ha uno spettro costituito da una sola linea spettrale
(per definizione), e ha una forma donda di natura sinusoidale.
Il suono determinato dallonda quadra ha una struttura frequenziale
caratterizzata dalla fondamentale e da una serie (teoricamente infinita) di
componenti frequenziali di ampiezza decrescente al crescere della frequenza.
Un caso particolare di suono il rumore bianco. Questo un suono
caratterizzato da una forma donda la cui ampiezza varia in modo completamente
casuale (a distribuzione statistica uniforme). Lo spettro corrispondente
altrettanto casuale nella sua composizione armonica (in ampiezza e in frequenza).
Il termine rumore conseguenza del fatto che questo suono nella maggior parte
dei casi indesiderato.
Un altro suono particolare limpulso (click). Questo un suono di durata
infinitesima e ampiezza finita. Lo spettro di questo suono altrettanto particolare
in quanto contiene tutte le componenti frequenziali a tutte le frequenze a partire
da zero e con ampiezza costante.
Una variante dellimpulso il treno di impulsi, cio una ripetizione periodica di
impulsi. Lo spetto corrispondente un treno di armoniche distanziate tra loro in
maniera uniforme.
Una ulteriore variante dellimpulso limpulso di durata finita. Lo spettro
corrispondente la funzione sen(x)/x.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Z^are
A)
A=V a + b
2
M M J.
2
a - - A sin (j)
= tan
b = A cos (/)
Formula di Eulero
Ini = Immaginario
Re = Reale
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
75
Serie di Fourier
--- ---- ^
Trasformata di Fourier
+CO
Diretta
-foc
x (i)=
I
k
X ( a ) = ^ x (t)e-Ja,dt
oo
-00
Inversa
ck
| x ( t ) e ~ J(kr' ) d t
T
1 +00
x (t)
27/01/2004
\ x ( c o ) e jmda)
00
: periodo
>
/o
Copyright 2002-2003
Prof. Mario Malcangi
76
D iretta
D iretta
A
-H x >
- t- 3 0
X (a t)= jx ( t) e - J*dt
(co) = X
OO
OU
In v ersa
&
Inversa
s
/
---------------------
x (t) =
* ( )
d - J . X ( a e ~ d ( a )
X
- 0 0
-H
x(r)=
Y Jx ( t ) S ( t
n =
co = 2izf
27/01/2004
- o o
t-nTs
Copyright 2002-2003
Prof. Mario Malcangi*Il
77
D iretta
N- 1
D iretta
+O0
X ( k ) = YJx (n )e
Inversa
1 //_]
J2nkn
x(n)~ J^X(k)e N
| X (co)eJ,md (cu)
K -n
n
co-27tf
27/01/2004
to
VJ
N*
= >
In v ersa
=
0
V*
II
-00
n=0
X (co) = Y, x ( n ) e ~ Jm
x(n)
-=o
= 0 ,1 ,2 ,...,
N - \
t~ n T s
Copyright 2002-2003
Prof. Mario Malcangi
78
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
79
elaborazione numerica molto semplice dal punto di vista della struttura di calcolo
(facile da codificare in termini di programmazione), ma estremamente intensivo
dal punto di vista computazionale (difficile da eseguire in tempo reale).
Per esempio, per analizzare un secondo di segnale vocale campionato a 8000 Hz,
con la DFT necessario eseguire, tra le altre operazioni, almeno 8000 x 8000 =
64.000.000 di moltiplicazioni e somme in un secondo !!! Considerando la
moltiplicazione e somma una sola istruzione (come per i DSP), sarebbe
necessaria una potenza di calcolo di oltre 64 MIPS (Milioni di Istruzioni Per
Secondo) solo per eseguire la DFT in tempo reale !!!
avi,A'
.liiicilff khiVWiM
, W
m i
t r i i i W
.f l it /
Ir iT , HI* rUiH
t
HiRV|IliWlM
T O ;,)
f o r ( i= 0 ; i < N - l ; i-H-)
*ItiM
%
*"! m a r ngiX...
M
i"
p
si<i
r l'ir
DFT diretta
Il
I ' ! '
M i
.
f o r ( |= 0 ; j < Nv /22 - l ; I+ + )
n i
M*
X'HIKmi {
Iti
k .
in .:
t.-til
H4*
ri
-
>
i
11!
K
:fl
; r .. -||| J : -
li,--u li'
X R ) = X R ( j) + x ( i) * c o s ( 3 .1 4 1 5 9 * I * J /N ) /( N /2 ) ;
.1
I MW* I *
ti: ih
1
;V
'-
:(;.i -nil1 I,;,VI|,n;JiM|l*
O .
III ff
' *)
.
(iF ,;r
tri r.
t i .lia I
M| | | *4
X I ( j ) = X I ( j) + x ( i) * s in ( 3 .1 4 1 5 9 * I * J /N ) /( N /2 ) ;
IH 1 V
r
t
"1fr.,
llllY ! !
l ! 1 I
H
*M
I l
I'
1 .1
%
h
I . I i .
i l i ' I 1 , 1 1 !
min'1!
i 1*'., i'.'LLr;H
Mm!
.,! M Imi'Un.| *v
'|l H' ivJllf
P itti
Jclrii
f o r ( i= 0 ; i < N / 2 - l ;i + + )
T.
f o r ( j= 0 ; j< N - l;i- H - )
m
*iM
Il
I liti
DFT inversa
\y
11
! ' i i m .
imhi
*
i
l\
Il |.nl.Ui.l'lr
*
rv
.Mi
i r
FUI
II111
V | VM
I4
(ft1I
I .
x ( j) = x ( j) + X R ( i) * c o s ( 3 .1 4 1 5 9 * I * J /N ) + X I ( i) * s in ( 3 .1 4 1 5 9 * I * J /N ) ;
}
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
80
PI - 3.141592653889793
N-Z**M
NV2-N /2
LE - 2"*L
N M l-N -l
LEI = LE/2
J-l
>
U- (1,0;0,0)
W =>eomplcx(cn(Pl/LEl), *ln((PT/LE1))
{ if ( I < J )
{ T=A(J)
A(J) - A(I)
A(I)**T
B it
R eversing
Passo
K = NV2
IP I + LEI
Butterfly
T A(IP) * U
Gruppo
A(IP) - A(I) - T
while (K < J)
A(I) = A(I) + T
{ J = J-K
u =u * w
K = K/2
)
J =J +K
>
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
82
Indice bit-reversed
000
000
001
100
4
V
010
010
Oli
110
100
001
101
101
110
011
111
111
Gli altri tre nuclei di calcolo rappresentano leffettivo calcolo della trasformata veloce di
Fourier, basata su una doppia iterazione (Passo e Gruppo) che ingloba una terza
iterazione, cio il nucleo di calcolo (FFT kernel) chiamato Butterfly.
Tempo
27/01/2004
'
84
La quasi periodicit una caratteristica dei suoni generati dalla maggior parte
forma
ripetitivit tali per cui vi sono piccole variazioni del periodo di oscillazione e
forma
sostanzialmente stazionario.
O L JL
W A A A W A t / J L
- -------- ^
--------- --------
-------------- ----------------------------------------------------------
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
86
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
87
Lanalisi del segnale pu essere applicata solo ad una porzione limitata di suono.
Loperazione di estrazione di una porzione limitata di suono implica
unoperazione di finestratura.
Loperazione di finestratura applicata ad un suono corrisponde al prodotto tra il
suono da analizzare e un suono particolare con forma donda rettangolare di
ampiezza minima nulla (0) e di ampiezza massima unitaria (1). Questo suono
(finestra) un impulso unitario di durata finita, quindi con funzione spettro
sen(x)/x.
Il prodotto nel dominio del tempo corrisponde alla convoluzione nel dominio
delle frequenze. Lo spettro della finestra si propaga quindi su ognuna delle
componenti ffequenziale del suono finestrato, producendo uno spettro risultate
fatto non di impulsi di frequenza come ci si aspetterebbe in accordo con lanalisi
armonica di Fourier, ma di una serie di campane in corrispondenza degli impulsi
di frequenza, cio la combinazione dello spettro del segnale con quello della
finestra.
Dominio temporale
27/01/2004
inio frequenziale
Copyright 2002-2003
Profi Mario Malcangi
88
27/01/2004
* * *
Copyright 2002-2003
Prof. Mario Malcangi
91
(> M r * * t u a l l l t i l
I a M M
W /*
il
27/01/2004
III
ft V
Copyright 2002-2003
Prof. Mario Malcangi
92
* * % *
/// * #
V M 4Y *
VAVW *
l l ' v
77f H f * . > V * *
k A /M ,tA M iA l
'
fi
T
ft t fit t lifc
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
93
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi*Il
95
Onda stazionaria
0 -
t(ms)
0.152
0.155
0.161
0.158
0.164
0 dB I
Spettro stazionario
0
27/01/2004
1.25
2.5
3.75
5.0
6.25
f (kHz)
Copyright 2002-2003
Prof. Mario Malcangi
96
inarmonica
vibrante) produce una componente fondamentale di frequenza abbastanza bassa e
armonico
fondamentale e di ampiezza decrescente.
In questo caso le fasi di attacco, tenuta e decadimento sono difficilmente
categorizzabili. La forma donda continuamente variabile, quindi, quali
porzione del suono di tamburo viene analizzata, lo spettro ottenuto non
r a n n r e s e n ta tiv o d e lla n a tu r a timbrica dello strumento.
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
99
Modificare un suono pu essere necessario per vari motivi: per eliminare del
rumore, per simulare un effetto ambiente, per amplificarlo, per identificare
infonnazioni nascoste, ecc.
Lanalisi frequenziale consente di ottenere le necessarie infonnazioni per
consentire azioni di modifica. Il filtraggio la tecnica fondamentale di modifica
della struttura informativa (frequenziale) del suono operando nel dominio
temporale.
Per approfondimenti: [Malcangi 03]
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
101
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
V,(t)
vu
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
104
x(n)
x(n)
x(n-1)
ZT
x(n-2)
r
a0 x(n)
a1 x(n-1)
<>
a2 x(n-2)
<
D
a0x(n) +a1 x(n-1)
*y(n)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
108
I filtri digitali derivano dai filtri analogici in quanto possibile emulare con i
componenti digitali le stesse funzioni dei componenti analogici.
La memoria digitale (numerica) consente di memorizzare i campioni del segnale
per ottenere 1elaborazione differita nel tempo, in accordo con il meccanismo di
filtraggio. La moltiplicazione digitale (numerica) consente di modulare lazione
delle memorie in maniera da simulare la diversa capacit di memorizzazione di
carica di condensatori di differente capacit.
Laspetto pi attrattivo della realizzazione digitale dei filtri sta nella semplicit
del modello algoritmico: si tratta di una semplice sommatoria di prodotti. Inoltre,
la possibilit di rappresentare attraverso il firmware la struttura funzionale del
filtro apre innumerevoli possibilit applicative, prima impossibili da realizzare
con la componentistica analogica.
v -i
y(n) = Ya( j ) x( n
y=o
+ 'Lb(k)y(n
k =1
Risposta finita
allimpulso
FIR
Retroazione
Risposta infinita
airimpulso
IIR
27/01/2004
Copyright 2002-2003
Prof. Mario MalcangiI
109
I filtri possono essere rappresentati anche tramite schemi funzionali (grafici) che
traducono in termini di blocchi di elaborazione di base il modello matematico
discreto.
La rappresentazione matematica utile alla progettazione di natura firmware
dellalgoritmo, soprattutto quando si utilizzano architetture di calcolo sequenziali
o a limitato parallelismo interno. La rappresentazione matematica dellalgoritmo
non evidenzia i parallelismi computazionali intrinseci dellalgoritmo.
La rappresentazione grafica dellalgoritmo consente invece di evidenziare i
parallelismi esecutivi e quindi, in una eventuale realizzazione hardware, di
sfruttarli adeguatamente in modo da ottenere le migliori prestazioni esecutive
possibili.
Osservando ad esempio il modello grafico del filtro, si rileva 1esistenza di
parallelismi esecutivi sia nella componente diretta (componente FIR), sia in
quella di retroazione. Tutti i prodotti tra i campioni e i coefficienti possono essere
eseguiti in parallelo (contemporaneamente) se si dispone di tanti moltiplicatori
indipendenti, quanti ne sono rappresentati nello schema funzionale del filtro, e di
due sommatoli a ingressi multipli.
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
112
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
113
(n)
h(n)
T T >
n
5
(n) = [ , , , , , , , ,
0
h(n) = [ , , , . ,- . ,- . ,- . , ,..., ]
0
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
116
Ogni sistema che riceve in ingresso un segnale x(n) risponde in uscita con un
segnale y(n). y(n) il segnale x(n) modificato dalle caratteristiche funzionali del
sistema.
Quando un sistema riceve in ingresso un impulso S(n), questo risponde in uscita
con una segnale h(n). Il segnale h(n) la cosiddetta risposta allimpulso.
Quando il sistema lineare, la risposta allimpulso ha sempre la medesima forma
donda a meno di un fattore di scala (omogeneit) e di ritardo (invarianza rispetto
ai ritardi).
y(n-l)=x(l)*h(n)
1-
P
10
T I r
T*
x(n)
I
In
10
11 > *
n
y(n)=x(n)*b(n)
y(n ) =
y(n-3)=x(3)*h(n)
y(n)
x(r)
10
T ri ' "*
'
*h(r) = V x{m)h{n m)
m= 0
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
117
T r >
X(k)
o
-------
H(k)
11 1 1
- 1
Y(k)
27/01/2004
------- Y (k)
H i r
X(k)H (k)
Copyright 2002-2003
Prof. Mario Malcangi
118
Uno dei principali vantaggi della convoluzione nel dominio delle frequenze la
possibilit di ottenere con estrema semplicit Foperazione inversa, la deconvoluzione.
Poich la convoluzione consente di ottenere il segnale di uscita y(n) quando sono noti il
segnale di ingresso x(n) e la risposta allimpulso, la deconvoluzione consente di ottenere
il segnale di ingresso x(n) che avrebbe prodotto il segnale di uscita y(n) se x(n) fosse
applicato in ingresso ad un sistema con risposta allimpulso h(n).
In certe applicazioni noto il segnale di uscita e le caratteristiche del sistema che lha
generato, ma non noto il segnale di ingresso. Per ottenere il segnale originario x(n)
sufficiente eseguire la deconvoluzione, cio il rapporto tra lo spettro del segnale y(n) e
quello della risposta allimpulso h(n).
La deconvoluzione una specie di macchina del tempo in quanto consente di tornare
ricostruire
;o Caruso. !
strumentazioni
Purtroppo
anni, quindi non possibile eseguire una replica.
La deconvoluzione non pu resuscitare Caruso, ma pu resuscitarne, o meglio
ricostruirne, la voce originaria. Essendo ancora esistenti gli strumenti di registrazione
originari, possibile ottenere la funzione h(n) e quindi il suo spettro H(k). Il segnale
registrato y(n) viene convertito in spettro Y(k). Tramite la deconvoluzione si ottiene
X(k), cio lo spettro del segnale originario x(n) che Caruso aveva prodotto quando fu
registrato agli inizi del 900.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
123
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Rendere finita una risposta allimpulso infinita comporta delle conseguenze sulla
natura della risposta in frequenza del filtro.
Se di una risposta allimpulso infinita si ignora una parte, considerandola finita^
la risposta in frequenza reale evidenzia delle oscillazioni laterali (ripple) che la
risposta in frequenza ideale non presentava. Ci comporta che non vi una
perfetta corrispondenza alle specifiche funzionali del filtro e quindi la necessit
di operare in modo da minimizzare gli scostamenti del comportamento reale
rispetto a quello ideale.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
125
Finestra
+oo
o
00
0
o
^ |
o
o
27/01/2004
t
Copyright 2002-2003
Prof. Mario Malcangi
f
128
Windowed-Sync
A Risp osta al lirapuJ Iso idei ile
F in estra
/\
/v ,
\
r
V V
o
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
129
Gli effetti del troncamento della risposta allimpulso possono essere minimizzati.
Il troncamento di fatto una operazione di finestratura. Come gi osservato
nellanalisi del segnale, la finestratura netta il prodotto tra il segnale da limitare
in durata e la funzione finestra rettangolare. Se la funzione finestra progressiva
e non netta come quella rettangolare, allora gli effetti del troncamento vengono
minimizzati.
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
- M<n<+M
130
f il i
I ! if tinn i
H
m i
> i
I* if*
I
a
li
i i t . J
i :
I V i Vi l
ir i n
.,
l ' r - i f * .
n
i - l
*
,
'
if "
-I
. 1 .
I S .
' ' l
'
If!
' - I . -
- 1 .
Ui I
llJirfniMIifI - li1
* ? li
Th*
v91V f
[ , . 1 1 1 , 1 1
1
n
U f
>
n u f
' J
.1
'rtuniti
t i ,
r . i i
"i
I.
'
* J
e
* V 1 ' , ' M
.11
4 .
(*T)
,/i
I l i
i
l l l Y !
; | r '
i M
- n
ij
1. 11r j ':ir
| f
' ';jyr,ii..1
-wj
It
i Ilo,:..il
) U i l
IM I
d r i l l i v *
i i,
r y - \
-,
.K
' W f
*
T
W ir I
I
1 1 .
i i
L , i V
*1' ir 1'*PnIM
'ltJi
IIIIII ,9f*Tlllf* VUVi
'
i l
l u
M | | |
f f f
a li
m r
m
t
. '* 1
J r ?
"
*
II
l | f 11
H I*
Passato
.
J l
feS'fei* ?*$
4 II II
> :
14-f
r , - 2
*ifylHi*jV
I
'
i i f v
.
1,41
" . p .
] f
..
- n
1 f 4H * H Mi
a 'iliIU II] I
a li
i ii
t I
-"MlpiV!
Mr.. viyii:.
\ rftlL li f i\f\\ * ti
i l , "
z*
i | . i ,
.|
1l
. U . l u
/ J l F
i l j
r i i
111.i,i
I I .
ili . r
'i t i
p i u
V F.'JI 'l|r
**
.Il I II
i. \
"
, i * S
i'
k !r,,. |i
,1
Ritardi
i , Jllfflflri
.i Vi'I (.
.r *-'N
I Vili
liil
I
111.
il
----
U r
Predizioni
ViiwbiT
27/01/2004
t i
*i.
Futuro
|J
' i
'
11
Rifilili
ex
S i
f ' M
V i !
.*
'!
Mi WhM*.
V |
|li
3 J I
i l . 1 '
'
1f
'
U t y
<
l i l U I
.4
nil : : 'id':rN'
.
'
4 . | | i
Ila
n, i l
I II
A,
Copyright 2002-2003
Prof. Mario Malcangi
132
Questo effetto di ritardo del segnale, per i sistemi digitali, cio che trattano
segnali campionati, il ritardo un multiplo del tempo di campionamento Tc>
quindi nTc, e conseguentemente lesponenziale complesso nel dominio delle
frequenze e snTc. Considerando esTc= z, i termini z"n rappresentano i ritardi
.-1
digitali (z_1 il ritardo unitario, pari ad un intervallo di campionamento).
Conseguentemente, i termini zn sono predizioni, cio anticipi di presentazione in
uscita.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
1 3 4
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
La sintesi del suono alla base di numerose applicazioni di audio digitale, dalla
realizzazione di strumenti musicali elettronici alla realizzazione di sistemi di
sintesi automatica del parlato. Tutte le metodologie di base, analisi e filtraggio,
concorrono alla implementazione delle principali tecniche di sintesi.
Per approfondimenti: [Moorer 77], [Moorer 75a], [Moorer 75b].
x ( n T s) oppure
x(n),
< n < N
2 ?
T: perodo di campionamento
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
138
La sintesi digitale dei suoni consiste nel generare la sequenza di numeri x(n) che
un convertitore analogico-digitale produrrebbe in uscita se in ingresso ricevesse il
suono che si intende sintetizzare.
La sintesi digitale dei suoni pu essere ottenuta nel dominio del tempo oppure nel
dominio delle frequenze.
Nel dominio del tempo la sintesi digitale del suono pu essere realizzata tramite
la rappresentazione matematica discreta del suono, oppure tramite un modello di
generazione numerica dei campioni del suono da sintetizzare.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
140
tempo
tempo
Tabella
LUT
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
141
Controllo
ampiezza
0*
yr
Tabella
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
143
tenuta
decadimento
00
-------- 10.15:
__
0 dB -,
27/01/2004
0.158
0.161
t (ms)
0.164
fondamentale
1
0.155
_L
-Ir
1.25
lidULl
2.5
3.75
5.0
_
f (kHz)
6.25
Copyright 2002-2003
Prof. Mario Malcangi
144
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
145
0
0
27/01/2004
100
200
300
400
t (ms)
Copyright 2002-2003
Prof. Mario Malcangi
146
S eco n d a a rm o n ica
3
<D
cl
te m p o
s<D
icr
,e
tem p o
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
147
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
148
Amp 1
Freq 1
O
O
O
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
149
A t ( n ) s i n {n T \ k a j , + 2 ^ F 1 ( n ) ] }
k =\
Copyright 2002-2003
Prof. Mario Malcangi
150
La sintesi additiva una tecnica di generazione di suoni che opera nel dominio
del tempo sulla base di informazioni acquisite in fase di analisi ffequenziale:
ampiezza, frequenza e fase delle componenti frequenziali di un suono.
La sintesi additiva di natura armonica, nel senso che le frequenze delle
componenti sono multiplo della frequenza fondamentale del suono oggetto di
sintesi.
Questo modello di sintesi additiva consente di includere informazioni relative
alla variabilit dellampiezza e della frequenza delle componenti armoniche.
Ak(n) e Fk(n) sono infatti due funzioni discrete del tempo che descrivono, per
ogni componente armonica k, come, campione per campione, rispettivamente
lampiezza o la fase della componente varia.
Ak(n) rappresenta linviluppo dampiezza della k-esima componente del suono
oggetto di sintesi. Con tale funzione quindi rappresentare, componente per
componente, lesatta dinamica (attacco, tenuta e decadimento) che caratterizza un
suono reale (ad esempio un suono di pianoforte oppure di tromba). Questo
controlIa.dell3_diuamica di amqiezza effettuato nel dominio delle frequenze
molto pi realistico del controllo della dinamica del suono effettuato nel dominio
del tempo, in quanto nei suoni fisici ogni componente armonica ha una sua
specifica dinamica dampiezza che contribuisce alla caratterizzazione timbrica.
*'
n + N -\
X x(m)sm(27T
m)
F
m -n
x{m)cos(2;r
b k{ n )
m
A () = J a k2 ( n ) + b] (ri)
OXn)
m)
F
()x
tan (---- )
bX
1 d d k( n )
F M
2 TC
27/01/2004
dt
Copyright 2002-2003
Prof. Mario Malcangi
151
AAAAAAA
) = (?!,*( 7=0
&=1
Copyright 2002-2003
Prof. Mario Malcangi
152
Deviazione
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Frquenza
modulante ()
153
/ ( t )=
A : am piezza di picco
I : indice di modulazione
a : frequenza portante (carrier) in rad/s
P : frequenza modulante in rad/s
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
154
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
155
Indice di modulazione
Componenti laterali di 2 ordine (J2)
0.5
0
Componenti laterali di 3 ordine (JQ
Indice di modulazione
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
156
J 5(I)sin(4fJ+...
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi*Il
157
fllKHHtem
ilir ooctfo'*.'
M w jx s .h *
oo
f T ' dc
0
.*
f
T [
:*r
ocom.-^
, W
. 0 0 . 0 0 . 4
r3 * 'T
O f l.Q > } ! f i
& . O
0 0 , 1 * 4
> X .^ p .K > .O C if
A % 9
27/01/2004
2496 Ufi&n
Copyright 2002-2003
Prof. Mario Malcangi
M
i*
nil
ir
W
li
Irli
"
*
i l J iy oooooo;m
I * !
n (>$.**.?
|||If W W W 7*
l
. 0
f o d
.O
.O
, 0
f r , * * ;
. 5
, 2 <
oo.oo.oo.Ui4
iil.lLJl_.J_.B ill
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi*I
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi*Il
162
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
163
Il segnale acustico viene poi modulato nel tratto vocale dalla forma del tubo
acustico data, fondamentalmente, dalla lingua. Ogni particolare forma del tratto
vocale ha delle frequenze naturali che producono dei picchi, sempre a tali
frequenze, nel suono uscente dalla bocca, le form anti.
Il contenuto energetico del segnale acustico concentrato principalmente
durante la fase di vocalizzazione.
ao
60
*o
20
ooo
Frequenza (Hz)
I
' V.
Segnale
Filtraggio
Passa-Basso
vocale
analogico
0-4 kHz
i'
.7
fjiif T ir
r
27/01/2004
'
I
:. rI..fj,V
iw'
1 1-11 1 .1
Quantizsazione
Lineare/non lineare
7-16 bit
ni:
Segnale
vocale
digitale
M
i
Copyright 2002-2003
Prof. Mario Malcangi
164
Lo spettro del segnale vocale si caratterizza per un rapido decadimento delle alte
frequenze. Ci impedisce agli algoritmi di modellazione del tratto vocale, in
particolare la LPC, di operare in maniera efficace. Per aumentare lefficacia di
questi algoritmi, opportuno processare preventivamente il segnale vocale con
un filtro di pre-enfasi:
H(z) = 1-az"1
ovvero
y(n) = x(n)-ax(n-1)
a=0,9375
y v ( /z
-m)x(m)e~J
27/01/2004
50 % di sovrapposizione
r 2rcn^
Copyright 2002-2003
Prof. Mario Malcangi
166
n-ly . . . * ,
\
' ,nf.'
,
j i
Il 4 ,
v
I M
/\
/\ / \
/ \ / \ A
.
,1.
mmm
.........................
M,..
V
Il "
' ICiMmsl!*
h
. . . .
I.,l''ll'V 1! *v
111 **
.................................................
. i r l i
f *1" - 11
*
T PM
T
r ih
r
i
te'iw
P
i*
\
i i
, 1V'ihrCil4,r i
-
tempo
H (z )= i^ = -------- 9.--------
1 + a xz A +... + a p[z~P
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
169
cM)
1 I
= log|X(A:)|e "
iv
27/01 /2004
Frequency
Harmonics
Magnitude
Phase
Filter
Low-pass Filter
High-Pass Filter
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
171
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
173
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
Frequenza di
cam pionam ento
G am m a
frequenziale
8
kHz
44.1 kHz
48 kHz
200-3400
20-20000
20-20000
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Bit rate
kbit al secondo
Hz 64
kbps
Hz 1411,2 kbps
Hz 1536 kbps
176
Algoritm o
Applicazione
B it rate (kbps)
CCITT G.711
CCITT G.721
CCITT G.722
ITU-T G.728
TIA
IS-54
TIA
IS-96
ETSI GSM
NSA FS1015
NSA FS1016
ISO
MPEG-1
ISO
MPEG-2
Telefonia fissa
Telefonia fissa
Teleconferenza
Telefonia fissa
Telefonia mobile
Telefonia mobile
Telefonia mobile
Telefonia sicura
Telefonia sicura
Audio (stereo)
Audio (5 canali)
64
32
32-64
16
0.8-8.5
8
5.6
2.4
4.8
128-384
320-384
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
177
27/01 /2004
Copyright 2002-2003
Prof. Mario Malcangi
178
...in
...n o
...101
...100
...Oli
...010
...001
...000
S ___
/
t
>
i --------------1
r ~
r ~
10
> 1
v i
V*
110
i -------------- 1-------------- r
1 0
64000 bit/s
705600 bit/s
Bit Rate
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
179
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
A-Law
1+ ln( j4|x|)
1 + In A
A t
3
= S gn (x)
Mu-Law
1+ ln ^
ln(l -f M u !X|)
F(x) = Sgn(x)
ln(l + /w)
< X <1
A
0<
<
1
A
0< x <1
x : segnale di ingresso
sgn( x) : segno di x
x : valore assoluto di x
Mu costante 255 (definita da AT & T)
A : 87.6 (definita dal CCITT)
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
181
Vi sono due codifice PCM non lineari standard, definite appositamente per la
comunicazione vocale digitale: A-Law e Mu-Law.
Si tratta di due codifche PCM non lineari, definite come standard di codifica
digitale della voce nelle applicazioni telefoniche digitali rispettivamente per
lEuropa e per il nord America/Giappone, che differiscono tra loro solo per il
profilo della curva di compressione della dinamica.
c==:i>
8000 bit/s
44100 bit/s
Bit Rate
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
182
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
183
X)
m
s(n)
-1
1+qz '
x ( n ) = G i r i ) - a xy { n
-P
-1
y (n
S o r g e n t e a r m o n ic a
A A A A A A A A A
M o d e llo d i
s(n)
S in te s i
y(n)
H(z)
S o r g e n t e in a r m o n ic a
27/01/2004
G
Copyright 2002-2003
Prof. Mario Malcangi
185
I sistemi di com pressione del segnale audio nel dominio delle frequenze
X (n )
C o d if ic a t o r e n
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
186
La compressione del segnale audio nel dominio del tempo non pu essere spinta
oltre quanto ottenibile con i modelli differenziali adattativi. Molta della
ridondanza legata alla struttura frequenziale, evidenziabile quindi solo tramite
un modello analitico operante nel dominio frequenziale.
La codifica in sottobande (SBC) un esempio di tecnica in cui la codifica
differenziale viene applicata al segnale scomposto in bande frequenziali.
il
Trf
iU&iriiAfc*i
A'
* i l 4
-u *
Il
lift
ir
i n
*I " I I
i
iti
!JL fL
il
m i i
i n
*'
fJlV4 P _
(Il
i: L
p<:
Ini!
-l *I
80^
f II
Co
r<3
'S
Al t 4
100
l i t
120
ifV
? m i
:il
m i
.I
u <
-----------------------------
Ih
.
i . u
l!\V
I
I . - .
^
:i li
M I
14 L
14
l
lili
- Ir
r * - I
i ' l l
.1
"f V
il
*nj
in
w|
r i
di-
K M
'111.
li'
1,
l i ! Ili
irti')t'H'fi
.ft
u
li H!! 'i4!
-*rii
i*r
1000
27/01/2004
10000
Frequenza (Hz)
Copyright 2002-2003
Prof. Mario Malcangi
188
dB
Tono mascherante
SMR
Soglia di mascheramento
SQNR
NMR
Livello del rumore di quantizzazione
Banda critica
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
Hz
189
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
190
La codifica MPEG Audio uno standard di codifica audio definito dalla ISO
(International Standard Organization) nellambito MPEG (Moving Pictures
Expert Group) nellambito del pi ampio obiettivo di definizione di uno standard
delle immagini in movimento con audio associato per media di memorizzazione
digitale fino a 1,5 MHz.
La codifica MPEG Audio rappresentativa della classe dei sistemi di
compressione con perdita di informazione lossy). In questo caso la riduzione
della quantit di informazione codificata si basa sul modello percettivo (derivato
dal modello psicoacustico). Linformazione viene ripartita in bande per poter
applicare il modello percettivo che mette in relazione la percezione del pitch con
lintensit e a frequenza.
Lo standard MPEG Audio consiste di tre livelli (layer), ognuno dei quali consente
di ottenere prestazioni crescenti di qualit del segnale codificato a costo di una
crescente complessit computazionale e di sistema.
I bit rate audio supportati sono 32000, 44100, 48000 e bit-rate variabili tra 32 e
192000 bit/s per i canali audio monofonici.
Lo standard prevede varie configurazioni di canale singolo e doppio, oltre alla
modalit stereo e stereo congiunto.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
191
=0 j=0
A ( n , k ) = cos[( 2
n:
t:
y(( n) :
C (.) :
x(.) :
A(n,k) :
27/01/2004
+ !)( - 16)(;r /6 4 )]
t per
la sottobanda
Copyright 2002-2003
Prof. Mario Malcangi
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
195
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
La percezione della componente spaziale del segnale audio basata sulla capacit
del sistema uditivo di misurare e correlare in maniera molto raffinata le
differenze temporali di arrivo delle singole sorgenti sonore alla posizione
dellindividuo. In paricolare, ogni sorgente sonora in campo chiuso produce sia
un suono diretto, sia vari suoni indiretti podotti dalle riflessioni del suono diretto
sulle pareti dellambiente.
Il suono diretto il primo a raggiungere lascoltatore. Successivamente arrivano
le prime riflessioni. Queste possono essere percepite come echi se vi un minimo
intervallo temporale di arrivo rispetto al suono diretto.
Al suono diretto e alle prime riflessioni si aggiungono le riflessioni multiple
(indirette) dovute a ripetuti rimbalzi sulle pareti del segnale diretto prima che
questo si direzioni verso il punto di ascolto. Queste riflessioni indirette sono
temporalmente molto ravvicinate tra loro e numerose, dando la sensazione
percettiva acustica delleffetto riverbero.
Suono diretto, prime riflessioni (echi) e riflessioni multiple (riverbero) hanno una
caratteristica di distribuzione temporale caratterizzata da ritardi crescenti con
intensit delle singole componenti decrescenti in intensit.
Un sistema di generazione artificiale della componente spaziale del suono si basa
essenzialmente su un sistema di ritardi programmabili e di ricombinazione.
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
200
Uscita
Ingresso
Ingresso
27/01/2004
Uscita
Copyright 2002-2003
Prof. Mario Malcangi
201
Leffetto coro una situazione audio simile a quella del reverbero non
determinate daHambiente ma dalla presenza contemporanea di molteplici
sorgenti sonore tutte uguali tra loro. In pratica si tratta della diffemte percezione
acustica fornita da un singolo strumento rispetto a numerosi identici strumento
(ad esempio 100 violini che suonano lo stesso brano contemporaneamente,
oppure cento persone (coro) che canta la stessa melodia).
Leffetto coro viene determinato da piccole variazioni di intensit e di frequenza
delle singole sorgenti. Tale effetto pu essere simulato con buona
approssimazione realizzando un banco parallelo di ritardi programmabili (da 10 a
50 ms) e di guadagno variabile.
27/01/2004
/W
V w
rM
il/ litUji.i.
00101001010001
00101001001010
00101000100101
Copyright 2002-2003
Prof. Mario Malcangi
205
D bus
J A - ..
HPit
ALU
Am2903
Y bus
______ _______
Data
Memory
t ____
D
Multiplier
DAC
t
S&H
LPF
analog voutput
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
206
Intorno agli anni 80, Dean Wallraff della Digital Music Systems Ine., realizz il primo
microcomputer capace di elaborare il segnale audio in forma numerica e in tempo-reale. Il
primo esemplare di questa innovativa macchina di calcolo numerico specificamente
pensata per lapplicazione audio fu acquistata dal LIM, il Laboratorio di Informatica
Musicale dell Universit degli Studi di Milano creato da Goffredo Haus proprio in quegli
anni. Grazie alla disponibilit di questa macchina fu possibile realizzare le prime
applicazioni di Computer Music ove la produzione e lelaborazione di suoni avveniva in
tempo reale.
Il DMX-1000 fu basato sulla pi innovativa delle tecnologie di microcomputing allora
disponibili: il bit-slice AM29xx. Questa tecnologia, realizzata dallAdvanced Micro
Devices (AMD), oltre ad essere ultraveloce (tecnologia ECL), era anche modulare. La
CPU, cosiddetta slice, era a 4 bit, quindi molto piccola, ma componibile a piacere per
ottenere architetture di qualsiasi dimensione. Nel caso del DMX-1000 fu adottata
unarchitettura a 16 bit (quattro slice da quattro bit) per soddisfare le esigenze
dellelaborazione del segnale audio digitale di qualit professionale.
*
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
207
* 1 .
vP
1
.
r* I I I
1 2 -b it M u ltip lie r - A c c u m u la to r
. v
4*#W
V A 'V ,
VA%V*
.w
.t~
^ " 1
^ ----- O OUT
rw M
3.******
v / n '.W
Qt*T*QV
A v /
TOC***M
CU
V .V >%W
'A M
27/01/2004
/A
A W JP
* M W
* * /
* W
- v
*a
f M **
. . . .
. ^
, >
* * r *
. w X
Copyright 2002-2003
Prof. Mario Malcangi
Il DMX-1000, dal punto di vista dellarchitettura dei sistemi digitai audio, era innovativo
sia per ladozione dellarchitettura Harvard (adottando la tecnologia bit-slice AM2910)
per implementare il pipelining esecutivo delle istruzioni, sia per ladozione
dellarchitettura MAC (Multiply-Accumulate) per implementare il pipelining esecutivo
sui dati (adottando il moltiplicatore-accumulatore TRW).
In figura riportata unimmagine del chip MAC della TRW in package DIP (Dual-InLine) di ben 64 piedini, risultando uno dei componenti pi complessi dellintero DSP
DMX-1000.
Questo dispositivo, realizzato in tecnologia ECL, dissipava una enorme quantit di
potenza elettrica (dellordine dei Watt) e conseguentemente di calore, tanto da necessitare
di un voluminoso dissipatore che impedisse la distruzione termica del dispositivo.
/
A
"'1
M EM O R IA PR O G R A M M A
(0)
(1)
(2)
(3)
(4)
(5)
(6)
(7)
CLR
NXT
MOVD
NXT
MOVD
ADDDA
NOP
MOVD
,X0,BS
,D,X
,X1,B,D
X1,X1,B,D,WY
,N,DAC
M EM O R IA DATI
[0] Ampiezza
m SI
[2] Fase
27/01/2004
; controllo ampiezza
; controllo frequenza
; fase delloscillatore
1
fl
Copyright 2002-2003
Prof. Mario Maicangi
209
Microcode
Sequencer
Microcode
ROM
Memoria
D ati/Programma
Bus Indirizzi
Bus Dati
ALU
Registri
Sequenza di programma
Fetch
istruzione
Decodifica
istruzione
Fetch
operando
Esecuzione
operazione
Fetch
operando
Ciclo istruzione
Pi cicli di clock per una istruzione
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
210
Sequenza d
programma
in pipelining
Memoria
Dati
Un bus per accedere alla memoria dati
FI : Fetch Istruzione
DI : Decodifica Istruzione
FO : Fetch Operandi
EO : Esecuzione Operandi
Istru z io n i
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
211
capaci di eseguire tutte o quasi le istruzioni in un solo ciclo istruzione (due cicli
di clock (x2) o eventualmente anche in un solo ciclo di clock (xl)).
Larea di silicio risparmiata grazie al set ridotto di istruzioni impiegata per
portare il parallelismo esecutivo alle estreme conseguenze, ovvero una intera
MAC eseguita in un solo ciclo istruzione, incluse tutte le operazioni connesse,
come il load e lo store degli operandi e laggiomamento degli indirizzi di
memoria per laccesso ai dati delloperazione, ecc.
>0*1
551
*w*d&c<*
6I
Intonaco
h o*
___
^ .vi
^ r S i WK*
4CS>ft m24
XOmtft I VpAtA
or
RAM
RAM
(37 2 4 *nd 204**24 \i0A* A 24
nntrucLfcan
I
C acao
IB M :
Peripheral
e panalo Area
SiTchorvic
OMA Unti
2 4 - B lt
B
O
O
ttS
f
3PW 300
C o re
Extwaa
Bu*
**<*
4
Coft*
I
Centri
IntorrxM
Dflt*
8U$
M*rrc*y
S W iT O ri
exTAI
CkiCk
Cancroio?
FrgiSm
&00fftf*^rtro*UM
>
Pro^r^vm|
Doc**)*
W
1M
CdAftJttcr
M
OODrHKO
PINIYr
27/01/2004
| P/qrhm| 24*2**6*'*$$-*>
*JMC
Aderta , Tvm-5&-bi
G#riG*trtcr
r^hii tkw^ sa^w
Data
J'TAO
MttMMS*
M
OOAinoX
Copyright 2002-2003
Prof. Mario Malcangi
HOU
W w fiw *
ess
hm
1
3C1
M o rto #
ki5lnic*ion
1024 24\
Peripheral
Exp*hfon Aree
c*Jrt*U
XAO
a n o te H o o
U
nii
FAB
S*XChJV*<
iti
*>MA Unii
24-B lt
SP3O30
Cor
i -Cftcr.
C o n t/ C f
C e n im i
Intorno*
Oft
6m
seifen
EXT At
C>C#A
en*****
iM
*rrxxy
:JP
ro
;
;
v
,Z
>
w
, PtMm,
Intsrrwl W~*k Dea**
!-* ! Add.**
Cs
h$ST
M f
A A A * . a
P
IN
IT
3
M
T
* m
$K
m
o
d
S
T
r
o
o
MOfXvTfifi
JTJKt
MODULS
MOOArth
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Tutte queste operazioni, per operare in tempo reale, devono essere eseguite in un
solo ciclo di clock. L architettura DSP56000 realizzava in tal modo, oltre al
parallelismo esecutivo delle istruzioni, anche un elevato parallelismo esecutivo
sui dati, sempre in pipelining. In particolare larchitettura DSP56000
implementava in pieno parallelismo:
una doppia memoria dati (memoria X e memoria Y) con triplo bus di accesso
parallelo (bus x, bus y e global bus)
un doppio accumulatore a 56 bit
una unit MAC (Multiply-ACcumulate)
una unit aritmetica di indirizzamento (ARU)
altre unit di controllo (controllo della saturazione, scaling automatico, ecc.).
Larchitettura DSP56000 consentiva dunque di implementare una TAP di filtro
FIR con una sola istruzione (due cicli di clock), ottenendo quindi la massima
prestazione possibile da una macchina Harvard.
Levoluzione dellarchitettura DSP56000 trova oggi la sua massima realizzazione
nellarchitettura DSP56300. Questo, mantenendo tutte le caratteristiche originarie
del DSP56000, ha introdotto alcuni nuovi elementi di architettura di elaborazione
e alcune importanti innovazioni tecnologiche come lesecuzione delle istruzioni
in un solo ciclo di clock (xl), rispetto allarchitettura precedente che richiedeva
due cicli di clock per istruzione (x2).
Instruction Cycle
Operation
Fetch 1
Fetch 2
Decode
Address Gen 1
Address Gen 2
10
11
n1
n2
n3
n3e
n4
n5
n6
07
n8
n9
nIO
n1
n2
n3
n3e
n4
05
06
07
n8
n9
n1
n2
n3
n3e
n4
o5
06
07
08
r tf
n2
r>3
n3e
n4
n5
06
n7
nl
n2
03
rt3e
n4
ri5
n6
n1
n2
n3
o3e
04
n5
n1
n2
n3
n3e
n4
Execute 1
Execute 2
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
214
PreFetch-l
PreFetch-ll
Decode
Address Gen-I
Instruction Decode
Address generation for Data Load/Store operations
Execute-Il
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
215
Fido
M
/K
0
fo
r
U
Hr
<
w
r*
*
ti
fbf#*JW0Octjtetot
Miu
fycaniM
M
i<>r
n
un
&
jn
d
rmUh
?
AtamtutiMr
Sh*fiw
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Fractional
Signed Multiplier
1
r s ir r -
-4
.MSP
LSP
2N - 1 Product
_ l
| S4 '
MSP
2N - 1 Product
1
| ~5~1
LSP
Zero Fill
--------------------------2N B its----------------------
27/01/2004
Signed Multiplier
------------------------- 2N B its---------------------- *
Copyright 2002-2003
Prof. Mario Mal cangi
218
----XA VA PA8
I
NO
MO
N1
M1
N2
N3
27/01/2004
M2
M3
Address
ALU
r
/
Tnple Multiplexer
EP
RO
R4
R1
R5
r~ 1
[
R2
R6
M4
N4
A d d re s s
M5
N5
ALU
M6
N6
M7
N7
R3
R7
Copyright 2002-2003
Prof. Mario Malcangi
219
Segnale di Input
Senza saturazione
Con la saturazione
A = +0.9999...
|Errore| = 1.0
27/01/2004
Errorc| = 0.00..01
Copyright 2002-2003
Prof. Mario Malcangi
220
Nei sistemi di elaborazione analogici il segnale, quando supera la portata piccopicco di ampiezza del dispositivo cui applicato, satura e produce una distorsione
armonica nel segnale processato.
Nei sistemi di elaborazione digitali del segnale, quando lampiezza dei campioni
supera la capacit di rappresentazione numerica del numero di bit adottati dalla
specifica architettura di elaborazione, prodotto un effetto chiamato overflow.
Questo effetto, se non gestito, produce come risultato un ribaltamento in negativo
(in positivo) di un numero positivo (negativo), cio il wraparound della
rappresentazione numerica a precisione finita.
Per i segnali digitali il wraparound un effetto disastroso in quanto introduce nei
segnale una grave distorsione dellinformazione e un comportamento anomalo dei
sistemi cui il segnale distorto applicato.
Loverflow numerico del segnale va opportunamente gestito in modo che non si
produca mai (aumentando la capacit di rappresentazione numerica) oppure che si
produca nella stessa maniera della saturazione analogica.
L architettura DSP56300 implementa in hardware il controllo della
saturazione (aritmetica di saturazione).
REP
# N -1
M AC
X 0 ,Y 0 ,A
M A C R X 0 .Y 0 ,A
X 0 ,X : ( R 0 ) +
Y : ( R 4 ) + ,Y 0
X : ( R 0 ) + ,X 0
Y : ( R 4 ) + ,Y 0
(R O )-
Xmem
O-N-l
Campioni
di
segnale
Ymem
*-----
x(n)
*
x(n-l)
b,
b2
b3
x(n-2)
x(n-3)
27/01/2004
R4
Aif,
Coefficienti
del
filtro
...
221
Copyright 2002-2003
Prof. Mario Malcangi
X0,X:(R0)+
Y:(R4)+,Y0
X0,Y0,A
X:(R0)+,X0
Y:(R4)+,Y0
X0.Y0,A
(R0)-
Durante lesecuzione del kernel del filtro FIR non vi esecuzione di istruzioni di
controllo. Quindi, per unesecuzione monoprocessore, limplementazione di un
FIR sullarchitettura DSP56300 raggiunge il massimo dellefficienza.
I
X 0 , Y 1, A
X :(R 0 )+ ,X 0
Y :(R 4 )+ ,Y 0
M AC
X 0 ,Y 0 ,A
X :(R 0 )+ ,X 0
Y :(R 4 ),Y 0
MAC
X O ,Y 0,A
X :(R 0 )+ ,X 0
Y :(R 5 )+ ,Y 0
MAC
X 0 ,Y 0 ,A
X :(R 0 )+ ,X 0
Y :(R 5 ),Y 0
M AC
X 0 ,Y 0 ,A
X :(R 0 )+ ,X 0
Y 1 ,Y :(R 4 )
A ,X I
A ,Y :(R 5 )
M OVE
M0=4
RO
Coefficienti
del
filtro
Xmem
2a
a
Ymem
x(n-l)
M4=l
R4
x(n-2)
segnale
y(n-l)
-b
y(n-2)
a
27/01/2004
Campioni
di
R5
M5=l
222
Copyriglit 2002-2003
Prof. Mario Malcangi
;Y 1=x(n)
MPY
MAC
MAC
MAC
X0,Y1,A
X0,Y0,A
X0,Y0,A
X0,Y0,A
;X0=a
X:(R0)+,X0
X:(R0)+,X0
X:(R0)+,X0
X:(R0)+,X0
MAC
MOVE
X0,Y0,A
X:(R0)+,X0
A,Y :(R5)
Y:(R4)+,Y0
Y:(R4),Y0
Y:(R5)+,Y0
Y:(R5),Y0
;A=ax(n)
;A=A+2ax(n-1)
;A=A+ax(n-2)
;A=A+cy(n-1)
;A=A-by(n-2)
Y1,Y:(R4)
A,XI
;y(n)=2A (scaling-up attivo)
;X 1=y(n)
Anche in questo caso, considerando la soluzione monoprocessore, la codifica la
pi efficiente possibile.
B Buw fCoefflclanfi
ReglMrelntygoQ
Shifter
Splittable
drMGoda
BAB
'"Wei
27/01/2004
DAB
FAB
CAB
EAB
5 Address Busses
24-bit
Copyright 2002-2003
Prof. Mario Malcangi
223
OUAL-PORTED SRAM
PROCESSOR
rm in
IW THUCT10K
CACHE
*3
JTAO
TWO m O t P C H O E K T
D U AL-PO U TED B L O C K *
M IT
PROCESSOR PORT
A
f l
?R3
i * o * a.M
S S Q O tltC tR
DATA
s
I/OFORT
TEST A
I M U L A TION
A DD I
Il A
SE
EXTERNAL
P O RT
rw AODHCia ou
OUA&DKES3 SUS
MuuiPMncESaon
IN
T
E
R
FA
C
E
Iz
PM D A T A OUS
BUS
CONNECT!
(PM
DM D A T A BU
Ti
I HO*r ftO*T j
DATA
DATA
tieaiBVEH
P IL I
<PZ*\
M U LI
f
tu * 4o-&r ARREL
1 fjtIPT*
m
neai5 reo
iz
P ILE
iPBy
0AQREL
1 V 4 O - 0 I T
H iP T E fl
H
U
LT
r TH
r
ALU
A l
DMA
fO
P
R
ECilCTEW
a
<
r , M
CONTROLLER
)
CONTROL.
STATUS, A /1_K
DATAUFFENS
UNK POfr
r/o PROCESSOR
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
224
AD SP 21160
Link
Port
External
Port
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
225
Memoria
Esterna
Periferiche
27/01/2004
Copyright 2002-2003
Prof. Mario Mal cangi
226
Al
a
X
contatore
prodotto
Y
Scapi]
&x[nj
&Y
.S
Y =
MVK
.s
LDH
.D
40, A2
*A5++, A0
LDH
.D
*A6++, Al
MPY
ADD
SUB
.M
.L
.L
A0, A l, A3
A4, A3, A4
A2, 1, A2
.S
lo o p
STH
.D
A4, *A7
loop:
X
.D
A15
[A2]
32-bits
Memoria Dati
27/01/2004
an * x
An
n = 1
Copyright 2002-2003
Prof. Mario Malcangi
227
Register File B
BO
B1
B2
B3
B4
AO
Al
A2
A3
A4
B15
A15
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
228
Tipologia
Cicli di attesa
Istruzione
singolo ciclo
Uno
Zero
IMPY
Due
Uno
Cinque
Quattro
Sei
Cinque
[
Load
[ iBranch
[
27/01/2004
Numero cicli
Copyright 2002-2003
Prof. Mario Malcangi
229
Program
Fetch
PG
(1)
Decode
PS
PW
PR
DP
DC
(2)
(3)
(4)
(5)
(6)
Execute
El
E2
E3
E4
E5
E6
Copyright 2002-2003
Prof. Mario Malcangi
230
_______
t/T l T
n - * : . '
rSSzP aL I v . U \
.DI
'W
lfo
f ^
M
i1
T M
l'
NOP
Wl(l
1*
_____
'
figli
ncuuuqi,
I*'rm
T
HOT
DI
A4,*A7
fai!
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
231
External
Interface
Il bus istruzioni quindi ampio 256 bit, rendendo cos possibile il fetch di una
istruzione VLIW con un solo accesso alla memoria di programma.
DMA
D (32)
EMIF
,D2
Serial Port
.MI .M2
Host Port
.LI
.L2
Boot Load
.S2
Timers
.DI
Memoria
Esterna
.SI
Control Regs
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
Pwr Down
234
Sequenziale
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
G PIO x76
Watchdog
MART x2
MSP
(AC97J2S.S P\)
MMMMBfl
Interrupt
Controller
Bridge
Bridge
I2C x2
Color LCD Ctrl
Display I/F
16 Channel
DMA Ctrl
27/01/2004
BAM/ROM
Secured
Audio Smart
Accelerator
Video Smart
Accelerator
Camera U f
Copyright 2002-2003
Prof. Mario Malcangi
236
ai
!I t
Instruction
RAM
MMDSP+
Host Data
Bus
Slave AHB
_____________________ _____________________________________
CCP/CCIR656
(Picture Post
Processing)
(Video
Codec Unit)
Video l/F
(Picture Input
Formating)
Master
AHB
fv
Accelerator
Data Bus
u W Itf
27/01/2004-
Copyright 2002-2003
Prof. Mario Malcangi
237
Slave AHB
ARM
DMA
l/F
.......
. . . . I . l l i l ,
XD Bus
DMA
l-Cache
DMA
Master AHB
238
Parlphorab
Accelerator*
te Driver
Tkt
Physical
HI
Physical Drivers
1 im a s r ir iT i
v .v .
M C U Cora
' *- J f],f I
! [Irti-
peripherals
Common
ulti media
pertetberefa
Btfr
*
feliii
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
239
27/01/2004
Copyright 2002-2003
Prof. Mario Malcangi
241
[AA.W . 96] Standards in Computer Generated Music, multiplatform mixed mode CDROM (Macintosh, Windows, Unix + CD-DA tracks), G. Haus & L Pighi Editors,
IEEE Computer Society Press, 1996.
[Abramowitz 65] Abramowitz - Handbook of mathematical functions, Dover
Publications, New York, 1965.
[Jayant 97] N. Jayant - Signal Compression: Coding of speech, audio, text, image and
video, World Scientific Publishing, Singapore, 1997.
[Malcangi 03] M. Malcangi - Elaborazione Numerica del Segnale - Digital Signal
Processing: teoria e pratica, Ed. Libreria CLUP, Milano 2003.
[Moorer 75a] J. A. M oorer- On the segmentation and analysis of continuous musical
sound by digital computer, Standford University, report number STAN-M-3.
[Moorer 75b] J. A. Moorer - The synthesis of complex audio spectra by means of
discrete summation formulae, Standford University, report number STAN-M-5.
[Moorer 77] A. Moorer - Signal Processing aspects of computer music - A survey,
Computer Music Journal, February, 1977.
[Olson 67] H. F. Olson - Music, physics and engineering, Dover Publications, New
York, 1967.
[OShaughnessy 87] D. OShaughnessy - Speech sommunication - Human and
machine, Addison-Wesley, Reading (MA), 1987.
[Watkinson 01] J. Watkinson - The art of digital audio, Focal Press, Oxford (MA),
2001.
euro 14,00
9 788870 9 0 6 5 9 2