Sei sulla pagina 1di 200

Università degli Studi Politecnico di Bari

Ancona

Tesi di Dottorato di Ricerca in Fisica Tecnica


XIV ciclo

Caratteristiche acustiche delle chiese


romaniche in Puglia

Relatore Dottorando

Prof. Ing. Ettore Cirillo Dott. Ing. Francesco Martellotta

Ancona, Dicembre 2001


Abstract

Il lavoro di tesi riassume i risultati di una campagna di rilievo acustico che ha preso in
considerazione nove chiese Cattoliche costruite in Puglia durante il periodo Romanico.
Le chiese studiate hanno volumi variabili fra 30.000 e 1.500 m3, mentre le differenti
caratteristiche architettoniche (coperture voltate o a tetto, presenza o meno del transetto,
ecc.) danno luogo a comportamenti acustici differenziati e di grande interesse. Nei primi
quattro capitoli vengono fornite informazioni introduttive, necessarie ad inquadrare la
problematica e a comprendere la successiva indagine sperimentale. In particolare, il
primo capitolo illustra i rapporti fra architettura, musica, acustica e liturgia; il secondo
capitolo descrive i parametri acustici impiegati nell’indagine; il terzo capitolo descrive le
tecniche di misura impiegate; mentre nel quarto si propone una breve indagine
bibliografica sui principali studi presenti in letteratura sull’acustica delle chiese. Nel
quinto capitolo vengono descritte in dettaglio le singole chiese, sia in termini
architettonici sia acustici, discutendo i risultati dei rilievi condotti. Infine, nel sesto
capitolo si analizzano i risultati nel loro complesso, mostrando l’esistenza di correlazioni
fra alcuni dei parametri acustici e fra essi e le caratteristiche geometriche degli ambienti.
Alla luce di ciò vengono anche proposti due modelli di calcolo dei parametri energetici
che correggono la teoria di Barron in modo da tenere conto delle particolari condizioni
presenti all’interno delle chiese, in particolare della progressiva riduzione dell’intensità
delle prime riflessioni al crescere della distanza dalla sorgente. La validità dei due
modelli è poi confermata dal confronto con i dati sperimentali.

––––––––––––––

The thesis presented here summarizes a wide acoustic survey which took into account
nine Catholic churches built in Apulia during the Romanesque period. The analysed
churches have very different volumes, spanning from 30.000 to 1.500 m3, and different
architectural features (roofed/vaulted ceilings, with/without transept, etc.) which
determine many interesting acoustical behaviours. Some introductive notes are proposed
in the first four chapters. Chapter 1 describes the complex relations between architecture,
music, acoustics and liturgy. Chapter 2 describes the acoustic parameters which have
been measured during the survey. Chapter 3 describes the measurement techniques which
have been used during the survey. Chapter 4 reports some of the most important studies
found in the literature about the church acoustics. The architectural characteristics of
each church together with the relevant results of the acoustic measurements are reported
in Chapter 5. The results of the whole survey are discussed in Chapter 6. The existence of
correlations between acoustical parameters and between some of them and some
geometrical characteristics of the rooms is showed. Furthermore, two theoretical models
to calculate the energy-based parameters are proposed. Barron’s theory is revised in
order to take into account the decrease of the early reflections energy with distance.
Comparisons between theoretical and measured data confirm the reliability of the
proposed models.
Ringraziamenti

Il mio più sentito ringraziamento va al Prof. Ettore Cirillo che, come tutor,
mi ha indirizzato, incoraggiato e guidato nello studio dell’acustica e, in
particolare, delle problematiche trattate in questa tesi e che, come direttore del
Dipartimento di Fisica Tecnica del Politecnico di Bari, ha messo a disposizione
mezzi e uomini per lo svolgimento di questa ricerca.
Un ringraziamento va a tutto il Dipartimento, ed in particolare ad Ubaldo
Ayr, instancabile dispensatore di preziosi ed illuminanti consigli, a Giuseppe
Visceglie e Antonio Imbimbo, pazienti collaboratori durante i rilievi acustici.
Ringrazio, inoltre, i parroci e i responsabili delle chiese, senza la cui
collaborazione questo lavoro non sarebbe stato possibile: S.E.R. Mons. Francesco
Cacucci, Arcivescovo di Bari-Bitonto; Padre Giovanni Matera, Priore della
Basilica di San Nicola; Mons. Gaetano Barracane, direttore dell’Ufficio arte sacra
della diocesi di Bari-Bitonto; Don Aldo Chiappinelli, parroco della Cattedrale di
Bovino; Don Pino Paolillo, parroco della Cattedrale di Barletta; Don Salvatore
Summo, parroco della Cattedrale di Ruvo. A loro vanno aggiunti Don Antonio
Parisi e il Sig. Fiore che hanno permesso lo svolgimento delle misure
all’auditorium La Vallisa e hanno gentilmente fornito le planimetrie.
Un ringraziamento va anche agli amici Antonio Cognetti, Nicola Farinola e
Antonio Magnatta, per aver interceduto presso i loro parroci per consentire lo
svolgimento dei rilievi.
Anche se tutto il lavoro svolto insieme non è stato incluso in questa tesi a
causa della scarsa rilevanza statistica dei dati ottenuti, desidero comunque
ringraziare tutti coloro che hanno collaborato alla formazione del “gruppo di
ascolto musicale” ed in particolare Pierluigi Camicia, Maria Antonietta Lamanna,
Nicola Cufaro Petroni e Fiorella Sassanelli per la loro grande disponibilità e per
l’entusiasmo e l’incoraggiamento datomi.
Infine, un grandissimo ringraziamento va alla mia famiglia che, in questi
mesi di lavoro frenetico ed ininterrotto, ha saputo sopportarmi e supportarmi,
senza farmi mai mancare la propria comprensione.
Sommario i

Sommario

Introduzione .......................................................................................................... 1

Capitolo 1 Liturgia, musica, acustica ed architettura .................................. 3


1.1 Premessa ................................................................................................... 3
1.2 Architettura e musica ................................................................................ 4
1.3 Musica e liturgia ....................................................................................... 6
1.4 Liturgia e acustica ..................................................................................... 9
Capitolo 2 Caratterizzazione acustica degli ambienti ................................ 13
2.1 Premessa ................................................................................................. 13
2.2 Aspetti soggettivi della percezione sonora ............................................. 15
2.3 Indici oggettivi monoaurali..................................................................... 16
2.3.1 Indici di riverberazione ............................................................. 16
2.3.2 Indici di chiarezza ..................................................................... 18
2.3.3 Indici di livello sonoro .............................................................. 21
2.3.4 Indici di intimità........................................................................ 22
2.3.5 Indici di bilanciamento delle basse frequenze .......................... 22
2.3.6 Indici di bilanciamento delle alte frequenze ............................. 23
2.3.7 Criteri per l’individuazione degli echi ...................................... 23
2.4 Indici oggettivi binaurali......................................................................... 25
2.4.1 Indici di estensione apparente della sorgente............................ 25
2.4.2 Indici di avvolgimento dell’ascoltatore..................................... 27
2.5 Criteri per la valutazione della qualità acustica di un ambiente ............. 28
2.5.1 Definizione degli intervalli di variabilità ottimali..................... 29
Capitolo 3 Strumenti e metodi di misura .................................................... 33
3.1 Premessa ................................................................................................. 33
3.2 Tecniche di misura basate sulla convoluzione........................................ 34
3.2.1 La tecnica MLS ......................................................................... 35
3.2.2 La tecnica TDS.......................................................................... 37
3.3 La strumentazione impiegata .................................................................. 39
3.4 Prescrizioni della ISO 3382 .................................................................... 40
3.5 Confronto fra i risultati ottenuti con le diverse tecniche di misura......... 41
3.5.1 Confronto fra misure omnidirezionali....................................... 41
3.5.2 Confronto fra misure binaurali.................................................. 44
3.5.3 Confronto fra misure monoaurali e misure binaurali................ 46
Capitolo 4 Ricerca bibliografica sull’acustica delle chiese ........................ 49
4.1 Studi dedicati a singole chiese ................................................................ 49
4.1.1 Lo studio di Raes e Sacerdote ................................................... 49
4.1.2 Lo studio di Shankland e Shankland......................................... 51
4.1.3 Lo studio di Lewers e Anderson ............................................... 53
4.2 Studi a grande scala ................................................................................ 55
ii Sommario

4.2.1 Lo studio di Fearn sulle chiese spagnole, inglesi e francesi...... 55


4.2.2 Lo studio sulle chiese svizzere .................................................. 56
4.2.3 Lo studio sulle chiese portoghesi............................................... 58
4.3 Altri studi................................................................................................. 59
Capitolo 5 L’indagine sperimentale.............................................................. 61
5.1 Quadro generale ...................................................................................... 61
5.2 I parametri architettonici considerati....................................................... 62
5.3 Le nove chiese ......................................................................................... 63
5.3.1 La Basilica di San Nicola a Bari................................................ 63
5.3.2 La Cattedrale di San Sabino a Bari............................................ 72
5.3.3 La Cattedrale di S. Valentino a Bitonto..................................... 80
5.3.4 La Cattedrale di Santa Maria Maggiore a Barletta .................... 87
5.3.5 La Cattedrale di San Pietro a Bisceglie ..................................... 94
5.3.6 La Cattedrale di Santa Maria Assunta a Ruvo......................... 101
5.3.7 La Cattedrale di Santa Maria Assunta a Bovino...................... 109
5.3.8 La chiesa di Ognissanti a Valenzano....................................... 117
5.3.9 La chiesa della Vallisa a Bari .................................................. 124
5.4 Note riepilogative .................................................................................. 129
Capitolo 6 Discussione dei risultati ottenuti .............................................. 133
6.1 Premessa................................................................................................ 133
6.2 Analisi degli indici sintetici................................................................... 134
6.2.1 Il tempo di riverberazione e i parametri architettonici ............ 134
6.2.2 Gli altri parametri acustici monaurali...................................... 137
6.2.3 I parametri acustici binaurali ................................................... 140
6.3 Analisi degli andamenti puntuali dei parametri acustici ....................... 143
6.3.1 Correlazioni fra parametri monaurali ...................................... 143
6.3.2 Correlazioni fra parametri binaurali ........................................ 148
6.3.3 Correlazioni fra parametri acustici e distanza dalla sorgente .. 148
6.4 Modelli di calcolo dei parametri energetici........................................... 151
6.4.1 La teoria classica e la teoria “corretta” di Barron.................... 151
6.4.2 Riscontri sperimentali.............................................................. 153
6.4.3 Adattamento della teoria di Barron alle chiese........................ 156
6.4.4 Confronti con le misure sperimentali ...................................... 160
6.5 Osservazioni sul rapporto fra tempo di riverberazione e volume ......... 164
6.6 Conclusioni e sviluppi futuri ................................................................. 167
Appendice A Dati acustici completi relativi alle nove chiese analizzate.. 169
A.1 La Basilica di San Nicola a Bari.......................................................... 169
A.2 La Cattedrale di San Sabino a Bari...................................................... 171
A.3 La Cattedrale di San Valentino a Bitonto............................................ 173
A.4 La Cattedrale di Santa Maria Maggiore a Barletta .............................. 175
A.5 La Cattedrale di San Pietro a Bisceglie ............................................... 177
A.6 La Cattedrale di Santa Maria Assunta a Ruvo..................................... 179
A.7 La Cattedrale di Santa Maria Assunta a Bovino.................................. 181
A.8 La chiesa di Ognissanti di Cuti a Valenzano....................................... 184
A.9 La chiesa della Vallisa a Bari .............................................................. 186
Bibliografia......................................................................................................... 188
All’inizio, l’arte del puzzle sembra un’arte breve, di poco spessore,
tutta contenuta in uno scarno insegnamento della Gestalttheorie: l’oggetto
preso di mira – sia esso un atto percettivo, un apprendimento, un sistema
fisiologico o, nel nostro caso, un puzzle di legno – non è una somma di
elementi che bisognerebbe dapprima isolare e analizzare, ma un insieme, una
forma cioè, una struttura: l’elemento non preesiste all’insieme, non è più
immediato nè più antico, non sono gli elementi a determinare l’insieme, ma
l’insieme a determinare gli elementi: la conoscenza del tutto e delle sue leggi,
dell’insieme e della sua struttura, non è deducibile dalla conoscenza delle
singole parti che lo compongono: la qual cosa significa che si può guardare il
pezzo di un puzzle per tre giorni di seguito credendo di sapere tutto della sua
configurazione e del suo colore, senza aver fatto il minimo passo avanti:
conta solo la possibilità di collegare quel pezzo ad altri pezzi e in questo
senso l’arte del puzzle e l’arte del go hanno qualcosa in comune; solo i pezzi
ricomposti acquisteranno un carattere leggibile, acquisteranno un senso:
isolato, il pezzo di un puzzle non significa niente; è semplicemente domanda
impossibile, sfida opaca; ma se appena riesci, dopo molti minuti di errori e
tentativi, o in un mezzo secondo prodigiosamente ispirato, a connetterlo con
uno dei pezzi vicini, ecco che quello sparisce, cessa di esistere in quanto
pezzo: l’intensa difficoltà che ha preceduto l’accostamento e che la parola
puzzle – enigma – traduce così bene in inglese, non solo non ha più motivo di
esistere, ma sembra non averne avuto mai, tanto si è fatta evidenza: i due
pezzi miracolosamente riuniti sono diventati ormai uno, a sua volta fonte di
errori, esitazioni, smarrimenti e attesa.

Tratto da “La vita istruzioni per l’uso” di Georges Perec


Introduzione

L’acustica è una disciplina che, nella sua pur breve vita, è tradizionalmente
associata allo studio di ambienti nei quali la percezione del suono o, meglio, il suo
ascolto, rappresenta l’aspetto più importante e peculiare. Pertanto sale da
concerto, teatri e auditori costituiscono il principale oggetto di studio degli
appassionati di questa materia. Infatti, la maggior parte delle ricerche condotte e
dei lavori presenti in letteratura è incentrata su questi ambienti. Tuttavia, esiste
una categoria di edifici per i quali l’ascolto del messaggio trasmesso è divenuto,
nel corso dei secoli, progressivamente sempre più importante e a cui solo
recentemente è stata data la dovuta importanza: le chiese e gli edifici dedicati al
culto.
Le chiese sono ambienti architettonicamente, e perciò anche acusticamente,
molto complessi. In aggiunta esse devono soddisfare esigenze acusticamente
contrapposte, dal momento che già durante la celebrazione liturgica si alternano
parlato e canti, spesso abbinati alla musica. Mentre il primo richiede grande
chiarezza, i secondi, per poter coinvolgere ed avvolgere l’assemblea, richiedono
un ambiente acusticamente molto più vivo. Nella pratica questa duplice esigenza
si scontra con una realtà fatta di ambienti molto grandi e comunque molto
riverberanti nei quali solo l’aspetto musicale e di accompagnamento è enfatizzato
(a volte fin troppo), mentre l’altro, più importante, aspetto dell’ascolto della
parola viene inevitabilmente sminuito.
Ammesso che nelle chiese di nuova costruzione si possa riuscire a giungere
ad un compromesso “naturale” fra le citate esigenze, nelle chiese esistenti questa
diatriba è stata affrontata in diversi modi. Nelle epoche passate si è fatto uso di
dispositivi “ad hoc” quali amboni o pulpiti sopraelevati che contribuissero e
rendere più chiaro il parlato, mentre in epoca recente la soluzione più diffusa è il
ricorso ad un impianto di amplificazione. In questa ottica l’acustica di un luogo
non è più vista come un elemento caratterizzante quanto, piuttosto, come un
elemento di disturbo di cui è difficile liberarsi. Questa scarsa comprensione
dell’acustica di un luogo può spiegare anche perché, molto spesso, il ricorso non
ponderato all’amplificazione, o l’uso improprio di soluzioni standardizzate, non
apporta significativi miglioramenti all’intelligibilità del parlato.
Alla luce di ciò uno studio delle caratteristiche acustiche delle chiese non
può che prescindere dal particolare sistema di amplificazione adottato, sebbene,
molto spesso, la principale preoccupazione dei parroci sia proprio relativa a questi
dispositivi. Pertanto, nel seguito verranno prese in considerazione le
caratteristiche acustiche “naturali” delle chiese, trascurando qualsiasi dispositivo
di rinforzo del suono. Questa scelta si rende necessaria dal momento che è solo
dalla conoscenza del comportamento acustico di un ambiente in assenza di
qualsiasi dispositivo di rinforzo che può scaturire un principio per il suo progetto
e per la sua verifica.
2 Introduzione

È importante inoltre sottolineare che in un paese fisiologicamente privo,


soprattutto lontano dai grandi centri, di spazi deputati all’ascolto della musica,
accade sempre più spesso che concerti ed altre rappresentazioni analoghe vengano
eseguite in chiese sia sconsacrate che consacrate. Pertanto, la conoscenza delle
caratteristiche acustiche di questi spazi diventa di grande importanza al fine di
poterli utilizzare nel modo più idoneo, preferendo, ove possibile, quelle chiese che
si prestano meglio di altre ad ospitare l’esecuzione di pezzi musicali.
La scelta, operata in questo lavoro, di prendere in considerazione
essenzialmente gli aspetti legati all’ascolto della musica e, più marginalmente, gli
aspetti legati alla comprensione del parlato in assenza di amplificazione, trae la
propria giustificazione dall’esigenza di studiare il comportamento di questi
ambienti proprio con riferimento alla musica e dalla relativamente scarsa utilità di
indagare il comportamento con riferimento al parlato, dal momento che,
raramente (se non mai), è possibile ottenere un livello di comprensione accettabile
senza ricorrere a sistemi di rinforzo.
Il lavoro si svilupperà in sei capitoli.
Nel primo capitolo si analizzeranno i rapporti intercorsi nei secoli passati fra
la liturgia, la musica, l’acustica e l’architettura, cercando di analizzare in che
modo essi si siano influenzati.
Nel secondo capitolo si esamineranno i principali aspetti acustici che è
necessario prendere in considerazione nello studio. Al gruppo di parametri più
noti saranno affiancati alcuni nuovi descrittori, proposti recentemente per valutare
il bilanciamento tonale del suono, la presenza di echi e la sensazione di
avvolgimento sonoro.
Nel terzo capitolo si presenteranno brevemente le principali tecniche di
misura utilizzate in questo studio, cioè la tecnica MLS e lo sweep sinusoidale,
mostrandone vantaggi e svantaggi. Inoltre, saranno presentati i confronti fra
misure condotte con tecniche diverse allo scopo di verificare l’equivalenza delle
stesse.
Successivamente si presenteranno i risultati della ricerca bibliografica,
illustrando che il lavoro finora condotto sulle chiese e sui luoghi di culto risulta
essere ancora parziale e ampliabile.
Nel quinto capitolo si prenderanno in considerazione una per una le chiese
analizzate e verranno presentati i risultati delle misurazioni unitamente alla
illustrazione delle caratteristiche architettoniche.
Nel sesto capitolo verrà preso in considerazione l’insieme delle misure
relative alle chiese analizzate e saranno studiate le correlazioni fra caratteristiche
architettoniche e acustiche e fra diversi parametri acustici. Alla luce delle
osservazioni fatte si proporranno due nuovi modelli teorici per il calcolo
previsionale degli indici di robustezza e di chiarezza. In conclusione si
prospetteranno alcuni dei possibili sviluppi che questo lavoro, indubbiamente
embrionale e parziale, potrà avere.
Capitolo 1

Liturgia, musica, acustica ed architettura

In questo capitolo saranno sinteticamente affrontati i millenari rapporti


che legano fra loro in una complessa maglia di interrelazioni le
caratteristiche architettoniche delle chiese, la musica (intesa non solo
nell’accezione di musica sacra, ma in quella più vasta e generale di
“scienza musicale”), la liturgia e le caratteristiche acustiche degli
ambienti. Lungi dal tentare una trattazione sistematica, si intende
piuttosto fare luce su alcuni particolari momenti in cui le discipline
sopra citate si sono intimamente influenzate.

1.1 Premessa

La chiesa intesa come edificio “sacro”, cioè dedicato al culto divino, ha


subito nel corso dei secoli una continua evoluzione legata a molteplici aspetti fra
loro intimamente connessi. Infatti, a differenza degli edifici “civili” i quali devono
soddisfare solo esigenze funzionali, simboliche e di decoro, una chiesa deve anche
assolvere un ruolo “trascendentale”, cioè mettere l’uomo in contatto con Dio,
ovvero testimoniare la Sua presenza.
Su un piano meramente architettonico le prime chiese si sono sviluppate su
due tipologie tipicamente romane (e pagane): la basilica civile ed il tempio
circolare. Di queste la prima divenne il prototipo per la chiesa a pianta basilicale,
mentre la seconda fece da modello per le chiese a pianta centrale. Delle due
tipologie, quella destinata a riscuotere un più immediato successo fu la prima, che
consentiva di accogliere un gran numero di fedeli e si prestava meglio, con le sue
lunghe navate, a rappresentare simbolicamente il cammino di redenzione del
fedele. Questa funzione simbolica era ulteriormente rafforzata dalla presenza di
due elementi architettonici: il transetto che conferiva alla chiesa la tipica forma a
T, evocativa della croce, e l’abside semicircolare che, posta dietro l’altare si
configurava come il traguardo a cui mirare e, con la sua geometria “perfetta”,
diveniva vero punto di unione fra cielo e terra. Questa forma fu tipica delle chiese
proto-cristiane e del periodo romanico. Successivamente l’aggiunta del coro fra
transetto e abside nelle chiese gotiche portò alla definizione della forma a croce
latina, ancor più carica di significati simbolici, che avrebbe fatto apparire il
ricorso alla pianta centrale rinascimentale come un inopportuno ritorno a forme
pagane.
É stato ampiamente dimostrato, tuttavia, che il ricorso alla pianta centrale e
al complesso sistema di rapporti proporzionali, che ne era alla base, non era
4 Capitolo 1

mirato a porre nuovamente l’uomo al centro dell’universo ma era invece dovuto al


fatto che, come sostiene Wittkower [81],
l’architetto non era in alcun modo libero di applicare a un edificio un
sistema di rapporti scelto a capriccio, e che i rapporti stessi dovevano
armonizzarsi con concezioni di ordine superiore, che anzi un edificio
dovrebbe rispecchiare le proporzioni del corpo umano; esigenza
universalmente accolta in base all’autorità vitruviana. Come l’uomo è
immagine di Dio e le proporzioni del suo corpo sono state concepite e
fissate dalla volontà divina, così le proporzioni architettoniche
devono comprendere in sé ed esprimere l’ordine cosmico.1
Va ricordato, infatti, che nel periodo rinascimentale vi fu in Italia una
notevole fioritura di trattati architettonici, primo fra tutti il De re ædificatoria di
Leon Battista Alberti pubblicato nel 1485, nei quali venne affrontata la questione
della forma da dare alla chiesa ideale. L’Alberti dedicò l’intero settimo libro alla
costruzione ed alla decorazione degli edifici sacri, ed oltre a celebrare la forma
circolare come la più adatta, suggerì, in accordo con in canoni vitruviani, che la
bellezza consiste nella integrazione razionale di tutte le parti dell’edificio, in
modo che ciascuna di esse abbia proporzioni e forma perfettamente definite.
Per comprendere quali dovessero essere queste leggi in grado di esprimere
l’ordine cosmico è necessario trattare il primo dei delicati rapporti descritti in
questo capitolo: quello fra architettura e musica.

1.2 Architettura e musica

Uno dei punti fissi dei trattatisti rinascimentali fu la corrispondenza fra


intervalli musicali e proporzioni architettoniche. L’Alberti sosteneva infatti che
quei medesimi numeri certo, per i quali avviene che il concerto delle
voci appare gratissimo ne gli orecchi de gli uomini, sono quelli stessi
che empiono anco e gli occhi e lo animo di piacere meraviglioso,
e ancora,
caveremo adunque tutta la regola del finimento da musici, a chi sono
perfettissimamente noti questi tali numeri: e da quelle cose oltra di
questo, da le quali la natura dimostri di se cosa degna et onorata.2
Si evince, quindi, che per l’Alberti i rapporti armonici immanenti nella natura
sono rivelati nella musica, e quindi per gli architetti affidarsi a tali armonie non
significa solo tradurre i rapporti musicali in architettura, ma piuttosto fare uso di
quell’armonia universale che nella musica si manifesta.
Oltre a ciò, va comunque osservato che la musica esercitava un fascino
particolare poiché veniva classificata come “scienza” matematica. Essa, fin
dall’antichità, veniva annoverata insieme all’aritmetica, alla geometria e
all’astronomia, nel “quadrivium” delle arti matematiche (o arti liberali). Al
confronto con esse, pittura, scultura ed architettura erano considerate arti manuali
che, per poter essere elevate di livello, necessitavano di un saldo fondamento

1
Cfr. Rif. [81], p. 101.
2
Cit. in Rif. [81], p. 109.
Capitolo 1 5

teorico (cioè matematico). La musica, in quanto portatrice di armonia, divenne


perciò il principale punto di riferimento per gli artisti.
Va detto, a questo punto, che la teoria musicale rinascimentale descritta nei
trattati di Boezio (De Musica del 1491) e di Franchino Gafurio (Theorica musice
del 1492 e De Harmonia musicorum instrumentorum del 1518), non era che la
teoria musicale pitagorica, già assunta ed elevata a principio ordinatore
dell’armonia cosmica da Platone nel suo Timeo.1
Pitagora scoprì, infatti, che i toni possono misurarsi spazialmente, ovvero
che le armonie musicali sono determinate da rapporti di piccoli numeri interi. Se,
nelle stesse condizioni, vibrano due corde una delle quali sia lunga la metà
dell’altra, il suono della più breve sarà di un’ottava (diapason) più alto della più
lunga. Se le lunghezze delle due corde stanno in un rapporto di 2:3, la differenza
nell’altezza del suono sarà di una quinta (diapente); se si trovano nella relazione
di 3:4, la differenza nell’altezza di tono sarà di una quarta (diatessaron). Perciò le
consonanze sulle quali si fondava il sistema musicale greco – ottava, quinta e
quarta – possono venire espresse dalla progressione 1:2:3:4; progressione che
contiene anche i due accordi compositi che i greci conobbero, e precisamente
l’ottava più quinta (1:2:3) e le due ottave (1:2:4). È facile comprendere che questa
scoperta sconvolgente facesse credere di aver finalmente ritrovato la legge
armonica che governa l’universo. Su ciò fu dunque in gran parte costruito il
simbolismo e il misticismo numerico, che ebbe un’influenza incommensurabile
sul pensiero umano nei due millenni successivi.
Successivamente Platone nel Timeo spiegò che l’ordine e l’armonia cosmici
sono contenuti interamente in alcuni numeri. Egli ritrovava quest’armonia nei
quadrati e nei cubi del rapporto doppio e triplo, partendo dall’unità, ciò che lo
condusse alle due progressioni geometriche 1, 2, 4, 8 e 1, 3, 9, 27. Rappresentata
tradizionalmente nella forma di un lambda

1
2 3
4 9
8 27

l’armonia del mondo si esprime nella serie di sette numeri 1, 2, 3, 4, 8, 9, 27, che
contiene in sé il ritmo segreto del macrocosmo e del microcosmo: poiché i
rapporti fra questi numeri racchiudono non soltanto tutte le armonie musicali, ma
anche la musica inaudibile dei cieli e della struttura dell’anima umana.
Quest’ultimo riferimento platonico è particolarmente importante per far
comprendere che gli architetti, riprendendo le proporzioni armoniche, non
intendevano operare una trasposizione della musica in architettura ma, piuttosto
far partecipare le forme visibili di quella misteriosa bellezza propria della musica.
In realtà questi concetti, assunti a principi fondamentali dagli architetti del
rinascimento, erano sopravvissuti per tutto il medioevo ed avevano conosciuto
una prima rinascita, seppur embrionale e non codificata in forma di trattato già
nell’architettura gotica. Infatti, nella Francia del XII secolo la vita intellettuale

1
Non mancarono però gli innovatori come Ludovico Fogliano, che nel suo Musica theorica del
1529 per primo protestò contro l’autorità esclusiva degli accordi pitagorici, e come Gioseffo
Zarlino che nelle sue Dimostrationi harmoniche del 1571 classificò con metodo scientifico tutti
gli accordi ritenuti validi.
6 Capitolo 1

incominciò a rifiorire proprio intorno all’università nascente e intorno alle


cattedrali che, oltre ad essere centri amministrativi coordinati dai vescovi,
avevano quasi sempre delle scuole per la preparazione del clero.
La progressiva riscoperta dei testi antichi portò allo studio della geometria e
della geometria proiettiva – particolarmente importante, quest’ultima, per il
corretto taglio delle pietre che dovevano costituire la struttura portante delle
cattedrali – e infine portò alla rivalutazione delle dottrine platoniche sull’ordine
cosmico. In tal senso la scuola di Chartres fu particolarmente attiva, ma non
giunse mai alla definizione di un sistema teorico compiuto, capace di armonizzare
tutte le parti di un edificio. Tuttavia il Forsyth1 riporta che l’abate Suger nel 1129
costruì la sua abbazia di St. Denis vicino Parigi in accordo con queste consonanze
musicali, affinché la chiesa fosse eretta come un microcosmo dell’universo, e
inoltre perché l’edificio trasmettesse, con la sua riverberazione, l’armonia acustica
alla melodia liturgica del canto gregoriano. In tal modo l’architettura sarebbe stata
lo specchio dell’armonia eterna, mentre la musica sarebbe stata la sua eco [74].
In conclusione è possibile osservare come, pur partendo dalle medesime
basi – cioè la teoria pitagorico-platonica dei numeri – l’approccio rinascimentale e
quello medievale non potrebbero essere più diversi. Gli architetti del rinascimento
trovarono nella teoria musicale una solida base “scientifica” con cui nobilitare la
loro arte, senza pretendere che all’uso di quella teoria corrispondesse una
esaltazione della musica suonata all’interno di quegli edifici. Invece, i costruttori
medievali (vescovi, abati e spesso capimastri), più ingenuamente, ritenevano che
l’adozione di un sistema di proporzioni armoniche potesse anche influenzare il
suono e la musica eseguite entro le chiese. E fu per questo che l’esecuzione
musicale ebbe particolare rilievo nella chiesa medievale.
In realtà la grande riverberazione propria delle chiese medievali, al di là
dell’esistenza di rapporti proporzionali alla base della realizzazione, fu il terreno
ideale per lo sviluppo della polifonia e dell’armonia che, prima della loro
introduzione, potevano essere solo “intuite” per effetto della sovrapposizione della
monodia gregoriana con la propria coda sonora (dovuta appunto alla lunga
riverberazione).

1.3 Musica e liturgia

Per tutto il periodo medievale l’unica forma “alta” di musica fu


rappresentata dal canto gregoriano. Con questo nome si intende tutta la musica
fiorita durante il Medioevo in seno alla Chiesa, dalle origini del cristianesimo fino
alle origini della polifonia e dell’umanesimo. Essenzialmente musica vocale
monodica, inquadrata negli schemi della liturgia cattolica, il canto gregoriano
prese il nome da San Gregorio Magno che compì opera di codificazione e di
sintesi e, insieme, di severo richiamo alla correttezza liturgica, quando – sotto
l’influsso delle molteplici attività umane che durante il Medioevo trovavano sede
nella Chiesa, e per la lenta opera di adattamento alle lingue volgari che stavano
per manifestarsi – elementi profani o esotici minacciarono di corrompere la
purezza di tale canto.
La prima forma di canto sacro fu l’accentus, o canto sillabico, che consiste
semplicemente nella recitazione espressiva e cadenzata delle preghiere: ad ogni
sillaba corrisponde una nota, e, salvo le cadenze finali, in genere la recitazione si
1
Cfr. Rif. [40], p. 3.
Capitolo 1 7

svolge tutta su una medesima nota a lungo ripetuta (salmodia). Inoltre, se un


sacerdote recita ad alta voce la preghiera e la massa dei fedeli riprende solo le
parole di chiusa, si ha il responsorio. Infine, se la recitazione salmodica delle
preghiere avveniva tra due cori alternati si aveva l’antifona.
Accanto a questa severa forma di recitazione di testi tratti esclusivamente
dalla Sacra Scrittura, una fioritura di veri e propri canti avveniva frattanto in Siria
e nell’Asia Minore, nei quali la melodia si allontanava arditamente dalla
monotonia della recitazione sillabica, si curvava in frasi sinuose e appariscenti e,
fatto nuovo, reclamava testi propri, appositamente composti (inni). Questi inni
mostravano evidente, nel loro latino corrotto di decadenza, nell’uso delle rime e
dell’accento, il trapasso della poesia dalla classica metrica quantitativa a quella
moderna, fondata sulla distribuzione degli accenti nel verso. L’evoluzione
successiva fu rappresentata dai giubili alleluiatici, in cui sparirono le parole e la
voce liberamente vocalizzava, spiegandosi in amplissime e ornate melodie,
poggiate unicamente sulle sillabe della parola Alleluja.
Fu in questo fervore di canti ispirati che da Roma la riforma gregoriana
intervenne a porre ordine e a sfrondare, a limitare e uniformare secondo la severa
tradizione della salmodia romana. Tuttavia i giubili dettero origine
successivamente alla seconda fase del canto gregoriano, caratterizzato dalla
sequenza e dalle forme affini della prosa e del tropo. Tali forme rispecchiavano la
stanchezza creativa sopravvenuta nel canto cristiano dopo la codificazione operata
da Gregorio Magno, che aveva naturalmente scoraggiato e paralizzato
l’invenzione, ormai superflua, di nuovi canti.
La musica seria trovò una inattesa rinascita grazie ad una invenzione tecnica
che doveva aprire una nuova era di civiltà musicale. Verso la fine del secolo IX si
trova stabilita quella prima rudimentale forma di doppio canto orizzontale che
risponde al nome di organum o diafonia: una delle due voci tiene il canto dato,
per lo più una melodia gregoriana, l’altra, partendo dall’unisono, dapprima se ne
allontana fino all’intervallo di quarta, sul quale si mantiene per un certo tempo,
poi cala di nuovo all’unisono, ripercorrendo gli intervalli di terza e di seconda. A
ogni nota, o punto, di una voce, corrispondeva rigorosamente una nota dell’altra
voce; da cui il nome di contrappunto.
Il progressivo arricchimento delle possibilità di combinazioni melodiche
orizzontali costituisce il compito dei secoli X, XI e XII, durante i quali le
ingegnose regole con cui si compiono simili elaborazioni diventano sempre più
sottili e complicate, senza che, in realtà, si scorga mai un reale criterio poetico. In
questa forma di rudimentale contrappunto la musica medievale è, più che un’arte,
una scienza, il cui unico interesse è quello di aumentare il numero delle parti (che
arrivano fino a quattro) e di intrecciarle secondo un complicato codice di
prescrizioni astratte.
Nel quattrocento la polifonia ricevette una considerevole spinta di
maturazione grazie alla scuola fiamminga che portò alla perfezione stilistica la
forma della messa e quella del mottetto. Il coro polifonico venne così portato alla
duttilità che oggi possiede l’orchestra, anche se i fiamminghi introdussero, nella
combinazione della stessa melodia ripresa poi da tutte le altre voci, stranezze e
bizzarrie che sottrassero progressivamente importanza al testo sacro da musicare
che, spesso, restava sommerso e inintelligibile nel groviglio polifonico delle voci.
Nel cinquecento l’equilibrio fra scrittura polifonica in stile contrappuntistico
e senso dell’armonia conferì alla musica un livello di compiutezza mai raggiunto
prima. Ed è la messa la grande forma polifonica in cui si convoglia, secondo
8 Capitolo 1

determinate norme di liturgia, la produzione musicale per il servizio sacro.


Tuttavia la costante immutabilità del testo, non meno che la coralità del mezzo
sonoro, promuove una espressione quasi impersonale di religiosità, dalla quale
sono bandite le confessioni e le confidenze dell’artista in senso romantico.
A Venezia il fiammingo Willaert, approfittando della presenza all’interno
della Basilica di S. Marco di due organi contrapposti, introdusse la composizione
a due cori: espediente di cui si varrà largamente, nella sua sfarzosa magnificenza,
la seguente musica sacra veneziana, di cui Giovanni Gabrieli fu il maggiore
esponente.
Oramai la polifonia sacra del Cinquecento non aveva più nulla a vedere con
la schietta elementarità del gregoriano, che nel suo semplice aspetto di
irradiazione sonora della parola nell’entusiasmo della fede, si poneva come atto
materiale di preghiera e non come opera d’arte. Al contrario, invece, la
padronanza di una complicatissima tecnica quale il contrappunto fiammingo,
porta l’espressione religiosa nella categoria dell’arte. Tuttavia, gli sviluppi del
contrappunto avevano portato la parola, che ai fini liturgici della musica sacra era
stata la cosa più importante come veicolo della preghiera, a diventare
perfettamente inintelligibile.
Fu inevitabile, quindi, che il Concilio di Trento prendesse in considerazione
la questione della musica sacra. Ripristinare l’intelligibilità del testo e sopprimere
i temi tratti da canzoni popolari profane furono i due principali obiettivi, anche se
alcune frange estremiste di cardinali avrebbero gradito la totale abolizione del
canto nelle chiese. Dopo molte discussioni venne riconfermata la purezza della
vocalità, escludendo ogni intrusione degli strumenti e sancendo la supremazia
dello stile “a cappella”. Malgrado le assicurazioni dei musicisti, le parole
continuarono a non essere capite.
Di diverso orientamento furono gli indirizzi che sia Calvino sia Lutero
diedero riguardo alla musica sacra. Il primo ammise per le assemblee della chiesa
il solo canto collettivo all’unisono, dando precise prescrizioni in merito alla
semplicità ed alla modestia che i canti dovevano avere. Il secondo curò anch’egli
la facilità di esecuzione, ma soprattutto si preoccupò che il canto sacro cessasse di
essere uno spettacolo, un concerto offerto ai fedeli da musicisti di professione, per
divenire invece mezzo della loro attiva partecipazione ed elevazione religiosa. Fu
lo stesso Lutero ad occuparsi di trasformare canti profani, adattare testi sacri in
lingua tedesca a melodie note, creando un patrimonio di corali che andarono a
costituire la base dello sviluppo della musica tedesca.
Malgrado il favore accordato dal Concilio di Trento alla polifonia vocale si
scoprì ben presto che mantenere dei grandi cori, perfettamente istruiti, era un
lusso che solo i grandi prelati e i maggiori signori del Rinascimento potevano
permettersi, mentre la massa dei fedeli si ritrovava esclusa. Inoltre a causa
dell’imbarocchimento delle composizioni polifoniche la lamentela per
l’incomprensibilità delle parole era divenuta universale. Si andarono così
affermando nella musica di chiesa forme più semplici, monodiche, che portarono
alla riscoperta e all’affermazione di forme più popolaresche di canto religioso, le
laude e gli inni, a svantaggio del canto polifonico e anche del gregoriano. In Italia
si diffuse la forma dell’oratorio, mentre il corale luterano trovò in Bach il suo più
alto esponente.
Dal settecento in poi, con la nascita dell’opera e di altre forme musicali di
più ampia diffusione, la musica sacra rivestì un ruolo più marginale, anche se
nessuno dei maggiori musicisti fece mai mancare il proprio apporto in termini di
Capitolo 1 9

messe, requiem, ed altre composizioni basate su testi biblici, che comunque non
erano destinate all’uso nella liturgia1, dove il ricorso al canto popolare fu
dilagante. Nel 1632 l’innario, cioè il libro liturgico che conteneva gli inni fu
associato al breviario nella liturgia cattolica, sancendo la crisi del gregoriano.
Il canto gregoriano continuò ad essere studiato e tramandato fra le strette
mura di alcuni monasteri, dove, con l’apparizione della scrittura musicale, venne
codificato e preservato da influssi profani. Nel secolo scorso i benedettini
dell’abbazia francese di Solesmes hanno reintrodotto e ripristinato l’uso del canto
gregoriano con una edizione che è divenuta quella ufficiale della Chiesa Cattolica,
la quale, in occasione del Concilio Vaticano II [30], ha affermato che:
la Chiesa riconosce il canto gregoriano come canto proprio della
liturgia romana; perciò nelle azioni liturgiche, a parità di condizioni,
gli si riservi il posto principale.
Tuttavia, data la difficoltà di esecuzione del gregoriano e, per contro, l’importanza
acquisita dal canto religioso popolare, il solo capace di garantire la partecipazione
di tutti i fedeli, si dice anche:
si promuova con impegno il canto religioso popolare in modo che nei
pii e sacri esercizi, come pure nelle stesse azioni liturgiche, secondo
le norme stabilite dalle rubriche, possano risuonare le voci dei fedeli.
In conclusione di questo breve excursus storico sulla musica “sacra” o di
chiesa è possibile osservare che, escludendo alcune eccezioni rappresentate dal
rapporto biunivoco fra un maestro e la “sua” chiesa (si pensi a Leoninus e
Perotinus con Notre Dame a Parigi, o a Giovanni Gabrieli con San Marco a
Venezia, o a Bach con la Tomaskirche a Lipsia), in generale il tipo di canti (se
non i canti stessi) erano imposti da precise direttive liturgiche. Pertanto, la ricerca
di un nesso di causalità fra innovazioni liturgiche e musicali da un lato, e
caratteristiche architettoniche e acustiche dei luoghi di culto dall’altro, potrebbe
apparire forzato. Tuttavia, nel successivo paragrafo si mostrerà che, nel corso dei
secoli, liturgia e acustica si sono reciprocamente influenzate.

1.4 Liturgia e acustica

Le forme liturgiche adottate dalle prime comunità cristiane non potevano


che essere basate su quelle ebraiche. Queste, essenzialmente basate sull’ascolto
della parola, si svolgevano all’interno delle sinagoghe, veri e propri luoghi di
aggregazione sociale in cui, oltre alle cerimonie religiose, si svolgevano incontri
pubblici e veniva praticato l’insegnamento. Ciò lascia intendere che le sinagoghe
erano luoghi che favorivano l’ascolto del parlato, pur essendo sufficientemente
riverberanti da agevolare il canto collettivo.
Fino all’editto di Costantino del 313 i luoghi di culto cristiani furono ubicati
in normali abitazioni, non distinguibili dalle altre, in cui una o più stanze, capaci
di contenere circa 50-60 persone, venivano adibite per la celebrazione. In queste
domus ecclesiae la liturgia si svolgeva, secondo il modello ebraico, leggendo
brani del Vecchio e del Nuovo Testamento, seguiti dalla predica tenuta

1
In tal senso va intesa la distinzione fra musica sacra e musica religiosa, dove la prima è intesa
come parte integrante della liturgia e pertanto rigidamente legata alle sue regole, mentre la
seconda è intesa come libera espressione individuale ispirata da un tema religioso.
10 Capitolo 1

dall’officiante. Non è da escludersi, infine, la recita di un canto da parte di un


cantore. In ambienti non molto grandi e piuttosto affollati, e quindi assai poco
riverberanti, la comprensione della parola non doveva certo costituire un
problema.
A seguito dell’editto di Costantino, cessate le persecuzioni, si cominciarono
a costruire i primi edifici di culto pubblici, ispirati, come detto, alle basiliche civili
romane. Le dimensioni di questi edifici, dettate dalla necessità di accogliere fedeli
sempre più numerosi, furono tali da renderli, anche in condizioni di piena
occupazione, estremamente riverberanti e quindi assai poco idonei alla
comprensione del parlato. I notevoli cambiamenti introdotti nella liturgia nello
stesso periodo, con l’introduzione della liturgia cantata, sono ritenuti da Lubman e
Kiser [55] “un creativo sfruttamento delle caratteristiche di dispersione
temporale1 delle nuove cattedrali”. Infatti, la proclamazione della parola nella
zona absidale sarebbe stata percepita in fondo alla chiesa in modo assai confuso a
causa della sovrapposizione dei diversi segnali (cioè quello utile e quello
disturbante dovuto alla riverberazione). Invece, il canto di ogni sillaba a diverse
tonalità consecutive avrebbe consentito una più facile codificazione del segnale da
parte dell’ascoltatore. In ciò viene vista l’origine del canto gregoriano e lo
sviluppo di forme di canto altamente melismatiche, in cui, cioè, la stessa sillaba
viene associata a 10-20 note diverse.
Si è visto nel paragrafo precedente come la Riforma luterana e la
conseguente Controriforma sancita dal Concilio di Trento abbiano influenzato la
musica ed il canto di chiesa. In realtà differenze ancora maggiori vennero
introdotte nella liturgia, portando a significative conseguenze sul piano
architettonico e, per la prima volta, acustico.
Lutero, infatti, introdusse radicali modifiche non solo dottrinali, ma anche
organizzative. La negazione del valore dei sacramenti (ad eccezione del Battesimo
e della Eucarestia) e la affermazione che la Bibbia è l’unico fondamento per la
fede e l’unica regola per la morale, senza necessità di interpretazione e di
intermediazione, porta la chiesa a divenire semplice comunità di credenti in cui i
pastori sono laici incaricati dalla comunità di diffondere la parola. La conoscenza
della Sacra Scrittura diventa l’elemento chiave della Riforma e lo stesso Lutero,
facendo affidamento sull’ampia diffusione che l’invenzione della stampa le
avrebbe assicurato, si impegnò nella traduzione in tedesco del testo sacro affinché
tutti potessero attingere direttamente al suo messaggio. L’importanza data alla
parola portò a bandire l’uso delle arti visive nelle chiese, che per la Chiesa di
Roma costituivano invece uno dei mezzi principali per la educazione dei fedeli,
tanto che si procedette alla rimozione di dipinti, delle sculture e delle vetrate
istoriate. Il problema di un diffuso analfabetismo che impediva alla maggior parte
delle persone di accedere autonomamente alla Scrittura, unito al fatto che le
chiese, spogliate di ogni elemento visivo con valenza “didattica”, erano divenute
un luogo astratto per i più, impose poi la necessità di dare alla proclamazione
della parola la massima importanza.
1
Nel Rif. [55] viene proposta l’applicazione della teoria dell’informazione al canale acustico di
comunicazione (ACC). Secondo la teoria dell’informazione per ogni canale esiste un tipo di
codifica del segnale che massimizza la quantità di informazioni che possono essere trasmesse. La
caratteristica di maggiore interesse di un canale di comunicazione è il suo grado di dispersione
temporale. Un canale con un basso grado di dispersione temporale (caratterizzato da una bassa
riverberazione) è particolarmente idoneo per la trasmissione del parlato. Un canale con un alto
grado di dispersione temporale è più idoneo alla trasmissione di un messaggio musicale, mentre
per il parlato il grado di informazioni trasmesse è molto basso.
Capitolo 1 11

In questi ambienti spogliati di ogni decoro, ci si accorse però che la


comprensione della parola non era affatto garantita a tutti i fedeli. Come è stato
dimostrato [31], si procedette per le chiese esistenti all’adeguamento mediante
l’introduzione di tendaggi e l’aumento del numero dei posti per i fedeli, e per la
realizzazione di nuove chiese alla realizzazione di ambienti più piccoli e più
idonei alla comprensione della parola. La conseguenza in termini musicali di tali
modifiche fu che in spazi poco riverberanti la musica polifonica non funzionava
più [55], di qui la diffusione della più semplice forma corale.
La risposta Cattolica in termini architettonici consistette nella realizzazione
di chiese che fossero l’immagine del proprio primato, per cui nacquero le
esuberanti architetture barocche, ma anche le più funzionali chiese gesuitiche ad
aula unica. Pur senza una esplicita volontà le nuove chiese risultarono meno
riverberanti delle precedenti [25].
Per avere un radicale mutamento nelle caratteristiche acustiche delle chiese
cattoliche si dovrà attendere il Concilio Vaticano II (1965) che introdusse due
significative novità riguardanti la celebrazione liturgica: l’introduzione delle
lingue locali in luogo del latino e la partecipazione dei fedeli ai canti1. Entrambe,
dando per la prima volta importanza al significato della parola, hanno richiesto
una migliore intelligibilità del parlato e quindi un congruo adattamento delle
chiese esistenti (tradottosi molto spesso solo nell’impiego di impianti di
amplificazione) ed un diverso approccio nella progettazione di quelle nuove. Ciò è
stato recentemente confermato in una nota pastorale2 in cui si afferma:
Nella progettazione di una nuova chiesa a livello strutturale, di forma
e di qualità di materiali si tengano presenti le regole fondamentali che
garantiscano in genere un risultato acustico accettabile. È importante
ricordare che eventuali vizi d'origine sono difficilmente rimediabili
con l'impianto di amplificazione.
È stata così definitivamente sancita l’importanza di un aspetto, quello
acustico, per molto tempo trascurato, sia per una generale “ignoranza” della
materia (ricordiamo che i primi studi scientifici sono stati condotti da Sabine
all’inizio del secolo scorso) sia per una sorta di “incoscienza” del problema,
condizionata da un rito in cui la reale comprensione di quanto veniva detto era
solo un fatto marginale.

1
Cfr. Artt. 36, 54, 63 e 118 del Rif. [30].
2
Cfr. Art. 32 del Rif. [27].
Capitolo 2

Caratterizzazione acustica degli ambienti

In questo capitolo saranno analizzati i principali aspetti della


caratterizzazione acustica degli ambienti. Dopo aver introdotto la
risposta all’impulso, cioè la descrizione della risposta di una sala ad
una eccitazione di breve durata, verranno descritti i principali aspetti
soggettivi che intervengono nella valutazione acustica di un
ambiente. Successivamente si procederà a enumerare e descrivere i
principali indici numerici oggettivi che meglio rappresentano gli aspetti
soggettivi della percezione sonora.

2.1 Premessa

Quando un suono si propaga fra sorgente e ricevitore subisce delle


trasformazioni dovute non solo al mezzo entro cui si propaga, ma anche ai diversi
ostacoli presenti sul suo percorso. Il segnale sonoro è pertanto soggetto a dei
fenomeni di assorbimento, di riflessione, di diffusione e di diffrazione. Se il
mezzo di propagazione è l’aria, i fenomeni fisici dipendono dalle variazioni di
pressione, di temperatura e di umidità. Questi parametri variano molto lentamente
nel tempo in rapporto all’evoluzione del segnale e possono, pertanto, essere
considerati costanti.
La teoria dei segnali stabilisce che le trasformazioni subite dal segnale nel
corso della sua propagazione possono essere rappresentate da un filtro lineare
invariante nel tempo. Tale filtro è perfettamente rappresentato nel dominio
temporale dalla sua risposta all’impulso h(t). Ciò significa che il segnale ricevuto
y(t) è legato al segnale emesso x(t) mediante un prodotto di convoluzione:
+∞
y (t ) = x(t ) ⊗ h(t ) = ∫ h(τ ) ⋅ x(t − τ )dτ
0
(2.1)

ovvero, nel dominio di frequenza, mediante un semplice prodotto:


Y( f ) = H( f )× X ( f ) . (2.2)
Una risposta all’impulso contiene, quindi, tutte le informazioni relative al
suono diretto che giunge al ricevitore, nonché a tutte le riflessioni che vengono a
sovrapporsi nel tempo per effetto della presenza delle pareti e degli ostacoli
presenti entro la sala. Pertanto per ogni combinazione sorgente-ricevitore esiste
un’unica risposta all’impulso. Oltre che dalle caratteristiche della sala la risposta
14 Capitolo 2

all’impulso è influenzata anche dalla sorgente e dal ricevitore, ma di questi si


parlerà con maggiore dettaglio nel successivo capitolo. Le considerazioni che
verranno fatte nel seguito saranno riferite sempre a risposte all’impulso ottenute
utilizzando sorgenti sonore omnidirezionali e ricevitori anch’essi omnidirezionali
(per i parametri monoaurali) o con particolari caratteristiche di direttività (per i
parametri binaurali e spaziali).
Una risposta all’impulso tipo può essere schematizzata come in Figura 2.1.
In essa è possibile distinguere:
- il suono diretto: cioè il suono che dalla sorgente arriva direttamente al
ricevitore. In presenza di numerose file di sedie questo contributo
subisce una attenuazione per effetto di fenomeni di diffrazione dovuti
all’incidenza radente;
- le riflessioni iniziali: cioè l’insieme dei contributi provenienti dalle
pareti e dagli altri ostacoli per i quali la distribuzione spazio temporale
dipende, oltre che dalla geometria della sala, anche dalle caratteristiche
della sorgente e del ricevitore;
- le riflessioni tardive: l’insieme delle riflessioni per le quali, quando la
densità di riflessioni è sufficientemente elevata, è impossibile
distinguere i differenti contributi. Questo fenomeno, dovuto
all’instaurarsi del campo riverberante, è una caratteristica della sala e,
quindi, poco dipendente dalle proprietà della sorgente o del ricevitore; si
manifesta fra gli 80 e i 200 ms dopo l’arrivo del suono diretto.
Una volta nota la risposta all’impulso per una combinazione sorgente-
ricevitore è possibile ricavare da essa un gran numero di informazioni,
quantificabili in una serie di parametri oggettivi. Questi esprimono sinteticamente
alcuni aspetti “oggettivi” del suono. Tuttavia una simile quantificazione ha senso
solo se consente di descrivere efficacemente degli aspetti “soggettivi” percepiti
dall’ascoltatore. Pertanto, è importante dapprima analizzare quali sono i principali
aspetti soggettivi della percezione del suono negli ambienti. Successivamente
verranno descritti i principali indici oggettivi.

Figura 2.1 - Schema tipo di una risposta all'impulso


Capitolo 2 15

2.2 Aspetti soggettivi della percezione sonora

Quando l’ascoltatore è investito da un suono all’interno di un ambiente può,


se adeguatamente allenato a farlo, descrivere alcuni aspetti soggettivi del suono da
lui percepito: può cioè descrivere qualitativamente l’acustica di un ambiente. Il
“grado zero” di tale valutazione soggettiva può essere rappresentato dal giudizio
sulla qualità complessiva di un ambiente. Uno dei principali studi sull’acustica
delle sale da concerto [15] si basa essenzialmente su questo tipo di valutazione in
quanto, una volta fatta una graduatoria delle sale (sulla base dei giudizi forniti da
esperti e direttori d’orchestra), si estrapola dal gruppo delle migliori quali debbano
essere i valori ottimali dei principali parametri acustici.
Tuttavia l’orecchio umano è in grado di apprezzare e valutare numerosi altri
aspetti del suono percepito, i quali permettono di descrivere con più dettaglio il
comportamento acustico di un ambiente. A tali aspetti si cerca, poi, di far
corrispondere dei parametri acustici, a loro equivalenti, ma misurabili
oggettivamente.
Gli aspetti soggettivi da prendere in considerazione sono, pertanto:
- la riverberazione: cioè la sensazione della persistenza del suono
nell’ambiente dopo uno staccato (seguito da una pausa sufficientemente
lunga), o dopo un’improvvisa interruzione dell’esecuzione;
- l’intimità: cioè la sensazione che la musica venga suonata in una sala di
dimensioni contenute, in cui l’orchestra appare (acusticamente) vicina
all’ascoltatore;
- il livello sonoro: cioè l’intensità con cui un suono viene percepito
dall’ascoltatore. Tale aspetto dipende, oltre che dalla sala, anche dalla
sorgente, poiché un’orchestra produrrà sempre un suono più intenso di
quanto possa fare un solista;
- la chiarezza: cioè il grado con cui è possibile distinguere suoni
consecutivi nella stessa esecuzione musicale. La chiarezza può essere
anche riferita alla comprensione del parlato e, in tal caso, è intesa come
il grado con cui è possibile distinguere (e comprendere) le sillabe che
compongono una parola;
- il bilanciamento tonale: cioè il grado con cui le diverse frequenze dello
spettro sonoro vengono percepite. Normalmente la valutazione viene
fatta distintamente per le basse ed alte frequenze, assumendo come
riferimento le medie frequenze. Solitamente un ambiente in cui le basse
frequenze sono ben udibili viene detto “caldo”, nel caso delle alte
frequenze si parla invece di suono “brillante”;
- l’estensione apparente della sorgente: uno dei due aspetti (l’altro è
l’avvolgimento) della percezione spaziale del suono. Esso misura
quanto la sorgente sonora appare acusticamente estesa in confronto alla
sua reale estensione visiva;
- l’avvolgimento: è il grado con cui l’ascoltatore si sente circondato dal
suono. Esso è maggiore quando il suono sembra provenire da tutte le
direzioni.
- la presenza di echi: l’eco è una riflessione ritardata di intensità
sufficiente per essere avvertita distintamente ed essere, quindi, causa di
disturbo per l’ascoltatore.
Diverse ricerche sono state, e sono ancora, condotte allo scopo di
individuare quali fra questi aspetti della percezione sonora abbiano un peso
16 Capitolo 2

maggiore rispetto agli altri, perché contribuiscono maggiormente a definire il


giudizio complessivo sulla qualità acustica di un ambiente. Altro oggetto di
indagine è la ricerca di quali parametri oggettivi siano più idonei a descrivere gli
aspetti citati. La descrizione di questi studi esula dagli scopi di questa tesi e
pertanto si rinvia ai resoconti riportati nei Rif. [6], [15], [29], [53]. Tuttavia, nel
paragrafo successivo verranno presentati, unitamente alla descrizione dei
parametri, alcuni dei risultati di tali ricerche. Infine, allo scopo di poter utilizzare i
parametri così individuati in ambito progettuale, diventa importante individuare
quali debbano essere i valori ottimali che tali parametri devono assumere per poter
garantire una buona qualità acustica, e in tale ottica si inserisce il già citato studio
di Beranek [15].

2.3 Indici oggettivi monoaurali

Gli indici monoaurali si ottengono acquisendo la risposta all’impulso per


mezzo di un microfono omnidirezionale. Poiché i parametri dipendono dalla
frequenza è necessario che questi indici vengano determinati almeno con
riferimento alle sei bande di ottava principali del campo di udibilità, cioè da 125 a
4000 Hz.
Per alcuni aspetti, invece, il parametro che si ottiene è rappresentato da un
singolo numero. In generale, poiché è molto utile avere un singolo numero come
descrittore di un aspetto, si vedrà, per ciascuno di essi, in che modo i valori
relativi alle diverse bande di ottava si combinano (scegliendo solo alcune
frequenze) in modo da ottenere un descrittore più sintetico.

2.3.1 Indici di riverberazione


La riverberazione è senz’altro l’aspetto più appariscente dell’acustica di un
ambiente, risultando subito evidente anche ai non esperti. Sul finire del XIX
secolo W.C. Sabine, cercando di affrontare scientificamente il problema
dell’acustica, quantificò questa sensazione introducendo un parametro,
denominato tempo di riverberazione, che misurasse il tempo che il suono impiega,
dopo la sua interruzione, per diventare inaudibile. Più recentemente, studi di
psicoacustica hanno mostrato che la sensazione soggettiva di riverberazione è
maggiormente influenzata dalla parte iniziale del decadimento sonoro, anche
perché solo poche volte è possibile ascoltare il decadimento sonoro in tutta la sua
interezza. Pertanto, è stato introdotto un secondo parametro denominato tempo di
primo decadimento.

2.3.1.1 Tempi di riverberazione


Secondo la definizione rigorosa il tempo di riverberazione RT è il tempo
necessario affinché l’energia sonora si riduca di 60 dB in rapporto al suo valore
iniziale, a partire dall’istante in cui la sorgente ha cessato di funzionare. In origine
la misura era effettuata saturando l’ambiente con un rumore bianco e misurando,
dopo la sua interruzione, il tempo necessario perché si avesse la diminuzione di 60
dB. In realtà, ottenere una tale dinamica non è affatto facile, perciò sono stati ben
presto introdotti criteri meno restrittivi basati su dinamiche meno ampie.
Attualmente la misura è condotta individuando la retta di migliore adattamento,
tracciata assumendo come riferimento il suono diretto, fra –5 dB e –35 dB ed in
tal caso si parla di T30. Laddove non fosse possibile ottenere neanche 30 dB di
Capitolo 2 17

decadimento, si può fare riferimento al T20 o al T10 adottando come intervalli


rispettivamente –5/–25 dB e –5/–15 dB. In caso di decadimento perfettamente
lineare le tre misure forniscono lo stesso risultato, ma è sufficiente che questo non
avvenga perché i valori siano differenti.
Così come descritta, la misura del tempo di riverberazione può essere
condotta senza conoscere la risposta all’impulso. Tuttavia, questo tipo di misura
risente grandemente delle fluttuazioni che affliggono la linearità del decadimento,
soprattutto alle basse frequenze, per cui, per avere dei risultati affidabili, è
necessario che la misura sia ripetuta un gran numero di volte.
Per ovviare a questo limite Schroeder [68] ha introdotto un nuovo metodo
basato sull’integrazione dell’energia contenuta nella risposta all’impulso, ma
procedendo “all’indietro” (cioè partendo dalla fine). La curva di decadimento che
si ottiene in questo modo risulta essere molto più regolare, si può infatti
dimostrare che essa è equivalente alla media di un numero infinito di decadimenti
ottenuti col metodo tradizionale. Questo metodo risulta pertanto più efficace ed
elegante del metodo tradizionale e, inoltre, mostra la grande importanza della
risposta all’impulso.
Benché sia oggi chiaro che il tempo di riverberazione caratterizza solo un
aspetto della propagazione del suono negli ambienti e necessita di essere
supportato da altri parametri, se si vuole una descrizione esaustiva delle
condizioni di ascolto, esso rimane comunque il descrittore oggettivo più
importante. In primo luogo, perché può essere misurato e predetto con
ragionevole accuratezza e senza grande difficoltà. In secondo luogo, perché non
dipende significativamente dalla posizione dell’osservatore, come mostra anche la
struttura semplice delle formule usate per predirlo1. Perciò è particolarmente
adatto a caratterizzare le proprietà acustiche complessive di un ambiente, non
potendosi trascurare l’immensa mole di dati sul tempo di riverberazione oggi
disponibili, anche in termini di frequenza.
Ai fini di una valutazione sintetica ci si riferisce solitamente al valore medio
dei tempi a 500 e 1000 Hz. Recenti studi [75] hanno confermato l’importanza di
tali bande di frequenza.

2.3.1.2 Tempo di primo decadimento EDT


Si è detto che studi di psicoacustica hanno mostrato la migliore
corrispondenza fra la sensazione soggettiva di riverberazione e la parte iniziale del
decadimento. Si pone, quindi, il problema di come quantificare il decadimento
iniziale. La prima idea2 fu quella di estrapolare il tempo di riverberazione dai
primi 160 ms di decadimento; successivamente su proposta di Jordan [50] si è
affermato il concetto di tempo di primo decadimento (EDT early decay time)
inteso come il tempo in cui si verifica il decadimento dei primi 10 dB (a partire
dall’arrivo del suono diretto), moltiplicato per 6 per renderlo omogeneo con RT.
Mentre il tempo di riverberazione è fortemente influenzato dalla parte
terminale della risposta all’impulso e, conseguentemente, varia poco all’interno
dell’ambiente, l’EDT è fortemente influenzato dalla prime riflessioni e, pertanto,
dipende dal punto di misura, consentendo di valutare anche differenze fra
postazioni diverse. La possibilità di valutare correttamente l’EDT è strettamente
legata alla conoscenza della risposta all’impulso: l’utilizzazione del metodo

1
Come le formule di Sabine e di Eyring, cfr. Rif. [29].
2
Cfr. Rif. [53], p. 208.
18 Capitolo 2

tradizionale porterebbe, infatti, a risultati troppo influenzati dalle fluttuazioni


casuali del suono.
Recentemente Griesinger [43], a seguito di ricerche mirate alla
individuazione della migliore misura della riverberazione di un ambiente, ha
proposto di ritornare alla originaria definizione di decadimento iniziale inteso
come quello estrapolato dai primi 160 ms (o meglio 350 ms): tale indice,
denominato EDT350, risulta essere più affidabile nei casi in cui il suono diretto è
di livello elevato. In alternativa, sempre Griesinger [41] suggerisce il calcolo di
EDT estrapolandolo dalla pendenza della congiungente il picco dell’integrale di
Schroeder ed il punto a 10 dB di distanza. Altre ricerche, fra cui quelle condotte
all’Ircam, suggeriscono invece di calcolare il parametro con riferimento ai primi
15 dB di decadimento.
Al pari del tempo di riverberazione, anche per il tempo di primo
decadimento si adotta la media dei valori relativi alle medie frequenze come
indice sintetico.

2.3.2 Indici di chiarezza


Per comprendere in che modo è possibile quantificare la sensazione
soggettiva di chiarezza è necessario in primo luogo approfondire il
comportamento dell’orecchio umano nei confronti delle riflessioni che lo
raggiungono. Quando una riflessione arriva subito dopo il suono diretto essa viene
integrata dall’orecchio e considerata come un rinforzo. Al contrario, quando una
riflessione arriva con un certo ritardo rispetto al suono diretto essa non solo non
ne costituisce un rinforzo ma, anzi, diviene causa di interferenza con i suoni che si
sono susseguiti.
I criteri oggettivi che si esporranno sono quasi sempre basati su un
confronto fra l’energia “utile” contenuta nella risposta all’impulso e quella
“dannosa”, cioè la rimanente. La scelta dell’intervallo di tempo entro il quale le
riflessioni possono considerarsi utili risulta non sempre facile e, comunque,
diversa a seconda che si voglia fare riferimento al parlato o alla musica. Il criterio
è quello di scegliere quell’intervallo di tempo oltre il quale una riflessione viene
percepita distintamente dal suono diretto: tale intervallo è denominato “limite di
percettibilità” ed è pari a 50 ms per il parlato e a 80 ms per la musica1.

2.3.2.1 Definizione (“Deutlichkeit”)


L’indice di definizione è stato uno dei primi ad essere introdotti ai fini della
valutazione dell’intelligibilità del parlato. È definito come il rapporto percentuale
fra l’energia contenuta nei primi 50 ms dopo l’arrivo del suono diretto e l’energia
totale:
50 ms

∫p
2
(t )dt
D= ∞
0
⋅ 100% (2.3)
∫p
2
(t )dt
0

1
Per il parlato il limite di 50 ms deriva sia da considerazioni relative al numero medio di sillabe al
secondo che un individuo pronuncia, sia da osservazioni sperimentali in merito alla percezione
delle riflessioni ritardate; per la musica il limite di 80 ms deriva invece da considerazioni in
merito alla durata minima delle note e al transitorio di alcuni strumenti musicali.
Capitolo 2 19

2.3.2.2 Chiarezza
L’indice di chiarezza è simile all’indice di definizione, con uno specifico
riferimento alla musica che comporta un limite di integrazione della parte “utile”
del suono pari ad 80 ms. Differisce lievemente nella forma dal momento che è
espressa in forma logaritmica:
80 ms

∫p
2
(t )dt
C80 = 10 log 0

[dB]. (2.4)
∫p
2
(t )dt
80 ms

Il pedice aggiunto al simbolo C serve a distinguere la chiarezza relativa alla


musica, C80 appunto, da quella relativa al parlato C50, identica alla prima fuorché
per l’intervallo di integrazione più breve. Tale indice viene correntemente
proposto ([22],[58]) come descrittore dell’intelligibilità del parlato.
In questo lavoro si utilizzerà il C80 con riferimento alla musica: in questo
caso il valore sintetico del parametro viene ottenuto [15] mediando i valori relativi
alle frequenze di 500, 1000 e 2000 Hz. Studi soggettivi recenti [75] hanno
mostrato che la migliore correlazione con i giudizi soggettivi si ottiene
considerando la media alle frequenze di 500 e 1000 Hz.

2.3.2.3 Indice di Lochner e Burger


I due indici descritti precedentemente condividono lo svantaggio che una
piccola variazione nel tempo di arrivo di una forte riflessione può variare
significativamente il valore del parametro a seconda che essa cada da un lato o
dall’altro del limite di percettibilità. Per ovviare a questo inconveniente Lochner e
Burger hanno proposto un indice in cui la parte utile dell’energia sonora viene
pesata, mediante un coefficiente α dipendente dal tempo, in modo da favorire una
transizione graduale fino a 95 ms. Tutta l’energia che arriva dopo i 95 ms viene
invece considerata come dannosa. Il parametro assume pertanto la seguente
forma:
95 ms

∫α ⋅ p
2
(t )dt
C 95 = 10 log 0

[dB]. (2.5)
∫p
2
(t )dt
95 ms

2.3.2.4 Tempo baricentrico (“Schwerpunktzeit”)


Un altro indice esente dai limiti dei primi due è il tempo baricentrico
definito come il momento del primo ordine della risposta all’impulso. Tale indice,
correlato alla chiarezza, ha il vantaggio di non essere basato sulla definizione di
un limite temprale preciso e, dunque, di essere molto stabile. È definito dalla:

∫t ⋅ p
2
(t )dt
ts = 0

[s]. (2.6)
∫p
2
(t )dt
0
20 Capitolo 2

Il valore del tempo baricentrico meglio correlato alla sensazione soggettiva


[75] è la media relativa alle frequenze di 500 e 1000 Hz.

2.3.2.5 Indici di trasmissione del parlato


Un approccio completamente diverso per la valutazione dell’intelligibilità
del parlato è quello proposto da Houtgast e Steeneken ([46],[76]). Esso non si
basa sulla risposta all’impulso acquisita in un punto, ma sulla cosiddetta “funzione
di trasferimento della modulazione” (MTF).
Supponiamo che una sorgente emetta un segnale stazionario la cui potenza
sia modulata sinusoidalmente secondo una funzione che, per ogni banda di ottava
(k), può essere espressa dalla relazione
I k (t ) = I k (1 + cos 2πFt ) , (2.7)

dove I k è l’intensità media per ottava ed F è la frequenza di modulazione. Al


ricevitore il segnale sarà
I k (t ) = I k (1 + mk cos 2πFt ) , (2.8)
in cui l’indice di modulazione mk dipende dal rapporto fra le intensità del segnale
di test e del rumore interferente, ed è dato (v. Figura 2.2) da
mk = I test ( I test + I noise ) . (2.9)

Figura 2.2 - Relazione fra rapporto segnale-rumore e la riduzione dell'indice di modulazione di un


segnale test. (da Rif. [76] )
Poiché l’indice di modulazione può essere ulteriormente corretto per tenere conto
degli effetti di mascheramento indotto dalle bande adiacenti, ottenendo l’indice
m', il rapporto segnale-rumore apparente può essere derivato da m' secondo
l’equazione
SNRk = 10 log( I test I noise ) = 10 log[mk′ (1 − m′k )] [dB]. (2.10)
Se il rapporto segnale-rumore viene poi normalizzato in modo che il suo valore
sia compreso fra 0 e 1, si ha in tal caso l’indice di trasmissione TIk, da cui si
ottiene l’indice di trasmissione del parlato come media pesata sulle sette ottave da
125 a 8000 Hz:
Capitolo 2 21

7
STI = ∑ (Wk ⋅ TI k ) ⋅ 100% (2.11)
k =1

Nel caso in cui sia necessario includere gli effetti di distorsioni nel dominio
temporale, quali possono essere quelle dovute alla riverberazione, è necessario
calcolare il rapporto segnale-rumore al variare della frequenza di modulazione in
un range variabile da 0,63 Hz a 12,5 Hz1. Ottenuta così una matrice di SNRk,F si
possono ricavare i corrispondenti TIk,F ed ottenere infine gli indici di trasferimento
della modulazione
1 14
MTI k = ∑ TI k ,F
14 F =1
(2.12)

da cui si ottiene nuovamente lo STI come media pesata degli MTIk.


Poiché con questo metodo è necessario calcolare la MTF per 98 volte (14
frequenze di modulazione per le 7 ottave), Houtgast e Steeneken hanno sviluppato
un metodo semplificato denominato “RApid Speech Transmission Index”
(RASTI). La semplificazione consiste nel fatto che si prendono in considerazione
solo due ottave – 500 e 2000 Hz – con quattro frequenze di modulazione per la
prima e cinque per la seconda2. Gli autori hanno condotto studi basati su diverse
lingue [47], verificando che c’è un buon accordo fra STI e RASTI e pertanto che il
metodo RASTI è idoneo a valutare l’intelligibilità del parlato. Entrambi i metodi
sono normalizzati dalla norma IEC 60268-16 [48].
Poiché la MTF è comunque correlata alla risposta all’impulso, è possibile,
partendo da quest’ultima, ottenere una misura dello STI o del RASTI che tenga
conto dell’effetto delle riverberazione e, mediante opportuni correttivi, anche del
rumore di fondo.

2.3.3 Indici di livello sonoro


L’intensità sonora percepita dall’ascoltatore all’interno di un ambiente, è
inevitabilmente influenzata oltre che dalle caratteristiche acustiche dell’ambiente,
anche dalle caratteristiche della sorgente emittente. Per questo motivo, affinché un
indice descriva solo il comportamento acustico di una sala e non le particolari
caratteristiche della sorgente (o del segnale), è sufficiente rapportare il livello
sonoro misurato nell’ambiente confinato al livello sonoro emesso dalla stessa
sorgente in campo libero (o anecoico) a 10 m di distanza. Tenendo conto che
l’energia contenuta nella risposta all’impulso è equivalente al livello sonoro in
condizioni stazionarie, il descrittore del livello sonoro, definito fattore di forza o
di robustezza (strength factor), è dato dalla relazione:

∫p
2
(t )dt
G = 10 log 0

= L p − L pA [dB], (2.13)
∫p
2
A (t )dt
0

essendo pA la pressione sonora rilevata a 10 m di distanza in campo anecoico.

1
Il range completo delle frequenze di modulazione è dato dai seguenti valori: 0.63; 0.80; 1.00;
1.25; 1.60; 2.00; 2.50; 3.15; 4.00; 5.00; 6.30; 8.00; 10.0; 12.5.
2
A 500 Hz si considerano le frequenze di modulazione di 1.0; 2.0; 4.0; 8.0 Hz; a 2000 Hz si
considerano le frequenze di modulazione di 0.7; 1.4; 2.8; 5.6; 11.2 Hz.
22 Capitolo 2

Secondo Beranek [15] il valore più aderente alla sensazione soggettiva è la


media calcolata rispetto alle medie frequenze. Tuttavia Souldore e Bradley [75]
hanno dimostrato che la migliore correlazione si ha considerando il valore globale
di G pesato in scala A, indicato con G(A).

2.3.4 Indici di intimità


Secondo Beranek [14] l’unico descrittore della sensazione di intimità è il
tempo di ritardo iniziale (tI) inteso come l’intervallo di tempo fra l’arrivo del
suono diretto e della prima riflessione. Secondo tale definizione, quindi,
dall’analisi della risposta all’impulso si dovrebbe poter determinare il valore del
parametro. Tuttavia lo stesso Beranek, pur non specificandolo espressamente, fa
riferimento non ad una generica prima riflessione, ma alla prima riflessione
laterale [15], per cui la determinazione del parametro a partire dalla risposta
all’impulso diviene estremamente più complessa. Infatti, Beranek suggerisce di
ricavare la misura graficamente e per un solo punto posto al centro della sala.
Secondo Barron [6], la sensazione di intimità è invece maggiormente
correlata con il livello sonoro e perciò con G.

2.3.5 Indici di bilanciamento delle basse frequenze


La caratterizzazione del comportamento di una sala in termini di basse
frequenze costituisce a tutt’oggi un problema dibattuto. Infatti non è ancora ben
chiaro quale parametro sia più indicato a descrivere la sensazione soggettiva data
dalle basse frequenze e solitamente indicata nei testi di acustica come
“calore”(warmth). Tutti i criteri rapportano aspetti del suono (riverberazione,
livello) relativi alle basse frequenze rispetto a quelli alle medie, fornendo un
indice numerico unico (non espresso, cioè, in bande di ottava).

2.3.5.1 Il rapporto dei bassi


Il più antico parametro è il rapporto dei bassi (bass ratio) BR definito da
Beranek [15] come:
RT125 + RT250
BR = , (2.14)
RT500 + RT1000
con riferimento ai tempi di riverberazione misurati a sala occupata. In alternativa
Barron [6] ha proposto di esprimere la misura come rapporto fra i valori di EDT, o
di ts, ovvero come differenza fra i livelli sonori a sala non occupata:
(G125 + G250 ) − (G500 + G1000 )
BR _ L = [dB]. (2.15)
2
Quest’ultimo parametro viene proposto anche da Beranek [15], il quale ritiene,
tuttavia, che sarebbe più opportuno calcolarlo con riferimento alla sala occupata
dal momento che, in tale situazione, si potrebbero avere, per effetto del minore
assorbimento delle basse frequenze da parte degli occupanti, considerevoli
differenze rispetto a quanto accade a sala vuota.
Capitolo 2 23

2.3.5.2 L’early bass level


Recentemente, Soulodre e Bradley [75] hanno proposto un nuovo indice
definito come early bass level, cioè il livello relativo dell’energia di bassa
frequenza valutato nei primi 50 ms:
50 ms

∫p
2
(125 − 500 Hz ) (t )dt
EBL = 10 log ∞ 0
= G050 (125 − 500 Hz ) [dB]. (2.16)
∫p
2
A (125 −500 Hz ) (t )dt
0

Tale livello è relativo in quanto riferito all’energia emessa dalla sorgente in campo
libero a 10 m di distanza, analogamente a quanto accade per G.
Il vantaggio di EBL rispetto agli indici dei bassi descritti prima, è che,
secondo gli studi di Soulodre e Bradley, esso è in migliore accordo con la risposta
individuale. Inoltre, essendo più sensibile degli altri alle differenze puntuali, può
descrivere con maggiore accuratezza alcuni difetti sonori quali quelli dovuti
all’incidenza radente sulle poltrone.

2.3.6 Indici di bilanciamento delle alte frequenze


Per quanto riguarda il bilanciamento delle alte frequenze la mancanza di un
indicatore affidabile è ancora più critica di quanto non lo sia per le basse
frequenze. Beranek [15] suggerisce di calcolare separatamente il rapporto fra i
valori di RT (o EDT) a 2000 Hz e a 4000 Hz e la media degli stessi a 500 e 1000
Hz. Soulodre e Bradley [75] sostengono un buon comportamento dei rapporti tra i
valori di RT, EDT, e ts a 4000 Hz e la media dei valori a 1000 e 2000 Hz. In
questo studio si prenderà in considerazione il rapporto fra i valori di EDT, definito
come treble ratio (TR):
2 ⋅ EDT4 kHz
TR = (2.17)
EDT1kHz + EDT2 kHz
Tuttavia Soulodre e Bradley introducono un treble ratio, più aderente alla
percezione soggettiva e definito come il rapporto fra l’energia di alta frequenza (4
kHz) delle riflessioni tardive (successive ad 80 ms) e l’energia relativa allo stesso
intervallo temporale a 1 e 2 kHz. Per distinguerlo dal precedente, tale parametro
sarà indicato come late treble ratio (LTR):

∫p
2
4 kHz (t )dt
LTR = 10 log 80 ms

= G80∞ (4 kHz ) − G80∞ (1 − 2 kHz ) [dB]. (2.18)
∫p
2
(1− 2 kHz ) (t )dt
80 ms

2.3.7 Criteri per l’individuazione degli echi


Quando una riflessione ritardata viene percepita in modo distinto dal suono
diretto essa viene denominata “eco”. Le condizioni sotto cui una riflessione
diviene un’eco dipendono da numerosi parametri, cioè dal tipo di segnale (parlato
più o meno veloce, musica più o meno veloce), dalle caratteristiche dell’ambiente
(più o meno riverberante) e dal livello sonoro della riflessione. La Figura 2.3
24 Capitolo 2

mostra la percentuale di soggetti disturbati da un eco di livello assegnato in


funzione del ritardo fra suono diretto e suono ritardato. Si osserva, ad esempio,
che il classico limite di 50 ms per una riflessione della stessa intensità del suono
diretto corrisponde ad una percentuale di disturbati del 20%.
Tuttavia negli ambienti reali le risposte all’impulso possiedono una struttura
molto complessa data dalle numerose riflessioni che giungono all’orecchio, le
quali influenzano il modo in cui una in particolare, l’eco, può essere percepita.
D’altra parte da un punto di vista pratico diventa indispensabile disporre di un
criterio in grado di indicare se un certo picco visibile in una risposta all’impulso
corrisponde o meno ad un’eco.
Fra i numerosi indici proposti, qui si descrive quello di Dietsch e Kraak [33]
che è basato sul rapporto
τ
n
∫ p(t ) t dt
ts (τ ) = 0
τ
(2.19)
n
∫ p(t )
0
dt

che definisce la crescita temporale della funzione p(t). La quantità usata per
valutare l’intensità di un eco è basata sul quoziente corrente di ts(τ):
 ∆ts (τ ) 
EC = max  , (2.20)
 ∆τ 
dove ∆τ può essere adattato al carattere del segnale sonoro al pari dell’esponente n
e del valore critico ECcrit che non deve essere superato per assicurare che non più
del 50% (o del 10%) degli ascoltatori possa individuare un’eco. Anche la
larghezza di banda del segnale di prova (ovvero del filtro da applicare alla risposta
all’impulso) variano a seconda che si faccia riferimento al parlato o alla musica e
sono riportati nella Tabella 2.1.

Figura 2.3 - Percentuale di ascoltatori disturbati da un segnale verbale ritardato. La velocità del
parlato è di 5.3 sillabe al secondo. I livelli relativi delle riflessioni (in dB) sono indicati dai numeri
accanto alle curve. (da Rif. [53], p. 181)

Tabella 2.1 - Dati caratteristici per il criterio di eco di Dietsch e Kraak


Segnale sonoro n τ ECcrit50 ECcrit10 Larghezza di banda del segnale
(ms) (Hz)
Parlato 2/3 9 1,0 0,9 700-1400
Musica 1 14 1,8 1,5 700-2800
Capitolo 2 25

2.4 Indici oggettivi binaurali

Per la determinazione degli indici oggettivi binaurali, cioè degli indici


deputati a valutare le caratteristiche spaziali del suono, non è sufficiente utilizzare
un semplice microfono omnidirezionale. Esso, infatti, va integrato con un
microfono avente un diagramma polare “a figura di 8”, ovvero con microfoni
binaurali tali da permettere l’acquisizione su due canali di stimoli il più possibile
simili a quelli che raggiungono la membrana timpanica delle orecchie umane.
Dettagli maggiori in merito alle specifiche tecniche di misura saranno dati nel
capitolo successivo. Nel seguito verranno presentati indici oggettivi i quali, per
poter essere calcolati, necessiteranno di risposte all’impulso acquisite con l’uno o
con l’altro tipo di strumentazione.
Dopo molti anni in cui si era pensato che l’impressione spaziale fosse un
concetto unico si è giunti a constatare che esso, invece, si compone di due diversi
aspetti: l’estensione apparente della sorgente (appearent source width ASW) e
l’avvolgimento dell’ascoltatore (listener envelopment LEV). Per ciascuno di essi
saranno illustrati i parametri ritenuti più idonei per la loro caratterizzazione.

2.4.1 Indici di estensione apparente della sorgente


L’estensione apparente della sorgente dipende dalle riflessioni laterali che
arrivano alle orecchie subito dopo il suono diretto ed entro i primi 80 ms. Gli
indici considerati cercano, in modo diverso, di quantificare ciò.

2.4.1.1 La frazione di energia laterale


A seguito degli studi sull’importanza delle riflessioni laterali per assicurare
una elevata qualità acustica [4], Barron e Marshall [12] proposero una misura
oggettiva dell’impressione spaziale derivata come rapporto fra l’energia delle
prime riflessioni laterali e l’energia delle prime riflessioni frontali, suggerendo
l’indice detto frazione di energia laterale:
80 ms

∫p (t ) ⋅ cosθ dt
2

LF ′ = 5 ms
80 ms
, (2.21a)
∫p
2
(t )dt
0

dove l’inizio dell’integrazione dopo 5 ms serve ad escludere l’eventuale


contributo del suono diretto.
Per motivi pratici, legati all’utilizzo di un microfono “a figura di 8” il quale
pesa, secondo la legge del coseno, la pressione e non l’energia, la frazione di
energia laterale viene più spesso definita come:
80 ms 80 ms

∫ p (t ) ⋅ cos θ dt ∫p
2 2 2
8 (t )dt
LF = 0
80 ms
= 0
80 ms
(2.21b)
∫p ∫p
2 2
(t )dt (t )dt
0 0

dove p8 è la pressione sonora acquisita mediante il microfono “a figura di 8”.


26 Capitolo 2

L’inconveniente della seconda formulazione è che l’energia laterale viene


pesata in funzione del quadrato del coseno e non del solo coseno. Per ovviare a
questo inconveniente Kleiner [52] ha proposto un metodo per misurare il
parametro in entrambi i modi senza ricorrere al microfono a figura di 8. L’utilizzo
della (2.21a) permette di integrare l’energia laterale partendo dall’arrivo del suono
diretto, Bradley [21] ha infatti dimostrato che l’esclusione del suono diretto non
modifica significativamente i risultati.
Il migliore accordo con la sensazione soggettiva ([7],[15]) si ottiene
mediando i valori relativi alle bande di ottava da 125 a 1000 Hz.

2.4.1.2 Il coefficiente di correlazione interaurale


Un altro indice impiegato per misurare l’ASW è il coefficiente di
correlazione interaurale IACC ([45],[63]). Esso si basa sulla osservazione che
un’onda sonora che arriva lateralmente eccita in maniera diversa le due orecchie,
mentre un’onda sonora frontale le eccita in maniera identica. Una misura
binaurale della differenza fra i segnali che arrivano alle due orecchie è la
“funzione di cross-correlazione interaurale” (IACFt):
t2

∫p L (t ) p R (t + τ )dt
IACFt (τ ) = t1
, (2.22)
t2 t2

∫p (t )dt ⋅ ∫ p (t )dt
2 2
L R
t1 t1

dove i pedici L ed R denotano le pressioni relative all’orecchio sinistro e al destro,


mentre τ rappresenta l’intervallo di tempo impiegato da un’onda sonora incidente
perpendicolarmente ad un lato della testa per passare da un orecchio all’altro e,
pertanto, si fa variare nell’intervallo da –1 a +1 ms. Infine, per ottenere il valore
che fornisce la massima similitudine fra le onde sonore che arrivano alle orecchie
si suole assumere il valore massimo che la funzione (2.22) assume al variare di τ
e lo si indica come coefficiente di correlazione interaurale (IACC):
IACC t = IACFt (τ ) max per τ <1, (2.23)
La scelta dei limiti di integrazione, come pure delle frequenze da prendere
in considerazione, non è univoca e dipende dall’equipe di ricerca. Hidaka et al
[45] propongono di integrare fra 0 e 80 ms denominando il parametro IACCE in
quanto relativo alla parte iniziale (“early”) della risposta all’impulso. Per le
frequenze essi propongono di mediare il valore relativo alle frequenze da 500 a
2000 Hz. Infine per fare in modo da avere un parametro crescente al crescere della
sensazione soggettiva di estensione della sorgente, essi propongono di utilizzare il
valore (1 – IACCE).

2.4.1.3 La differenza interaurale


Griesinger [43] ha proposto, come misura alternativa a quella ottenuta col
microfono “a figura di 8”, quella ottenuta da una coppia di microfoni binaurali
denominata differenza interaurale equalizzata (IAD), ottenuta dalla differenza fra
le risposte all’impulso relative al canale destro e sinistro, equalizzata in modo da
Capitolo 2 27

incrementare di 6 dB/ottava l’energia al disotto dei 300 Hz1. In tal modo l’autore
sostiene che
la IAD al di sotto dei 500 Hz è identica alla risposta di un microfono
a figura di 8, ma il metodo è auto calibrante. Si ottengono sia la
risposta omnidirezionale che quella a figura di 8, correttamente
equalizzate e bilanciate, da un’unica misura binaurale. (…) Al di
sopra dei 500 Hz la IAD segue la vera risposta direzionale della testa
meglio di un microfono a figura di 8.
In [44] Griesinger propone di esprimere la IAD come rapporto in dB:
t2

∫[ p
2
L (t ) − p R (t )]eq dt
IAD = 10 log t1t 2 , [dB] (2.24a)
∫[ p
2 2
L (t ) + p (t )]dt
R
t1

tuttavia, al fine di ottenere un parametro che sia confrontabile con LF si propone,


in questo lavoro, di esprimerlo in termini percentuali
t2

∫[ p
2
L (t ) − p R (t )]eq dt
IAD = t1
t2
⋅ 50% . (2.24b)
∫[ p
2 2
L (t ) + p (t )]dt
R
t1

La moltiplicazione per 50 serve per normalizzare il parametro in modo che sia


variabile fra 0 e 1. Se infatti le due onde sonore sono in opposizione di fase il
numeratore è pari a due volte il denominatore. Analogamente alla LF si propone
di utilizzare come estremi di integrazione 0 e 80 ms. Il parametro sarà indicato
con IADE, dove il pedice “E” denota il riferimento alla parte iniziale della risposta
all’impulso. Il valore sintetico si otterrà mediando i valori relativi alle frequenze
da 250 a 1000 Hz.

2.4.2 Indici di avvolgimento dell’ascoltatore


La sensazione di avvolgimento dell’ascoltatore, al contrario della ASW,
dipende dal livello totale e dalla distribuzione spazio-temporale dell’energia
sonora tardiva che raggiunge l’ascoltatore. Bradley e Soulodre [24] hanno
proposto una misura unica che tenga conto di entrambi gli aspetti e che hanno
denominato livello sonoro relativo dell’energia laterale tardiva e definito come:

∫p (t ) ⋅ cos 2 θ dt
2

LLG = LG80∞ = 10 log 80 ∞


[dB] (2.25)
∫p
2
A (t )dt
0

In alternativa Bradley e Soulodre suggeriscono come misure valide i


logaritmi dei valori di LFL e (1–IACCL), dove il pedice “L” denota che i parametri
sono calcolati con riferimento alla parte tardiva (“late”) della risposta all’impulso

1
Questo limite di frequenza viene proposto in [44] mentre in [43] l’autore aveva proposto 400 Hz.
28 Capitolo 2

(cioè nell’intervallo da 80 ms a infinito), e mediati preferibilmente sulle frequenze


da 250 a 1000 Hz.1 Analogamente a quanto visto nel paragrafo precedente la LF
può essere sostituita dalla IAD calcolata fra gli stessi estremi di integrazione ed
espressa in forma logaritmica secondo la (2.24a). Pertanto nel seguito il simbolo
IADL denoterà il rapporto espresso in forma logaritmica secondo la (2.24a), senza
la normalizzazione.

2.5 Criteri per la valutazione della qualità acustica di un


ambiente

Nei paragrafi precedenti sono stati presentati numerosi parametri, buona


parte dei quali sono valutati per ciascuna banda di ottava del campo di udibilità.
Questo significa che da una risposta all’impulso (o da due nel caso di una risposta
binaurale), è possibile ottenere una notevole mole di dati. Tuttavia nel momento in
cui si desidera utilizzare tali dati per formulare un giudizio su una particolare
postazione, ovvero su una sala nella sua interezza, diventa indispensabile disporre
di indici sintetici e, al tempo stesso, ridurre gli stessi al numero minimo
strettamente necessario. Una volta fatta questa opera di selezione è poi possibile
definire quali debbano essere i valori ottimali entro cui i parametri selezionati
possono variare affinché l’acustica venga considerata ottimale. Infine, è
necessario capire in che modo si combinano gli aspetti selezionati per dar luogo al
giudizio finale. Tutte queste fasi si basano su misure soggettive di psicoacustica e
richiedono, in genere, analisi statistiche più o meno complesse mediante le quali
estrapolare i risultati.
Poiché, come già detto, la trattazione di questa materia è molto vasta ed
esula dagli scopi di questo lavoro si rimanda all’ampia letteratura esistente ([6],
[14],[15],[29],[53],[66],[75]). Qui saranno ripresi, brevemente, i principali
risultati di tali studi, tenendo conto che lo scopo di questo lavoro non è quello di
operare una classifica delle chiese acusticamente più valide, ma quello di
analizzarne il loro comportamento dal punto di vista acustico con riferimento sia
alla musica sia al parlato. In tal senso, essendo gli studi finora condotti incentrati
sull’acustica delle sale da concerto, si assumeranno i criteri esposti e gli intervalli
ottimali per i parametri acustici come puro e semplice riferimento. Si pensi ad
esempio al metodo di classificazione proposto da Beranek [15] che si basa sui
valori di sei parametri, IACCE, EDT, SDI2, G, tI, BR, aventi come “pesi” nella
formulazione del giudizio globale rispettivamente 0.25, 0.25, 0.15, 0.15, 0.10,
0.10. Come si vedrà nel seguito, vi sono chiese in cui, ad eccezione di EDT, gli
altri parametri hanno valori che rientrano fra quelli ottimali, tuttavia la
lunghissima riverberazione rende l’acustica spesso inaccettabile. Ciò conferma
che l’applicazione dei criteri che si esporranno dovrà essere sempre fatta
criticamente e assumendoli solo come pietra di paragone.

1
Nel presente lavoro, a causa di limitazioni imposte dal software per il calcolo dell’IACC, sono
state prese in considerazione solo le frequenze da 500 Hz a 4 kHz, pertanto l’indice sintetico
verrà calcolato mediando fra le sole frequenze di 500 e 1000 Hz.
2
Indice di diffusività superficiale. Non è presentato qui in quanto si basa su una valutazione “a
vista”. Può variare fra 0 (superfici lisce) e 1 (superfici decorate e diffondenti).
Capitolo 2 29

2.5.1 Definizione degli intervalli di variabilità ottimali


Poiché nelle chiese si svolgono due attività (l’enunciazione della parola e il
canto accompagnato dalla musica) che richiedono caratteristiche acustiche molto
diverse si proporranno, ove possibile i valori ottimali relativi ai due diversi aspetti.
Il tempo di riverberazione è, fra i diversi parametri, il solo per il quale vi
siano dati sufficienti a definire dei valori ottimali anche per le chiese. Cremer e
Muller [29] propongono il diagramma in Figura 2.4, basato sui dati sperimentali
riportati in Tabella 2.2, e sostengono che nelle chiese dovrebbero essere adottate
le condizioni che risultano ottimali sotto il profilo strettamente artistico-musicale.
Kuttruff [53] suggerisce di non superare i 2 s se l’intelligibilità del parlato ha un
ruolo preponderante rispetto alla musica e al canto, per i quali tempi più lunghi
potrebbero essere accettati.
Il tempo di primo decadimento non possiede una simile base di dati, perciò
si riportano solo i valori che Beranek [15] ritiene ottimali per le sale da concerto:
EDT alle medie frequenze deve risultare compreso fra 2,0 e 2,3 s a sala vuota.
Per il tempo di ritardo iniziale tI i valori ottimali devono essere, secondo
Beranek [15], inferiori a 20 ms; secondo Ando, inferiori a 30 ms.
Per l’indice di definizione D, Cremer e Muller ([29], p. 628) riportano un
valore minimo pari al 34%, tuttavia, considerato il dualismo fra questo parametro
e l’indice di chiarezza e, vista la maggiore disponibilità di dati per quest’ultimo,
l’indice D verrà nel seguito trascurato.
Per la chiarezza C80, esiste un consenso sui valori ottimali che devono
essere compresi fra –2 e +2 dB, tuttavia per musica d’organo possono essere
accettati [58] anche valori fino a –9 dB (v. Figura 2.5).
Per il tempo baricentrico ts, Cremer e Muller [29] riportano come valore
ottimale 140 ms.

Figura 2.4 - Intervalli dei tempi di riverberazione raccomandati per le chiese. Sono assegnati due
limiti superiori: uno per la chiesa quasi vuota e l’altro per la chiesa occupata. Misure a chiesa
vuota ({) e piena (z). (da Rif. [29], p. 625)

Tabella 2.2 - Tempi di riverberazione di alcune chiese tedesche (da Rif. [29], p. 623).
V Frequenze (Hz)
Chiesa (m3) 125 250 500 1000 2000 4000
Chiesa di Hüttenweg, Berlino 2500 V 3,0 2,4 2,4 2,2 2,0 1,7
Chiesa ev. di Lietzensee, Berlino 3200 V 2,1 2,5 2,6 2,7 2,0 2,1
Thomas-Kirche, Lipsia V 2,45 3,5 3,5 3,1 2,9 2,1
18000 V 2,65 3,65 4,0 3,9 3,3 2,0
Idem, dopo i restauri
O 1,9 2,0 2,0 1,85 1,6 1,5
V 7,0 8,5 8,0 6,5 5,5 4,1
Chiesa dell’abbazia di Weingarten 90000
O 6,0 6,3 6,0 5,4 4,1 3,0
Chiesa dell’abbazia di Ottobeuren 130000 O 6,0 7,0 6,0 7,0 6,0 4,0
V = chiesa non occupata, O = Chiesa occupata
30 Capitolo 2

Figura 2.5 - Relazione fra indice di articolazione "AI" e scale di valutazione per il parlato C50 e la
musica C80. (da Rif.[58] )
Per il fattore di forza Gmid i valori suggeriti da Beranek [15] sono compresi
fra 4 e 5,5 dB; Barron [7] ritiene invece accettabili valori positivi dell’indice. Per
il parametro G(A) proposto da Soulodre e Bradley [75] non sono invece ancora
disponibili in letteratura valori ottimali. Tuttavia, utilizzando i dati sperimentali
riportati da Beranek ([15], Appendice 4) è possibile osservare che per le sale
migliori (Categoria A ed A+) il valore è compreso fra 9,5 e 13,3 dB.
Per lo STI e per il RASTI i valori del parametro sono associati a giudizi sulla
intelligibilità delle parole [77], così come riportato in Tabella 2.3. Nella stessa
tabella, tenendo conto del lavoro di Carvalho1 vengono riportati i valori del ts
corrispondenti. Si può notare che il valore ottimale del ts pari a 140 ms
corrisponde solo ad un giudizio “sufficiente”.
Tabella 2.3 - Relazione fra giudizio e varie misure di intelligibilità.
Giudizio STI/RASTI ts
Eccellente >0,75 <48
Buono 0,60-0,75 48-81
Sufficiente 0,45-0,60 81-160
Scarso 0,30-0,45 160-420
Pessimo <0,30 >420

Per gli indici di bilanciamento tonale esistono valori ottimali per il solo
rapporto dei bassi BR che, secondo Beranek [15], deve essere pari a 1,1-1,2 se la
sala è occupata. Tuttavia calcolando il parametro a sala vuota, utilizzando i dati
riportati dallo stesso Beranek ([15], Appendice 4), risulta che le sale migliori
hanno valori variabili fra 0.9 e 1,2, pertanto nel seguito si farà riferimento a tale
intervallo.
Procedendo in maniera analoga, è possibile osservare che nelle sale migliori
i valori di BR_L variano fra –2,0 e 0,9 dB. Per l’EBL non si dispone di valori
ottimali, tuttavia, secondo quanto riportato da Soulodre e Bradley [75], il
parametro può variare fra –4 e 10 dB, valori che saranno assunti come riferimento.
Per il bilanciamento delle alte frequenze il parametro TR calcolato per le
sale migliori risulta compreso fra 0,7 e 0,9, mentre per il parametro LTR non si
dispone di valori ottimali e, pertanto, si assumeranno come semplice riferimento i
valori limite riportati da Soulodre e Bradley, pari a –9 e –4 dB. D’altra parte, non
essendo specificato a quale delle due formulazioni di LTR è riferito tale intervallo,
esso è da considerarsi puramente indicativo.
Per gli indici di spazialità vale la regola che “di più è meglio” pertanto sia
per LF (ovvero IADE), che per (1 – IACCE) i valori ottimali sono quelli più alti. In
ogni caso per LF non si dovrebbe scendere al di sotto di 0,20, mentre per
1
Nel Rif. [25] viene proposta una relazione per esprimere il RASTI in funzione di Ts. Essa assume
la seguente forma: RASTI = 378 Ts-0.419.
Capitolo 2 31

(1 − IACC E ) non si dovrebbe scendere al disotto di 0,60. Per IADE non sono
disponibili valori in letteratura, ma analisi di regressione descritte nell’ultimo
capitolo mostrano che il valore limite può essere assunto pari a 0,35 . Per quanto
riguarda i descrittori del LEV non sono disponibili in letteratura valori consigliati.
Di seguito, nella Tabella 2.4 sono riassunti, per ciascun parametro, le
frequenze da considerare per determinare gli indici sintetici e gli intervalli dei
valori ottimali.

Tabella 2.4 - Riassunto dei parametri considerati, delle frequenze da usare per il calcolo degli
indici sintetici ed intervalli ottimali.
Frequenze
Parametro Intervallo ottimale Note
caratteristiche
RT 500-1000 Hz 2 ÷ 3,5 s
EDT 500-1000 Hz 2 ÷ 2,3 s
EDT350 500-1000 Hz - Non considerato
D n.s. > 34% Non considerato
C80 500-2000 Hz –2 ÷ 2 dB
ts 500-1000 Hz > 140 ms
STI/RASTI - > 0,45
G 500-1000 Hz 4,0 ÷ 5,5 dB
G(A) Pesato in scala A 9,5 ÷ 13,5 dB
tI - < 30 ms Non considerato
BR - 0,9 ÷ 1,2
BR_L - –2 ÷ 1
EBL - –4 ÷ 10 dB
TR - 0,7 ÷ 0,9
LTR - –9 ÷ –4 dB
ECspeech 700-1400 Hz <1,0 (<0,9)
ECmusic 700-2800 Hz <1,8 (<1,5)
LFE 125-1000 Hz > 0,20
1-IACCE 500-2000 Hz > 0,60
IADE 250-1000 Hz > 0,35
LFL 250-1000 Hz n.s Non calcolabile
1-IACCL 250-1000 Hz n.s
IADL 250-1000 Hz n.s
GLL Pesato in scala A n.s Non calcolabile
n.s. = non specificato
Capitolo 3

Strumenti e metodi di misura

In questo capitolo saranno analizzate brevemente la strumentazione


e le tecniche di misura adottate in questo studio, cioè la tecnica MLS
e la TDS. In particolare si analizzeranno le metodologie per
l’acquisizione delle risposte all’impulso monoaurali confrontando
alcuni risultati ottenuti con le due diverse metodologie. Analogamente
si confronteranno risultati relativi alle risposte all’impulso binaurali.

3.1 Premessa

Si è visto al principio del capitolo precedente che la risposta all’impulso è la


descrizione delle trasformazioni che il suono subisce all’interno di un ambiente
nel passaggio fra la sorgente e il ricevitore. Inoltre, tutti i parametri acustici
descritti nel precedente capitolo possono essere calcolati a partire dalla risposta
all’impulso o, nel caso dei parametri binaurali, dalle risposte all’impulso acquisite
con opportuni microfoni binaurali. Si comprende pertanto che la corretta
acquisizione della risposta all’impulso in un punto è una delle questioni di
maggiore rilevanza nell’acustica architettonica. È necessario che tutte le
componenti rispondano a precisi standard e siano, il più possibile, esenti da
distorsioni.
Poiché la risposta all’impulso è il modo in cui l’ambiente reagisce ad una
eccitazione di breve durata, i metodi più semplici, e più datati, per l’acquisizione
consistevano nel produrre un impulso, mediante una pistola a salve o lo scoppio di
un pallone, e nella registrazione nel punto dato della risposta dell’ambiente.
Tuttavia tali sorgenti, benché accettate dagli standard internazionali [49],
presentano seri problemi di ripetibilità della misura e non hanno uno spettro
normalizzato per cui non è possibile ottenere né informazioni relative allo spettro
sonoro dovuto all’ambiente, né informazioni sul livello di pressione sonora
assoluto [38]. Inoltre, tali sorgenti risultano essere direzionali, non emettono cioè
l’energia in modo uniforme in tutte le direzioni [42]. Questo fenomeno non
influenza significativamente la misura del tempo di riverberazione in quanto esso
dipende prevalentemente dalla componente “tardiva” della risposta all’impulso, in
cui, prevalendo l’effetto del campo sonoro diffuso, le eventuali direzioni
preferenziali perdono peso. Tuttavia per le misure di chiarezza o, ancora di più,
per quelle spaziali in cui la componente direzionale delle prime riflessioni è di
fondamentale importanza, tali tipi di sorgenti non possono essere utilizzate.
34 Capitolo 3

La soluzione a questo inconveniente è rappresentata dall’utilizzo di una


sorgente sonora elettroacustica composta da almeno 12 altoparlanti montati sulle
facce di un dodecaedro regolare e alimentata da opportuni segnali impulsivi.
Anche in questo caso, però, è possibile riscontrare alle frequenze più alte
(superiori ai 2000 Hz [42]) una non perfetta omnidirezionalità cui si può far fronte
con una opportuna orientazione della sorgente. Questo tipo di sorgente ha però
degli altri svantaggi legati all’incapacità di riprodurre correttamente i segnali
impulsivi e, soprattutto, alla necessità che l’energia del segnale di eccitazione non
scenda al disotto di certi limiti se si desidera ottenere un rapporto segnale-rumore
sufficientemente elevato. Ma, poiché tutta l’energia deve essere concentrata in un
breve intervallo di tempo, l’ampiezza del segnale necessaria può essere così alta
da portare l’altoparlante a funzionare al di fuori del suo intervallo di linearità se
non, addirittura, ad essere danneggiato. I metodi per ottenere un rapporto segnale-
rumore adeguato senza incorrere negli inconvenienti descritti saranno descritti nel
paragrafo seguente.
Per quanto riguarda l’acquisizione del segnale i problemi sono, in genere,
minori. Quando interessa ottenere una risposta all’impulso monoaurale è
necessario che il microfono abbia una buono sensibilità, sia omnidirezionale e
abbia una risposta in frequenza sufficientemente piatta: caratteristiche che sono
normalmente garantite da microfoni sensibili alla pressione. Quando il microfono
deve avere una risposta direzionale particolare, come quella “a figura di 8”
richiesta per la misura della frazione di energia laterale LF, è necessario che il
trasduttore sia sensibile al gradiente di pressione o alla velocità delle particelle.
Infine, quando è necessario ottenere una risposta all’impulso binaurale si aprono
diverse possibilità. La scelta più semplice ed economica è spesso rappresentata
dall’utilizzo di due microfoni omnidirezionali (tipo Lavalier) posizionati
all’ingresso del canale auricolare di un individuo o di un manichino. In tal caso i
trasduttori devono rispondere alle stesse specifiche viste in precedenza per i
microfoni omnidirezionali con, in più, la condizione che le sensibilità dei due
microfoni siano il più possibile simili. Soluzioni più complesse, e costose,
prevedono l’installazione dei microfoni all’interno di teste binaurali
appositamente realizzate in modo da simulare il percorso del suono all’interno del
canale auricolare. Spesso tali sistemi sono dotati di filtri che permettono di
simulare in maniera molto precisa il suono così come arriva all’orecchio umano.

3.2 Tecniche di misura basate sulla convoluzione

Le due principali tecniche per l’acquisizione della risposta all’impulso di un


ambiente senza usare un segnale impulsivo sono quelle basate sulla convoluzione
o, meglio, sulla deconvoluzione di un segnale noto. Si è visto nel paragrafo 2.1
che se x(t) è il segnale emesso dalla sorgente e h(t) è la risposta all’impulso nel
punto in esame, il segnale che arriva al ricevitore, cioè la risposta dell’ambiente, è
dato dal prodotto di convoluzione fra x(t) e h(t)
y (t ) = h(t ) ⊗ x(t ) , (3.1)
pertanto se il segnale emesso è noto, per ottenere h(t) è sufficiente deconvolvere
lo stesso dalla risposta dell’ambiente
h(t ) = y (t ) ⊗ [ x(t )]−1 , (3.2)
Capitolo 3 35

ovvero, dopo aver trovato il filtro inverso f(t) tale che:


x(t ) ⊗ f (t ) = δ (t ) , (3.3)
essendo δ(t) la funzione di Dirac (corrispondente ad un impulso elementare),
convolvere y(t) con f(t):
h(t ) = y (t ) ⊗ f (t ) . (3.4)
Affinché questo metodo possa essere utilizzato efficacemente è necessario
che il segnale emesso sia di tipo deterministico e che il sistema possa considerarsi
perfettamente lineare e invariante nel tempo (LTI = linear and time invariant). Se
quest’ultima condizione non dovesse essere soddisfatta intervengono problemi
che possono condizionare più o meno pesantemente i risultati.
Le due tecniche che verranno descritte si differenziano per il tipo di segnale
con cui viene eccitato l’ambiente e per il modo in cui viene effettuata la
deconvoluzione. Per ciascun metodo saranno evidenziati i rispettivi vantaggi e
svantaggi.

3.2.1 La tecnica MLS


Una sequenza di massima lunghezza (MLS = maximum length sequence) è
un particolare tipo di segnale costituito da una sequenza deterministica di impulsi
bipolari la cui lunghezza totale è pari a
L = 2n – 1 (3.5)
elementi, dove n è un intero positivo e rappresenta l’ordine della sequenza. Ad
esempio per n = 3 la sequenza è data da:
–1, +1, +1, –1, +1, –1, –1.
La caratteristica peculiare di tale segnale è che la deconvoluzione può essere
effettuata con un algoritmo estremamente veloce denominato “fast Hadamard
transformation” (FHT). Inoltre, data la natura deterministica del segnale, una sua
ripetizione dovrebbe dare risultati esattamente riproducibili, misurati e confrontati
fra un periodo e l’altro. Ciò consente di applicare la media sincrona, procedura
che riduce il livello effettivo del rumore di fondo di 3 dB per ogni raddoppio del
numero di medie. Il motivo è che i periodi del segnale emesso, esattamente
ripetuti, si sommano in fase, mentre il rumore di fondo dei diversi periodi non è
correlato e perciò solo la sua energia viene sommata. Questo processo di
mediazione è un tipico vantaggio dei segnali deterministici.
Un altro vantaggio di questa tecnica, dovuto alla trasformata di Hadamard,
è che il rapporto segnale-rumore effettivo della risposta all’impulso (rapporto che
può essere meglio definito come rapporto picco-rumore), è più elevato del
rapporto “segnale stazionario-rumore” in quanto, se si considera un tipico
decadimento esponenziale, tutta l’energia contenuta nel periodo MLS viene
compressa nella parte iniziale della risposta all’impulso (v. Figura 3.1). Pertanto
l’incremento totale del rapporto segnale-rumore fra un segnale MLS di durata tMLS
ripetuto N volte e un segnale convenzionale avente lo stesso livello stazionario e
la stessa durata totale N·tMLS, è dato da
13.8 N ⋅ t MLS
∆ totale = 10 log , [dB] (3.6)
T
essendo T il tempo di riverberazione dell’ambiente.
36 Capitolo 3

Figura 3.1 - Confronto fra potenze relative dei segnali. Rumore di fondo (linea tratteggiata);
segnale MLS prima (linea continua orizzontale) e risposta all'impulso dopo (curva esponenziale) la
trasformazione di Hadamard. (da Rif. [80])
È importante osservare che la durata della sequenza tMLS deve essere sempre
superiore al tempo di riverberazione dell’ambiente per evitare il problema del
“time aliasing” che consiste nella sovrapposizione della parte terminale del
decadimento relativo ad un periodo con la parte iniziale del periodo successivo.
Ciò in genere si manifesta sotto forma di un rumore che precede il suono diretto.
I principali problemi ed inconvenienti della tecnica MLS possono essere
così riassunti:
- lo spettro del segnale è bianco. Pertanto nella maggior parte degli
ambienti, dove il rumore di fondo è prevalente alle basse frequenze, è
necessario, per ottenere un adeguato rapporto S/R, o aumentare il
numero di periodi (ma oltre un certo numero non si osserva più alcun
miglioramento), oppure aumentare la potenza emessa dalla sorgente (e
questo è rischioso perché l’altoparlante può uscire fuori del suo
intervallo di linearità) [42];
- è necessario che la frequenza di clock del generatore MLS sia
sincronizzata con la frequenza di clock del convertitore A/D della parte
ricevente, diversamente il rapporto S/R ne può risultare ridotto. Questo
pone dei limiti allorché si desideri registrare la risposta dell’ambiente
per una successiva elaborazione: secondo Griesinger [42] è necessario
utilizzare lo stesso strumento sia in registrazione che in riproduzione;
- la distorsione prodotta dall’altoparlante e, perciò, il venir meno della
condizione di linearità del sistema, si manifesta sia sotto forma di un
aumento del rumore di fondo ([42], [80]), sia sotto la forma, più
fastidiosa, di una serie di riflessioni spurie [36] (v. Figura 3.2), che
ovviamente rendono la risposta all’impulso inutilizzabile. La soluzione
è rappresentata dalla riduzione della potenza emessa dalla sorgente
incrementando il numero di medie per conseguire lo stesso rapporto
S/R;
- la presenza di fenomeni transitori e, quindi, il venir meno della
condizione di invarianza temporale, è un altro problema, spesso
sottovalutato, che si manifesta con una distorsione della risposta
all’impulso ([42], [80]). Cause tipiche di tali variazioni sono le correnti
d’aria (non rare in ambienti molto ampi) e le variazioni di temperatura
indotte dall’illuminazione o dall’eventuale presenza di persone. La
presenza di persone in movimento modifica poi “fisicamente”
l’ambiente e di conseguenza i dettagli delle riflessioni. Poiché questi
effetti sono lenti essi non colpiscono le singole sequenze (infatti
vengono detti “interperiodici”), ma invalidano il calcolo della media
Capitolo 3 37

[80]. Laddove il singolo periodo fosse particolarmente lungo le varianze


temporali vanno a compromettere anche il singolo periodo ( e in tal caso
vengono dette “intraperiodiche”). Tuttavia questo tipo è piuttosto raro;
- la mancanza di invarianza temporale determina, infine, un errore
sistematico nella stima del tempo di riverberazione alle alte frequenze.
Infatti il processo di media sincrona funziona correttamente nella prima
parte del decadimento, dove piccole perturbazioni nelle condizioni al
contorno non modificano significativamente la fase della risposta
all’impulso. Man mano che il decadimento del suono avanza, però, le
condizioni al contorno divengono sempre più importanti e, quando più
risposte vengono sommate tenendo conto della fase, il suono appare
decadere più rapidamente [42].

Figura 3.2 - Risposta all'impulso acquisita con tecnica MLS in presenza di un sistema fortemente
non lineare. (da Rif. [36]).

3.2.2 La tecnica TDS


Il successo del metodo MLS è stato, ed è, legato all’efficienza della
trasformazione di Hadamard nel deconvolvere la risposta all’impulso dalla
risposta dell’ambiente. Tuttavia si è visto che il metodo non è esente da difetti.
Un metodo che ha conosciuto una recente rinascita (grazie alla eccezionale
potenza di calcolo messa a disposizione dai moderni calcolatori), è quello della
“time delay specrometry” (TDS).
Il principio su cui si basa questa tecnica è quello di alimentare l’altoparlante
omnidirezionale con uno sweep, cioè un segnale sinusoidale che contiene tutte le
frequenze sfasate nel tempo. Grazie alla sua durata relativamente lunga, una
notevole quantità di energia può essere immessa nell’ambiente senza generare
effetti di distorsione nella sorgente. Poiché il segnale è chiaramente di tipo
“deterministico” è possibile ricavarne il suo filtro inverso f(t) e, una volta
acquisita la risposta dell’ambiente, deconvolvere quest’ultima per ottenere la
risposta all’impulso h(t) dall’equazione (3.4). Questa volta la deconvoluzione non
può essere effettuata con l’algoritmo di Hadamard, ma deve essere fatta
ricorrendo alla più lenta trasformata di Fourier (FFT), la quale, oggigiorno, non è
più così onerosa come un tempo. Diverse applicazioni di questa tecnica si possono
trovare in letteratura ([3], [16], [36], [42]), in generale le differenze riguardano la
durata del segnale, le sue caratteristiche spettrali e la regola con cui la frequenza
38 Capitolo 3

viene variata. In primo luogo conviene analizzare quest’ultimo aspetto. Infatti, la


frequenza del segnale sinusoidale può essere variata, rispetto al tempo, sia
linearmente che logaritmicamente. Il secondo tipo di variazione ha il vantaggio,
rispetto al primo, di produrre un migliore rapporto S/R alle basse frequenze, dal
momento che in quelle bande di frequenza la potenza viene emessa più lentamente
per cui lo spettro del segnale emesso è rosa (cioè l’energia decresce di 3
dB/ottava). Si comprende facilmente, quindi, che la velocità di variazione della
frequenza e lo spettro sono fra loro correlate. In tal senso Griesinger [42] propone
uno sweep in cui fino a 200 Hz la velocità di variazione è tale da produrre un
decremento di 12 dB/ottava, mentre al di sopra la velocità è tale da produrre uno
spettro rosa.
Per quanto riguarda la durata non esiste una regola precisa, alcuni ricercatori
preferiscono utilizzare un segnale di breve durata [16], altri uno molto lungo [36],
altri ancora [42] suggeriscono un valore intermedio che rappresenti un giusto
compromesso fra il bisogno di elevata linearità e quello di immettere
nell’ambiente una potenza molto elevata. Se, infatti, un segnale lungo consente di
immettere molta potenza e di ottenere ottimi rapporti S/R, un segnale breve
consente di sfruttare i vantaggi propri di una eccitazione impulsiva, cioè linearità e
stabilità. In tal modo le riflessioni più deboli possono essere misurate direttamente
senza bisogno che siano “estratte” dalla parte finale dell’eccitazione. È opportuno
osservare che anche per lo sweep, come per l’MLS, si pone il problema del “time
aliasing”. In questo caso la soluzione è rappresentata dall’aggiunta, in coda al
segnale, di una pausa di silenzio (di durata all’incirca pari al tempo di
riverberazione dell’ambiente), tale da permettere a tutte le riflessioni di essere
intercettate senza sovrapporsi all’inizio del nuovo stimolo.
Tenuto conto che per questa tecnica non vi sono problemi di sincronia fra
generatore del segnale e sistema di acquisizione, rimangono soltanto i problemi
connessi con la non linearità del sistema e la sua eventuale varianza nel tempo.
Nel primo caso si osserva ([36],[42]) che il processo di deconvoluzione della
risposta all’impulso localizza gli effetti della distorsione (che si manifestano
anche in questo caso come riflessioni spurie) prima o dopo la risposta all’impulso
vera e propria, di modo che essi possono essere agevolmente eliminati. Nel

Figura 3.3 - Esempi di sweep logaritmico (sinistra) e lineare (destra). Rappresentazione della
forma d'onda (sopra) e del sonogramma (sotto).
Capitolo 3 39

secondo caso, in presenza di eventuali variazioni temporali nel sistema (che


ancora una volta vanno a corrompere il processo di mediazione sincrona) si può
ovviare all’inconveniente adoperando una misura eseguita adoperando una
sequenza di sweep logaritmici molto lunghi (in modo da avere comunque un buon
rapporto segnale-rumore), ma senza eseguire la media, deconvolvendo, cioè, la
risposta dell’ambiente corrispondente ad un solo stimolo. In questo modo si ha
una esatta “fotografia” dell’ambiente non influenzata da variazioni temporali
(evidentemente più lente e quindi tali da non influenzare il singolo stimolo).
In conclusione l’utilizzo di uno sweep logaritmico sinusoidale consente di
superare tutte le limitazioni insite nella metodologia MLS. Nel seguito si
confronteranno i risultati ottenuti con le due metodologie.

3.3 La strumentazione impiegata

Nella presente ricerca sono state impiegate diverse apparecchiature di


misura, sia per l’acquisizione delle risposte all’impulso monoaurali che per quelle
binaurali. Ciò è stato dettato sia da motivi di necessità (poiché all’inizio della
ricerca alcune apparecchiature non erano disponibili) sia di opportunità (poiché in
alcuni casi si è avuta ampia possibilità di operare e sono, perciò, state condotte le
misure con tutte le tecniche disponibili).
In tutti i casi è stata utilizzata una sorgente sonora costituita da 12
altoparlanti montati su un dodecaedro regolare in resina, realizzato
artigianalmente e conforme alle prescrizioni della ISO 3382 [49]. Sono state
acquisite sempre le risposte all’impulso monoaurali utilizzando un sistema
certificato Symphonie della 01 dB unitamente al software dBBati 32 e dBFA 32.
Come ricevitore è stato utilizzato un microfono omnidirezionale GRAS 40AR.
Il sistema utilizza la tecnica MLS e anche se consente di acquisire le
risposte all’impulso con frequenze di campionamento fino a 51,2 kHz, in questo
studio si è utilizzata la frequenza di 25,6 kHz in modo da poter utilizzare sequenze
di lunghezza sufficiente dal momento che nelle chiese i tempi di riverberazione
sono, in genere, molto lunghi.
In un primo tempo la stessa strumentazione appena descritta, unitamente ai
due microfoni omnidirezionali da ¼” che compongono la sonda intensimetrica
GRAS I-01, è stata utilizzata per acquisire le risposte binaurali in due delle 9
chiese analizzate. Successivamente è stato possibile utilizzare una coppia di
microfoni binaurali Core Sound collegati ad un registratore DAT Sony TCD-10
con frequenza di campionamento di 44,1 kHz. Questi ultimi sono stati utilizzati
per la registrazione delle risposte dell’ambiente ad uno sweep sinusoidale
logaritmico.
La generazione dei segnali, nonché le routines per la deconvoluzione delle
risposte dell’ambiente sono state realizzate utilizzando il codice MATLAB®.
Infine, allo scopo di confrontare le risposte monoaurali ottenibili con le due
tecniche, in due delle chiese analizzate sono state acquisite, con il sistema
Symphonie e il microfono GRAS 40AR, le risposte monouarali a partire dallo
stesso sweep logaritmico usato per l’acquisizione delle risposte binaurali.
Lo sweep utilizzato in tutte le misure ha una durata di 6 s ed è seguito da
una pausa di 5,88 s, in tal modo lo stimolo, campionato a 44,1 kHz ha una
lunghezza di 219 = 524.288 campioni.
40 Capitolo 3

3.4 Prescrizioni della ISO 3382

Tutte le misure eseguite sono state condotte nel rispetto della norma ISO
3382 [49]. In particolare le postazioni di misura sono state poste ad 1,2 m dal
pavimento e scelte in modo da essere distanti almeno 1 m dalle pareti e 2 m l’una
dall’altra. La loro distribuzione negli ambienti è stata scelta in modo da ottenere
una copertura per quanto possibile uniforme e, al tempo stesso, in grado di
includere volumi eventualmente acusticamente “disaccoppiati”, come transetti,
coro, ecc. In media sono stati considerati 9 punti di rilevazione con un minimo di
6 ed un massimo di 13; per ambienti di grandi dimensioni sufficientemente
simmetrici i punti di rilevazione sono stati localizzati in una sola metà di esso.
Sono state utilizzate un minimo di 2 posizioni per la sorgente, posta comunque ad
una altezza di 1,5 m, in modo da considerare posizioni tipiche delle sorgenti
sonore: altare, coro, organo.
Il calcolo dei parametri acustici è stato condotto in accordo con le
formulazioni illustrate nel capitolo precedente e seguendo le specifiche riportate
negli allegati A e B della predetta norma ISO.
In particolare, per quanto riguarda il calcolo dell’indice di intensità sonora
G, non essendo possibile eseguire la misura dei livelli di riferimento in camera
anecoica, è stata utilizzata la relazione
L pE ,10 = L pE + 10 log( A S 0 ) − 37 [dB], (3.7)
che consente il calcolo di G a partire dal livello medio misurato in camera
riverberante (LpE) a condizione che sia noto l’assorbimento equivalente A (m2)
della camera riverberante utilizzata. Il termine adimensionalizzante S0 è stato
assunto pari a 1 m2.
Infine, per quanto riguarda le misure binaurali che, come detto, sono state
condotte utilizzando una coppia di microfoni binaurali, la normativa (Allegato B)
suggerisce di impiegare una testa artificiale a garanzia della comparabilità dei
dati. Va notato però che la stessa normativa accetta l’utilizzo di teste reali a
condizione che la grandezza X10 (v. Figura 3.4), pari alla somma della larghezza
della testa (X1) meno due volte la differenza fra la larghezza della testa (X2) e la
distanza fra parete occipitale e l’ingresso del canale auricolare (X5), sia compresa
in un intervallo tale da garantire che le misure ottenute con l’ausilio della testa
reale siano correlate con quelle ottenute con la testa artificiale con un coefficiente
di correlazione R almeno pari a 0,85. Poiché non si disponeva di una testa
artificiale, si è fatto riferimento a quanto riportato da Hidaka et al. [45], che
assumono come intervallo quello compreso fra 318 e 355 mm, pari alla
dimensione X10 di una testa Kemar ±10%. In questo studio i microfoni sono stati
indossati dall’autore per il quale la dimensione X10 è pari a 335 mm.

Figura 3.4 - Definizioni delle dimensioni relative a testa e torso artificiale. (da Rif. [45])
Capitolo 3 41

3.5 Confronto fra i risultati ottenuti con le diverse tecniche


di misura

3.5.1 Confronto fra misure omnidirezionali


In due diverse chiese (la Cattedrale di Ruvo e la Cattedrale di Bovino), è
stato possibile condurre le misure delle risposte all’impulso omnidirezionali
impiegando entrambe le tecniche a disposizione: tecnica MLS e sweep
sinusoidale. Analizzando visivamente alcune delle risposte all’impulso acquisite
(v. Figure 3.5 e 3.6) si può notare la sostanziale identità nella sequenza temporale
delle riflessioni.

Figura 3.5 – Confronto fra risposte all’impulso acquisite nel punto A_04 della cattedrale di
Bovino, con la tecnica MLS (sopra) e lo sweep sinusoidale (sotto). La finestra temporale
considerata è di 80 ms.

Figura 3.6 –Confronto fra risposte all’impulso acquisite nel punto A_03 della cattedrale di Ruvo,
con la tecnica MLS (sopra) e lo sweep sinusoidale (sotto). La finestra temporale considerata è di
80 ms.
42 Capitolo 3

Ciò è ulteriormente confermato dal confronto fra alcuni valori dei parametri
misurati. Se si considerano i valori medi di EDT e C80 misurati nella Cattedrale di
Bovino (v. Figura 3.7) si osserva una sostanziale coincidenza fra i valori; per
quanto riguarda la chiarezza piccole differenze (inferiori a 0,5 dB) possono essere
osservate alle alte frequenze. Analizzando l’andamento dei valori punto per punto
(v. Figura 3.8) si possono osservare differenze contenute, in genere non superiori
al 5% per l’EDT e ad 1 dB per la chiarezza. Poiché le differenze non sono
sistematiche, esse potrebbero spiegarsi considerando che le misure non sono state
eseguite contemporaneamente ma in successione (prima tutte quelle di un tipo e
poi le altre), per cui vi potrebbe essere stata una non perfetta collocazione dei
ricevitori abbinata ad eventuali elementi disturbanti le misure (persone, rumori).
4,5 0,0

4,0 -1,0

-2,0
3,5

C80 (dB)
EDT (s)

-3,0
3,0
-4,0

2,5
-5,0

2,0 -6,0
125 250 500 1000 2000 4000 125 250 500 1000 2000 4000
Frequenze (Hz) Frequenze (Hz)
Media Omni MLS Media Omni Sw eep Media Omni MLS Media Omni Sw eep

Figura 3.7 - Confronto fra valori medi di EDT (sinistra) e C80 (destra) misurati nella Cattedrale di
Bovino.

3,8 0,0

3,7 -1,0

3,6 -2,0
C80@1kHz (dB)
EDT@1kHz (s)

3,5 -3,0

3,4 -4,0

3,3 -5,0

3,2 -6,0

3,1 -7,0

3,0 -8,0
A_01 A_02 A_03 A_04 A_05 A_06 A_07 A_08 A_09 A_01 A_02 A_03 A_04 A_05 A_06 A_07 A_08 A_09
Frequenze (Hz) Frequenze (Hz)
Omni MLS Omni Sw eep Omni MLS Omni Sw eep

Figura 3.8 - Confronto fra valori puntuali di EDT (sinistra) e C80 (destra) a 1 kHz, misurati nella
Cattedrale di Bovino.
Se si prendono in considerazione i valori relativi alla Cattedrale di Ruvo,
analoghe considerazioni possono essere tratte. In particolare i valori medi (v.
Figura 3.9) risultano ancora una volta in buon accordo fra loro, con differenze
scarsamente significative. Per quanto riguarda i valori puntuali (v. Figure 3.10,
3.11 e 3.12) è possibile notare una maggiore disparità alle alte che alle basse
frequenze dove in molti casi i valori sono esattamente coincidenti. Per l’EDT le
differenze superano spesso il 5%, mentre per la chiarezza raramente le differenze
superano 1 dB. In questo caso, oltre alle motivazioni date nel caso precedente, le
piccole variazioni potrebbero essere dovute al fatto che durante la sessione di
misura con lo sweep sono state eseguite in contemporanea sia le misure
monoaurali che quelle binaurali, per cui la presenza ravvicinata di un soggetto
vicino al microfono omnidirezionale potrebbe aver schermato o smorzato le
frequenze medio-alte, mentre non ha influenzato affatto le frequenze più basse.
Capitolo 3 43

4,5 0,0

-1,0
4,0
-2,0
3,5

C80 (dB)
-3,0
EDT (s)
3,0 -4,0

-5,0
2,5
-6,0

2,0 -7,0
125 250 500 1000 2000 4000 125 250 500 1000 2000 4000
Frequenze (Hz) Frequenze (Hz)
Media Omni MLS Media Omni Sw eep Media Omni MLS Media Omni Sw eep

Figura 3.9 - Confronto fra valori medi di EDT (sinistra) e C80 (destra) misurati nella Cattedrale di
Ruvo.

5,4 0,0

-2,0
4,9
-4,0

C80 (dB)
EDT (s)

4,4 -6,0

-8,0
3,9
-10,0

3,4 -12,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Frequenze (Hz) Frequenze (Hz)
MLS@250Hz Sw eep@250Hz MLS@250Hz Sw eep@250Hz

Figura 3.10 - Confronto fra valori puntuali di EDT (sinistra) e C80 (destra) a 250 Hz, misurati nella
Cattedrale di Ruvo.

4,2 2,0

4,0 0,0

3,8 -2,0
C80 (dB)
EDT (s)

3,6 -4,0

3,4 -6,0

3,2 -8,0

3,0 -10,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

Frequenze (Hz) Frequenze (Hz)


MLS@1kHz Sw eep@1kHz MLS@1kHz Sw eep@1kHz

Figura 3.11 - Confronto fra valori puntuali di EDT (sinistra) e C80 (destra) a 1 kHz, misurati nella
Cattedrale di Ruvo.

2,8 6,0
2,7 4,0
2,6
2,0
2,5
C80 (dB)

0,0
EDT (s)

2,4
-2,0
2,3
-4,0
2,2

2,1 -6,0

2,0 -8,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

Frequenze (Hz) Frequenze (Hz)


MLS@4kHz Sw eep@4kHz MLS@4kHz Sw eep@4kHz

Figura 3.12 - Confronto fra valori puntuali di EDT (sinistra) e C80 (destra) a 4 kHz, misurati nella
Cattedrale di Ruvo.
44 Capitolo 3

3.5.2 Confronto fra misure binaurali


Nella Cattedrale di Bovino sono state condotte due campagne di misura a
distanza di alcuni mesi. Nella prima le misure binaurali sono state eseguite
utilizzando una sonda intensimetrica, con microfoni da ¼”, considerando solo i
punti posti in una metà della chiesa e utilizzando la tecnica MLS. Nella seconda
tornata le misure sono state condotte utilizzando i microfoni binaurali Core
Sound, collegati al registratore DAT, sono stati presi in considerazione tutti i punti
e la tecnica adoperata è stata quella dello sweep1. Pertanto numerosi confronti
possono essere fatti. In questo paragrafo verranno presi in considerazione solo i
dati relativi alle misure binaurali con riferimento ai soli punti in cui entrambe le
misure erano disponibili.
Analizzando dapprima l’andamento dei parametri monoaurali, ottenuti
mediando fra loro le risposte binaurali, (v. Figura 3.13) è possibile riscontrare che
i valori medi di EDT misurati con lo sweep appaiono sistematicamente maggiori
(di circa 0,2 s) rispetto a quelli misurati con l’MLS; analogamente, i valori di C80
misurati con lo sweep appaiono sistematicamente inferiori agli altri. Tali
differenze, proprio perché sistematiche, sembrano essere difficilmente imputabili
ai due tipi di microfoni, quanto, piuttosto, a diverse condizioni in cui le misure
sono state condotte. Ciò sembrerebbe confermato dall’andamento dei valori medi
di EDT misurati con il microfono omnidirezionale nello stesso giorno in cui sono
state condotte le misure binaurali con l’MLS: come si vede, ad eccezione delle
basse frequenze, vi è un sostanziale accordo fra i valori. A conferma di ciò, anche
il tempo di riverberazione mostra un analogo comportamento. L’analisi dei valori
puntuali di EDT e C80, misurati a 1 kHz (v. Figura 3.14), mostra un sostanziale
accordo nell’andamento dei valori, pur rilevando, anche in questo caso, una
differenza sistematica (seppur meno evidente) fra i due gruppi di valori.
Per l’analisi dei parametri binaurali si sono scelti sia IACCE che IADE. Il
confronto fra i valori medi di IACC (v. Figura 3.15) mostra differenze
relativamente modeste (inferiori a 0,05) sui valori in bande di ottava, mentre sul
valore a banda larga le differenze sono più significative. Il confronto dei valori
puntuali mostra differenze in genere accettabili (sempre inferiori a 0,05), anche se
in un punto la differenza è pari a 0,20, con il valore misurato con i microfoni
binaurali che appare alquanto più accettabile di quello ottenuto con la sonda
intensimetrica. L’osservazione dei valori di IAD (v. Figura 3.16) conferma un
buon accordo fra i valori medi delle misure (anche se a 125 Hz si riscontra una
differenza notevole). A livello puntuale, pur avendosi un andamento piuttosto
simile si riscontrano in alcuni punti differenze superiori al 10% (assoluto).
In conclusione, tenendo conto delle variazioni nelle condizioni al contorno
che possono essere intervenute fra una campagna di misura e l’altra, includendo in
ciò le inevitabili imprecisioni nella collocazione delle sorgenti e dei ricevitori nei
medesimi punti, e tenendo poi conto che, per migliorare il rapporto S/R le misure
con l’MLS sono state ottenute con una media sincrona calcolata su 64 sequenze
(durata pertanto piuttosto a lungo con conseguente rischio di distorsioni dovute
alla varianza temporale del sistema), non risulta possibile ascrivere le differenze
riscontrate al solo uso di due catene di misura diverse. Del resto l’analisi visiva
delle risposte all’impulso acquisite nello stesso punto con le due catene di misura,

1
Nel seguito si farà riferimento alle misure indicando solo la tecnica, sottintendendo che nelle
misure fatte con la tecnica MLS è stata usata la sonda intensimetrica, mentre nelle misure fatte
con lo sweep sono stati usati i microfoni Core Sound.
Capitolo 3 45

4,5 0,0
125 250 500 1000 2000 4000
-1,0
4,0
-2,0
3,5 -3,0
EDT (s)

C80 (dB)
3,0 -4,0

-5,0
2,5
-6,0

2,0 -7,0
125 250 500 1000 2000 4000
-8,0
Frequenze (Hz)
Frequenze (Hz)
Media Bin-MLS Media Bin-Sw eep
Media Omni-MLS Media Bin-MLS Media Bin-Sw eep

Figura 3.13 - Confronto fra i valori medi di EDT (sinistra) e C80 (destra) misurati adoperando due
diversi microfoni binaurali. Per l’EDT sono riportati come riferimento anche i valori misurati,
nelle stesse condizioni, con il microfono omnidirezionale.

0,0
4,4
-1,0
4,2
-2,0
4,0
-3,0
EDT@1kHz

C80@1kHz
3,8
-4,0
3,6 -5,0
3,4 -6,0
3,2 -7,0
3,0 -8,0
A_02

A_04

A_05

A_06

B_02

B_04

B_05

B_06

A_02

A_04

A_05

A_06

B_02

B_04

B_05

B_06
Frequenze (Hz) Frequenze (Hz)
MLS Sw eep MLS Sw eep

Figura 3.14 - Confronto fra i valori puntuali di EDT (sinistra) e C80 (destra) misurati a 1 kHz
adoperando due diversi microfoni binaurali.

0,50 0,50
0,45 0,45
0,40 0,40
0,35 0,35
IACCe@1kHz

0,30 0,30
IACC

0,25 0,25
0,20 0,20

0,15 0,15
0,10
0,10
0,05
0,05
0,00
0,00
A_02

A_04

A_05

A_06

B_02

B_04

B_05

B_06

WB 500 1000 2000 4000 IACCe3


Frequenze (Hz) Frequenze (Hz)
Media MLS Media Sw eep MLS Sw eep

Figura 3.15 - Confronto fra valori di IACCE medi (sinistra) e puntuali (destra) misurati con due
diversi microfoni binaurali.

70 60

60 50
50
40
IADe@1kHz

40
IADe

30
30
20
20
10
10
0
0
A_02

A_04

A_05

A_06

B_02

B_04

B_05

B_06

125 250 500 1000 2000 4000


Frequenze (Hz) Frequenze (Hz)
Media MLS Media Sw eep MLS Sw eep

Figura 3.16 - Confronto fra valori di IADE medi (sinistra) e puntuali (destra) misurati con due
diversi microfoni binaurali.
46 Capitolo 3

Figura 3.17 - Confronto fra risposte all'impulso binaurali acquisite nello stesso punto (B_02) nella
Cattedrale di Bovino, utilizzando la tecnica MLS (sopra) e lo sweep (sotto). La finestra temporale
considerata è di 80 ms.
mostra (v. Figura 3.17) una sostanziale corrispondenza fra le due strutture
temporali delle riflessioni, anche se la riflessione che si ha intorno ai 35 ms non
appare molto visibile nella risposta acquisita con lo sweep.

3.5.3 Confronto fra misure monoaurali e misure binaurali


Il confronto fra i risultati delle misure monoaurali e quelli delle misure
binaurali può essere fatto sulla scorta di un’ampia base di dati rappresentata dalle
otto chiese in cui il secondo tipo di misura è stato condotto. La finalità di tale
confronto è quello di comprendere se l’utilizzo della risposta all’impulso, ottenuta
mediando i due canali di una risposta binaurale, per la determinazione dei
parametri acustici monoaurali è giustificata o meno. È stato mostrato [38] che
differenze significative possono verificarsi soprattutto per i valori della chiarezza.
In questo caso, disponendo di numerosi dati, sono stati presi in considerazione i
valori medi relativi alle sei bande di ottava di T20, EDT e C80, calcolati a partire
dalle risposte all’impulso omnidirezionali e da quelle binaurali. È stato quindi
Capitolo 3 47

calcolato il rapporto (o la differenza, nel caso della chiarezza) fra valori derivati
dalle misure binaurali e quelli derivati dalle misure omnidirezionali, e di questi
sono stati calcolati le medie, i valori minimi, massimi e la deviazione standard. I
risultati sono riportati in Figura 3.18.
L’analisi della Figura 3.18,a mostra che per il T20 le differenze alle diverse
frequenze ricadono in un intervallo di ±5% e quindi i valori ottenuti dalle misure
binaurali possono essere correttamente impiegati per il calcolo di questo
parametro. Per l’EDT (v. Figura 3.18b) la situazione è anche migliore, in quanto,
in media, i valori ottenuti con i due metodi coincidono, con errori maggiori (ma
comunque compresi nell’intervallo di ±5% ) solo alle basse frequenze. Per la
chiarezza (v. Figura 3.18c,d), invece, le differenze sono maggiori e non
trascurabili (si arriva fino a 2,5 dB fra i valori medi). In generale si riscontra che
l’uso delle risposte binaurali porta ad una sovrastima crescente al crescere della
frequenza. Questo comportamento potrebbe essere spiegato considerando che per
ottenere una risposta all’impulso monoaurale i due canali di quella binaurale
vengono mediati in termini di pressione e non di energia, tenendo perciò conto
della fase. Ciò potrebbe portare le prime riflessioni, che sono in fase, ad avere un
peso maggiore rispetto al campo diffuso e riverberante, che è invece scorrelato.
Tuttavia, una tale affermazione richiede un approfondimento che esula dagli scopi
di questo lavoro.

1,10 1,10

1,05 1,05
EDTbin/EDTomni
T20bin/T20omni

1,00 1,00

0,95 0,95

0,90 0,90

0,85 0,85

0,80 0,80
125 250 500 1000 2000 4000 125 250 500 1000 2000 4000
Frequenze (Hz) Frequenze (Hz)

a) Media Min Max b) Media Min Max

2,50 2,50
2,00 2,00
1,50 1,50
C80bin-C80omni

C80bin-C80omni

1,00 1,00
0,50 0,50
0,00 0,00
-0,50 -0,50
-1,00 -1,00
-1,50 -1,50
125 250 500 1000 2000 4000 125 250 500 1000 2000 4000
Frequenze (Hz) Frequenze (Hz)
1 2 3 4
c) Media Min Max d) 5 6 7 8

Figura 3.18 - Rapporti medi fra valori medi di misure binaurali e monoaurali relative ad 8 chiese
analizzate, con indicazione dei valori minimi, massimi e della deviazione standard. a) T20; b) EDT;
c) C80; d) C80 insieme dei rapporti medi per le chiese analizzate: 1-Ognissanti (Valenzano), 2-
Cattedrale di Ruvo, 3-Cattedrale di Bovino, 4-Cattedrale di Bisceglie, 5-Cattedrale di Bitonto, 6-
Cattedrale di Barletta, 7-Cattedrale di Bari, 8-Basilica di S. Nicola (Bari).
48 Capitolo 3

In conclusione si può affermare che nel calcolo di parametri monoaurali per


i quali la direzionalità svolge un ruolo importante, l’adozione della risposta
all’impulso ottenuta come media dei due canali di una risposta binaurale non porta
agli stessi risultati ottenibili con un microfono omnidirezionale, pertanto i
parametri eventualmente calcolati in tal modo vanno trattati con estrema cautela.
Al contrario, i tempi di riverberazione possono essere tranquillamente utilizzati.
Capitolo 4

Ricerca bibliografica sull’acustica delle


chiese

In questo capitolo saranno analizzati i principali studi presenti in


letteratura dedicati alle caratteristiche acustiche degli edifici per il
culto. I primi di essi riportano esclusivamente misure del tempo di
riverberazione. Altri, più recenti, includono anche considerazioni
sull’intelligibilità del parlato e riportano misure dello STI (o del
RASTI). Gli ultimi studi, ancora embrionali e parziali, riportano rilievi
completi dei principali parametri acustici oggi misurabili.

4.1 Studi dedicati a singole chiese

4.1.1 Lo studio di Raes e Sacerdote

Raes e Sacerdote [65] condussero nel 1953 un rilievo delle proprietà


acustiche di due Basiliche romane: San Giovanni in Laterano e San Paolo fuori le
Mura. Le finalità dello studio riportate nell’introduzione1 trovano in realtà ben
poco spazio nella discussione dei risultati. Tuttavia, il lavoro presenta spunti
interessanti rappresentati anche dall’analisi (puramente visiva e qualitativa) delle
risposte all’impulso acquisite in alcuni punti mediante l’oscilloscopio a raggi
catodici. I tempi di riverberazione sono stati determinati utilizzando rumore
bianco filtrato in bande di 1/6 di ottava e registrato con un registratore ad alta
velocità. Le frequenze per cui sono riportati i tempi di riverberazione non sono,
purtroppo, quelle normalizzate.
Le Basiliche di San Giovanni e San Paolo hanno struttura e dimensioni
confrontabili, entrambe hanno cinque navate, con soffitto piano in legno, transetto
e coro; il pavimento, le pareti e le colonne sono in marmo. Le differenze maggiori
sono dovute al fatto che la Basilica di San Giovanni ha numerose cappelle che si
aprono sulle navate laterali. Va ricordato, inoltre, che nel ‘600 essa fu oggetto di

1
Queste erano: testare l’applicazione delle formule classiche per il tempo di riverberazione in
ambienti molto grandi; conoscere le proprietà acustiche delle chiese in esame finalizzata alla
definizione di indicazioni progettuali per le nuove chiese; studiare i problemi di diffusione nei
grandi ambienti e, infine, confrontare le misure tradizionali e le misure impulsive, la
localizzazione di echi e lo studio degli impulsi nei grandi ambienti.
50 Capitolo 4

un’opera di ammodernamento da parte del Borromini che sull’originario impianto


paleocristiano applicò forme e decorazioni barocche con l’aggiunta di numerose
sculture e nicchie.
Lo studio riporta i risultati di quattro misure eseguite nella Basilica di San
Giovanni in Laterano; tre di esse con la sorgente sonora posta entro la navata
principale ed una con la sorgente posta nella navata laterale. I tempi di
riverberazione ottenuti (v. Tabella 4.1) appaiono piuttosto brevi se si considera il
volume della chiesa (gli autori riportano 4.550.000 piedi cubici cioè circa 129.000
m3) e che la chiesa è priva di banchi e di materiali assorbenti. I tempi di
riverberazione misurati con sorgente e ricevitore nella navata laterale appaiono
più bassi di quelli misurati nella navata centrale. Da ciò e dall’osservazione del
decadimento sonoro nello stesso punto, gli autori concludono che le navate laterali
si comportano acusticamente come se fossero volumi solo parzialmente accoppiati
e non come se fossero parte integrante del volume della chiesa. Nel paragrafo
successivo si vedrà come l’accoppiamento acustico potrebbe spiegare anche il
valore relativamente basso dei tempi di riverberazione osservati in questa chiesa.
Della Basilica di San Paolo fuori le Mura sono riportati i risultati di altre
quattro misure, questa volta però con la sorgente sonora posta in un solo punto
della navata centrale e quattro diversi punti di ricezione, due nella navata centrale
e due nell’adiacente navata laterale. I valori dei tempi di riverberazione (v.
Tabella 4.2) appaiono maggiori che nel caso precedente ma, secondo gli autori,
sempre inferiori ai valori attesi per volumi di questa entità. Inoltre, le navate
laterali risultano più riverberanti della navata centrale. Gli autori non riscontrano,
in questo caso, fenomeni di accoppiamento acustico parziale dei volumi,
sottolineando altresì la maggiore uniformità e regolarità dei decadimenti sonori.
Se si confrontano i risultati delle due chiese si osserva che i tempi misurati
in San Paolo sono considerevolmente maggiori di quelli riscontrati in San
Giovanni a fronte di un volume solo di poco superiore (gli autori riportano
5.400.000 piedi cubici, cioè circa 153.000 m3). Questa differenza viene ascritta
dagli autori, anche per le frequenze medie e basse, al diverso comportamento
dello stesso materiale (il marmo) allorché esso sia più o meno decorato. Essi
infatti scrivono:

Tabella 4.1 – Tempi di riverberazione (s) misurati nella Basilica di S. Giovanni in Laterano
Frequenze (Hz)
S_R 100 200 400 800 1600 3200
A_a 6,3 6,3 6,0 5,3 4,8 4,0
A_b 6,3 - 6,2 5,2 4,8 4,0
A_c 7,7 - 6,4 5,4 5,1 3,2
B_c 6,3 - 6,2 4,5 3,7 2,7
Media 6,7 6,3 6,2 5,1 4,6 3,5
Tabella 4.2 – Tempi di riverberazione (s) misurati nella Basilica di S. Paolo fuori le Mura
Frequenze (Hz)
S_R 100 200 400 800 1600 3200
A_a 10,0 9,5 7,0 7,3 7,0 8,0
A_b 10,0 10,5 8,5 7,5 7,0 9,0
A_c 10,8 13,5 10,2 9,4 8,3 7,0
A_d 12,0 11,7 10,0 10,5 8,0 8,5
Media 10,7 11,3 8,9 8,7 7,6 8,1
Media Nav 10,0 10,0 7,8 7,4 7,0 8,5
Capitolo 4 51

secondo le teorie classiche, statue ed altri ornamenti fatti in marmo


levigato, per i quali l’impedenza acustica è praticamente infinita, non
dovrebbero avere alcuna influenza sul tempo di riverberazione alle
basse e medie frequenze. Questo è in disaccordo con in nostri
risultati.
E successivamente propongono l’adozione di un coefficiente di assorbimento
maggiorato (pari a 0,13 per il marmo a 400 Hz) che tenga conto della presenza
delle decorazioni. Nel paragrafo successivo si darà conto di una diversa
interpretazione di questo comportamento.

4.1.2 Lo studio di Shankland e Shankland


Lo studio dei due ricercatori americani [73] è focalizzato sulla Basilica di S.
Pietro a Roma, ma riporta anche misure fatte nelle Basiliche di San Giovanni in
Laterano, Santa Maria Maggiore e San Paolo fuori le Mura. La misura dei tempi
di riverberazione è stata condotta adoperando uno speciale tipo di organo a canne
che consente di eseguire misure per frequenze singole variabili fra 200 e 6000 Hz.
Gli autori confrontano questi risultati con quelli ottenuti adoperando forti rumori
impulsivi (prodotti accidentalmente durante lavori nella chiesa), concludendo che
l’uso dell’organo porta a risultati lievemente sottostimati, con un massimo di 0,5 s
di differenza. Altre misure sono state poi eseguite adoperando un registratore a
nastro ed, in alcuni casi, “ad orecchio” utilizzando un cronometro. Tale scelta
appare piuttosto criticabile, anche se gli autori forniscono confronti con valori
misurati più rigorosamente, confermando che quando i tempi di riverberazione
sono molto lunghi l’accordo è molto buono.
La tesi principale sostenuta dagli autori è che il tempo di riverberazione,
relativamente basso se confrontato con il volume degli ambienti in esame, può
essere spiegato ipotizzando un accoppiamento acustico parziale dei diversi volumi
che compongono le chiese, in particolare di quelli che sono separati da aperture
non molto grandi. In tal modo il suono che dalla navata principale entra in tali
volumi secondari ritorna nel volume principale solo dopo essere stato
considerevolmente attenuato e ritardato per effetto delle riflessioni multiple.
La Basilica di San Pietro, con una lunghezza di 180 m ed una larghezza
della sola navata di 25 m ed un volume di circa 560.000 m3, è la più grande chiesa
del mondo. Gli autori propongono di analizzarla acusticamente considerando
cinque volumi accoppiati fra loro: la rotonda centrale con la cupola; la navata
principale; le due braccia del transetto; l’abside. Le misure fatte a chiesa vuota
sono riportate nella Figura 4.1 e mostrano che, per varie combinazioni di sorgenti
e ricevitori posti nella navata principale, il tempo di riverberazione non subisce
variazioni significative e si attesta, alle medie frequenze, intorno ai 7 s.
Considerando quindi la navata come volume autonomo e calcolando
l’assorbimento sonoro dovuto alle superfici e agli arredi presenti essi concludono
che tale assorbimento è troppo esiguo se confrontato con quello che sarebbe
necessario per ottenere un tempo di riverberazione uguale a quello misurato.
Analoghe considerazioni sono poi condotte con riferimento all’abside.
La conclusione a cui gli autori giungono è quella di considerare, in virtù
dell’accoppiamento acustico esistente, le aperture verso la rotonda e le aperture
verso le navate laterali come superfici assorbenti aventi un loro coefficiente di
assorbimento. Tale coefficiente viene da loro calcolato sulla base delle misure
52 Capitolo 4

Figura 4.1 - Tempi di riverberazione in funzione della frequenza. Tutte le misure sono riferite alle
chiese non occupate. (Fig. tratta dal Rif. [73]).
condotte nella navata e nell’abside ed è pari a 0,67 per le aperture sulla rotonda e a
0,56 per le aperture verso le navate laterali. Ciò concorda, secondo gli autori, col
fatto che è meno probabile che il suono ritorni nel volume di origine quando entra
nella rotonda piuttosto che quando entra nelle navate laterali.
Le misure condotte dagli autori nella Basilica di San Giovanni in Laterano
sono difficilmente confrontabili con quelle riportate nel paragrafo precedente
poiché le frequenze a cui le misure si riferiscono sono diverse e, soprattutto,
perché le misure sono state condotte a distanza di svariati anni l’una dall’altra. In
ogni caso un dato è significativo: in entrambi i lavori è posta in evidenza una
differenza (di circa 1 s) fra i tempi di riverberazione misurati quando sorgente e
ricevitore sono entrambi nella navata principale e quando sono entrambi in una
delle navate laterali. Per giustificare il basso tempo di riverberazione, in rapporto
al volume, gli autori adottano lo stesso modello proposto per San Pietro e,
utilizzando gli stessi valori dei coefficienti di assorbimento applicati alle aperture
laterali e all’arco trionfale aperto sul transetto, ottengono valori congruenti con
quelli misurati.
La Basilica di Santa Maria Maggiore presenta caratteristiche architettoniche
diverse rispetto a San Giovanni: vi è una sola navata laterale; l’abside è di
dimensioni più contenute ed il transetto è sostituito da due ampie cappelle, le cui
aperture possono essere considerate come ottimi assorbitori. Dalle misure
condotte il tempo di riverberazione nella navata è, alle medie frequenze, pari a 4,9
s, circa la metà di quello calcolato considerando navata principale e navate laterali
come unico volume. Considerando, invece, il solo volume della navata centrale e
considerando le aperture come assorbenti (con lo stesso coefficiente usato per San
Pietro), il tempo di riverberazione calcolato si riduce a 5 s, confermando così che
l’accoppiamento acustico fra navata centrale e laterali è analogo a quello
osservato nelle altre chiese.
Capitolo 4 53

La Basilica di San Paolo fuori le Mura costituisce in questo gruppo di chiese


una eccezione dal momento che il tempo di riverberazione al suo interno è
considerevolmente più lungo delle altre. Si è visto nel paragrafo precedente che
Raes e Sacerdote [65] non avevano riscontrato accoppiamento acustico fra le
navate laterali e quella centrale. Tale ipotesi viene inizialmente suffragata anche
nel lavoro in esame, dal momento che le pareti delle navate laterali sono lisce e
prive di cappelle o nicchie e, perciò, il suono dovrebbe più facilmente ritornare
nella navata centrale. Tuttavia, il calcolo del tempo di riverberazione prendendo in
considerazione l’intero volume della chiesa porta a valori più lunghi di quelli
misurati, suggerendo anche in questo caso l’esistenza di un accoppiamento
acustico. Il calcolo fatto considerando le aperture verso le navate laterali come
assorbenti conduce però a valori troppo bassi per cui gli autori concludono che
l’accoppiamento acustico fra i diversi volumi è, in questo caso, maggiore ed
eseguono un nuovo calcolo del coefficiente di assorbimento che risulta pari a
0,38.
La conferma della bontà del modello proposto è data, secondo gli autori, dal
diverso andamento dei tempi di riverberazione al variare della frequenza. Infatti,
mentre nelle prime tre basiliche i tempi di riverberazione alle basse frequenze
sono confrontabili con quelli alle medie, in San Paolo questi appaiono più elevati.
Ciò sarebbe dovuto al fatto che l’assorbimento acustico dovuto alle aperture è
maggiore alle basse frequenze per effetto della diffrazione, pertanto il maggiore
accoppiamento fra le navate della Basilica di San Paolo renderebbe le aperture
meno efficienti nell’assorbire le basse frequenze, determinando l’andamento
osservato.
In conclusione gli autori sottolineano, oltre all’effetto indotto
dall’accoppiamento acustico dei volumi, l’importanza della diffusione che
previene gli echi e, incrementando il numero di riflessioni multiple, aumenta
l’assorbimento sonoro.

4.1.3 Lo studio di Lewers e Anderson


Lo studio di Lewers e Anderson [54] sulla Cattedrale di San Paolo a Londra
è il primo, fra quelli dedicati alle chiese, che include considerazioni in merito
all’intelligibilità del parlato, oltre a presentare misure dei tempi di riverberazione
ottenute con tre diversi metodi.
Le cattedrale è lunga 141 m e larga 69 m al transetto; la navata centrale è
alta 28 m e larga 38 m (includendo le navate laterali); al centro la cupola, larga 34
m, raggiunge un’altezza di 66 m. Il volume interno è di 152.000 m3 e la superficie
in pianta è di 8.120 m2. La struttura principale è in pietra Portland che, testata nel
tubo ad onde stazionarie, risulta caratterizzata da un coefficiente di assorbimento
di circa 0,03 sotto i 2000 Hz. Le volte sono in mattoni intonacati o rivestiti di
mosaici. Il pavimento è in marmo. Il coro e l’organo sono in legno di quercia.
Normalmente la chiesa contiene 2.500 sedie distribuite fra transetto e navata.
I tre diversi metodi con cui le misure del tempo di riverberazione sono state
eseguite sono i seguenti:
- interruzione di rumore, filtrato in bande di terzi di ottava ed emesso da
sorgente amplificata. Le misure sono state condotte in 9 punti con la
sorgente posta nella crociera (v. Tabella 4.3);
- interruzione di rumore non filtrato e registrato su nastro magnetico,
elaborato successivamente al calcolatore. Tale misura è stata adottata
54 Capitolo 4

per ricavare il valore del tempo di riverberazione (in un solo punto) con
la chiesa occupata da circa 1800 persone;
- eccitazione dell’ambiente con un suono impulsivo filtrato in bande di
ottava (ottenuto accendendo e spegnendo la sorgente usata nel caso
precedente) ed integrazione col metodo di Schroeder [68]. In tal modo
gli autori hanno determinato anche il tempo di primo decadimento che
non è risultato molto diverso dal tempo di riverberazione (v. Tabella
4.3).
Tabella 4.3 – Valori dei tempi di riverberazione misurati nella Cattedrale di S. Paolo a Londra
Frequenze (Hz)
125 250 500 1000 2000 4000
RT 10,9 11,0 10,9 9,8 6,9 3,7
RT occup. 8,3 8,4 7,8 6,5 5,1 3,5
EDT - 10,7 9,7 8,6 4,8 4,5

Oltre al tempo di riverberazione gli autori hanno determinato anche la


distribuzione del livello di pressione sonora a chiesa vuota, osservando che al
disotto della cupola vi è un lieve rinforzo (dovuto probabilmente alla presenza di
superfici concave), mentre nella navata vi è una lieve diminuzione all’aumentare
della distanza dalla sorgente. Variazioni più significative si osservano alle alte
frequenze a causa dell’assorbimento dell’aria.
Per valutare l’intelligibilità del parlato gli autori hanno condotto dei test di
articolazione utilizzando un campione di 30 soggetti dislocati in vari punti
dell’ambiente e due diversi lettori. Questi ultimi, uno esperto e l’altro no, hanno
letto una serie di monosillabi inclusi in frasi da cui non fosse possibile risalire alla
parola dal contesto. L’intelligibilità del parlato, valutata con l’impianto di
amplificazione sia acceso che spento, è stata poi valutata sulla base della
percentuale di consonanti perse. Questa risulta in genere piuttosto alta (fino ad un
massimo dell’80% nella navata) in assenza di impianto di amplificazione, mentre
è accettabile (intorno al 30%) con l’ausilio dell’impianto, ma solo nella navata.
Sotto la cupola, infatti, i valori risultano essere ancora piuttosto elevati (in media
pari al 50%).
Nella discussione gli autori sottolineano che il tempo di riverberazione
misurato, pur essendo alto, non è eccessivo se rapportato al volume. In proposito
suggeriscono un confronto con la Basilica di S. Paolo fuori le Mura a Roma [65]
che possiede un volume simile e tempi dello stesso ordine di grandezza, vedendo
in ciò una conferma dell’importanza dell’effetto del volume sulla riverberazione.
Sempre dal confronto con la Basilica romana e con i valori riportati da Fearn [39]
gli autori concludono che il tempo di riverberazione alle alte frequenze è più basso
di quello che ci si potrebbe attendere e cercano la causa nell’assorbimento
dell’aria (che per la presenza della cupola potrebbe essere maggiore) e nell’effetto
della diffusione dovuta alla presenza di rilievi superficiali. Tuttavia a questo
riguardo si riscontra poca chiarezza poiché prima si dice (erroneamente):
un altro importante fattore che probabilmente previene la formazione
di un campo diffuso è la presenza di oggetti in grado di “diffondere”1
piuttosto che riflettere il suono.

1 Qui e nel seguito si userà “diffondere” fra virgolette per riferirsi al termine inglese scatter usato
dagli autori in riferimento alle proprietà di una superficie, mentre in assenza di virgolette ci si
riferirà al termine diffuse da loro usato con riferimento al campo sonoro.
Capitolo 4 55

E a riguardo viene citato il caso di S. Giovanni in Laterano dove tutte le superfici,


a parte il pavimento, sono pesantemente decorate, ed infatti essi affermano:
in questa chiesa è probabile la presenza di una grande “diffusione”
che risulta in un tempo di riverberazione ridotto. In S. Paolo a Londra
la “diffusione” potrebbe essere la causa del basso tempo di
riverberazione alle alte frequenze, però ci sono molte superfici ampie,
spesso curvate, dove sono probabili le riflessioni speculari che
generano un campo diffuso.
È evidente che l’equivoco in cui cadono gli autori è dovuto al fatto che la presenza
di rilievi superficiali o di oggetti non ostacola la formazione del campo diffuso
ma, anzi, la favorisce. Semmai sono le superfici ampie e concave che determinano
una diffusione insufficiente del campo sonoro.
Tuttavia il ricorso alla diffusione non risulta essere una motivazione
convincente per un problema che può attribuirsi con una certa tranquillità
all’assorbimento dell’aria dovuto al volume molto grande della chiesa.
In una recente pubblicazione [2] Anderson e Bratos-Anderson sono ritornati
sull’argomento, proponendo una rilettura del comportamento acustico rilevato
nella Cattedrale di San Paolo in termini di accoppiamento acustico non perfetto.
In particolare l’elevato assorbimento presente nell’area del coro determina una
doppia pendenza nelle curve di decadimento sonoro acquisite, quando sia la
sorgente sia il ricevitore sono posti in quella parte della chiesa. Il nucleo del
lavoro è costituito dalla applicazione delle equazioni di bilancio della densità di
energia ai 70 volumi in cui essi scompongono la chiesa e nella verifica che le
curve di decadimento, ottenute risolvendo il sistema che ne consegue, siano
confrontabili con quelle misurate sperimentalmente. La conclusione a cui essi
giungono è interessante e contiene, implicitamente, un’evidente correzione delle
idee sulla diffusione esposte nel primo lavoro:
malgrado tutte le sue limitazioni il modello dei sotto-spazi accoppiati
può essere utilmente applicato ad ambienti caratterizzati da campi
sonori altamente diffusi come la Cattedrale di San Paolo.

4.2 Studi a grande scala

4.2.1 Lo studio di Fearn sulle chiese spagnole, inglesi e francesi


Lo studio di Fearn [39] risale al 1975 e costituisce il primo esempio di
analisi ad ampio raggio delle caratteristiche acustiche delle chiese. L’autore
propone i risultati di un’ampia campagna di misure condotta utilizzando la
registrazione su nastro magnetico di impulsi generati mediante lo scoppio di
palloni. Il solo parametro acustico preso in considerazione è il tempo di
riverberazione misurato in bande di ottava da 125 a 8000 Hz.
Il gruppo di misure più significativo riguarda le chiese inglesi e catalane i
cui valori medi dei tempi di riverberazione sono riportati in Figura 4.2.
Si nota immediatamente che le chiese catalane sono caratterizzate da una
riverberazione molto più accentuata delle chiese inglesi. Secondo l’autore ciò non
è imputabile solo alle differenti liturgie poiché molte delle chiese inglesi
56 Capitolo 4

Figura 4.2 – Tempi di riverberazione di 19 chiese parrocchiali catalane (– –z– –) e 27 chiese


parrocchiali inglesi (— × —). (Fig. tratta dal Rif. [39])
analizzate sono antecedenti al periodo della Riforma e pertanto Cattoliche in
origine. Solo una piccola parte di tale differenza può altresì essere imputato al
diverso volume poiché la quasi totalità delle chiese ha un volume inferiore ai
15.000 m3. L’autore attribuisce tale differenza alla maggiore presenza di superfici
vetrate nelle chiese inglesi, mentre quelle spagnole ne sono quasi prive, essendo
realizzate con strutture estremamente massicce necessarie per supportare le ampie
volte che coprivano le navate uniche, tipiche delle chiese catalane.
In termini pratici l’autore conclude che, mentre le chiese inglesi si prestano
abbastanza bene sia per la musica sia per il parlato, quelle catalane, con il loro
lungo tempo di riverberazione, presentano seri problemi di intelligibilità del
parlato, alle volte anche in presenza di impianto di amplificazione. Pertanto in
alcune di esse le celebrazioni, dopo il Concilio Vaticano II, sono state spostate in
cappelle laterali con inevitabili restrizioni per le dimensioni dell’assemblea.
Infine l’autore presenta i tempi di riverberazione misurati in altre chiese
francesi ed inglesi (cattoliche e non conformiste), osservando che le chiese
cattoliche presentano tempi di riverberazione lievemente superiori rispetto a
quelle anglicane che, a loro volta, hanno tempi più lunghi rispetto a quelle
riformate.

4.2.2 Lo studio sulle chiese svizzere


Desarnaulds et al. hanno presentato nel 1998 un breve ma interessante
studio [31] sulle caratteristiche acustiche delle chiese svizzere. Un insieme di 150
chiese (in parte cattoliche ed in parte protestanti) è stato preso in considerazione e
per ciascuna di esse sono stati misurati i tempi di riverberazione a sala vuota e
calcolati quelli a sala piena. Sono stati poi calcolati i volumi e il rapporto
volume/persona. Inoltre, per alcune di esse è stato determinato l’indice di
intelligibilità del parlato (RASTI). Le chiese sono state suddivise per periodo
storico di costruzione in modo da permettere una analisi dell’evoluzione delle
caratteristiche acustiche di tali edifici.
La prima osservazione svolta dagli autori (v. Tabella 4.4) riguarda le
differenze fra chiese cattoliche e chiese protestanti (riformate), laddove le prime
risultano sempre più riverberanti delle seconde sottolineando la maggiore
importanza data alla comprensione della parola dalla Riforma luterana. In secondo
luogo l’altro aspetto interessante è la considerevole differenza che sussiste fra
Capitolo 4 57

chiese vuote e chiese occupate, enfatizzando un problema particolarmente attuale:


la scarsa affluenza di fedeli alle celebrazioni fa sì che le condizioni acustiche
siano, oggi, peggiori di quanto lo fossero (o apparissero) in origine.
L’analisi dell’evoluzione storica è ricca di spunti di riflessione. Si osserva,
infatti, che le chiese romaniche e gotiche hanno i più lunghi tempi di
riverberazione, confermando che l’acustica supporta più un “senso del sacro” che
una buona comprensione del parlato. La minore differenza nei tempi a sala vuota
fra chiese cattoliche e riformate viene imputata al fatto che queste chiese sono
state costruite prima dell’avvento della riforma e, pertanto, sono state solo adattate
al rito protestante aumentando il numero di posti per l’assemblea (infatti la
Tabella 4.5 mostra la notevole differenza fra chiese cattoliche e protestanti in
termini di volume specifico).
L’inizio del periodo barocco corrisponde con la Riforma luterana, pertanto
le nuove chiese protestanti vengono appositamente realizzate in modo da
accogliere un maggior numero di fedeli e avere una minore riverberazione in
modo da facilitare l’ascolto della parola. Le chiese cattoliche sono oggetto, in
questo periodo, di minori modifiche per cui la differenza fra chiese cattoliche e
riformate appare incrementata.
Nel periodo neoclassico si ha un incremento della riverberazione nelle
chiese riformate, dovuto probabilmente allo sviluppo della musica e delle
prediche, nonché ad una possibile diversa disposizione dei banchi. Nelle chiese
cattoliche, a fronte di un aumento della riverberazione fino a valori superiori a
quelli trovati nelle chiese medievali, il volume specifico si attesta intorno ai 19
m3/persona, consentendo, in piena occupazione, una accettabile intelligibilità del
parlato.

Tabella 4.4 - Tempi di riverberazione [s] medi (calcolati su tutte le frequenze) suddivisi per
periodo storico e per confessione religiosa.
Romaniche e
Barocche Neoclassiche Moderne Tutte
Gotiche
<1530 1530-1815 1815-1915 >1915
V 3,7 3,0 4,1 3,3 3,5
Cattoliche
O 2,4 2,3 2,2 1,8 2,1
V 3,1 2,2 2,5 2,6 2,6
Riformate
O 1,9 1,2 1,4 1,4 1,5
V 3,2 2,4 3,3 2,9 3,0
Tutte
O 2,0 1,5 1,9 1,6 1,7
V=Vuote (misurato). O=Occupate (calcolato)
Tabella 4.5 – Volume [m3] e volume specifico [m3/persona] suddivisi per periodo storico e per
confessione religiosa.

Romaniche e
Gotiche Barocche Neoclassiche Moderne Tutte
<1530 1530-1815 1815-1915 >1915
5.600 6.700 6.300 4.300 5.300
Cattoliche
19 24 12 10 13
7.400 2.600 3.500 2.800 4.200
Riformate
12 8 8 8 9
7.000 3.600 5.000 3.500 4.600
Tutte
13 12 10 9 11
58 Capitolo 4

Nelle chiese moderne, sono le novità introdotte dal Concilio Vaticano II a


dettare le modifiche nelle chiese cattoliche che vedono ridursi il volume specifico
e, con esso, anche il tempo di riverberazione.
In 28 chiese sono state condotte misure del RASTI ottenendo valori non
molto diversi fra le condizioni di non occupazione (0,41) e occupazione (0,44) dei
luoghi. Inoltre in 40 chiese sono state condotte misure del rumore di fondo
ottenendo valori medi di 35 dB(A) in città e 23 dB(A) in campagna, permettendo
di concludere che il pessimo valore dell’indice di intelligibilità è da attribuirsi
esclusivamente ai tempi di riverberazione molto lunghi osservati.

4.2.3 Lo studio sulle chiese portoghesi


Da circa dieci anni Carvalho sta conducendo in Portogallo uno degli studi
più completi sulle caratteristiche acustiche delle chiese. Come illustrato in [26] lo
studio comprende sia la misura dei principali parametri acustici oggettivi (RT,
EDT, C80, D50, Ts, G, BR e RASTI), sia la valutazione soggettiva di esecuzioni
musicali e di test di intelligibilità in diverse postazioni all’interno delle chiese. I
giudizi soggettivi sono riferiti al livello sonoro, all’intimità, alla riverberazione,
all’avvolgimento, al bilanciamento, alla chiarezza, agli echi, al rumore di fondo e
al giudizio complessivo. Tutte le misure sono riferite alle chiese non occupate.
Inoltre, per completare il quadro, i principali parametri geometrici e architettonici
di ciascuna chiesa sono presi in considerazione.
Fra i molteplici risultati forniti da questa ricerca uno dei più interessanti
riguarda la correlazione fra l’indice di trasmissione del parlato (RASTI) e altri
parametri acustici ed architettonici [25]. La maggior parte delle chiese studiate
presenta valori del RASTI inferiori a 0,45 (la mediana calcolata è pari a 0,40), che
corrisponde ad un giudizio scadente circa l’intelligibilità del parlato.
Dallo studio si evidenzia che il RASTI, in posizioni lontane dal campo
diretto della sorgente, può essere efficacemente predetto in modo puntuale dal
Ts@1kHz ma anche dall’EDT@500Hz e da RT@2kHz. Se non interessa una stima
puntuale anche il C80@2kHz risulta essere un valido predittore dell’intelligibilità del
parlato, al contrario del livello di pressione sonora che appare non influenzarla.
Infine l’autore propone una relazione per correlare il RASTI con tre parametri
architettonici (larghezza della navata, altezza della navata e coefficiente di
assorbimento medio).
Una parte interessante dello studio è dedicata all’analisi dei valori del RASTI
caratteristici di vari stili architettonici. Analogamente a quanto riportato nel
paragrafo precedente è così possibile osservare in che modo l’acustica è stata
influenzata dagli stili architettonici, ovvero dalle riforme proprie della liturgia, che
sono avvenute nello stesso periodo storico. Come si osserva in Figura 4.3 i valori
medi del RASTI decrescono fino al Rinascimento, crescono repentinamente in
corrispondenza del periodo Barocco per poi decrescere nel periodo Neoclassico e
rimanere poi costanti fino ai giorni nostri quando, il Concilio Vaticano II ha ridato
importanza all’opera educatrice e formatrice della parola.
Un’altra interessante conclusione a cui lo studio giunge è che l’uso del
pulpito, privo di una calotta superiore di adeguata grandezza, incrementa i valori
del RASTI. Tuttavia tale incremento è dovuto solo alla diminuzione della distanza
fra il ricevitore e la sorgente (poiché il pulpito si trova in genere nella navata
centrale) e non ad un effettivo rinforzo del suono. Perciò il pulpito
Capitolo 4 59

Figura 4.3 - Valori medi del RASTI con intervallo di confidenza pari all’errore standard, in ascissa
sono riportati gli stili architettonici in ordine cronologico (1-Visigotico, 2-Romanico, 3-Gotico, 4-
Manuelino, 5-Rinascimentale, 6-Barocco, 7-Neoclassico, 8-Contemporaneo). (Fig. tratta dal Rif.
[25])
rappresenta solo un dispositivo indiretto per incrementare l’intelligibilità del
parlato, riducendo la distanza fra predicatore e assemblea.
In una recente pubblicazione Desarnaulds, Chauvin e Carvalho [32] mettono
in evidenza che la presenza della calotta sopra il pulpito è utile solo in chiese
molto alte e limitatamente ai posti meno lontani. Nelle chiese basse la calotta
svolge addirittura un ruolo negativo in quanto blocca le prime riflessioni che
sarebbero destinate ad essere riflesse dal soffitto. In ogni caso nei posti più lontani
l’effetto della calotta è nullo.

4.3 Altri studi

Oltre ai fondamentali lavori discussi nei paragrafi precedenti è possibile


trovare in letteratura una serie di altri studi focalizzati sulle chiese o a spazi
dedicati ad altri culti, come le moschee, ma aventi prevalentemente come scopo
un adattamento ad altri usi o una correzione acustica. Pertanto essi saranno solo
brevemente elencati:
- Abdelazeez et al. [1], presentano i risultati degli interventi di
miglioramento eseguiti in una moschea in Giordania caratterizzata da un
tempo di riverberazione estremamente lungo e da bassissimi indici di
intelligibilità;
- Magrini e Ricciardi [56], presentano una indagine sperimentale su dieci
chiese genovesi nelle quali sono stati misurati tempi di riverberazione e
indici di chiarezza (C80, D50 e Ts), vengono proposte correlazioni fra tali
parametri e il rapporto volume/superficie delle chiese;
- Mijic [61], propone un resoconto sui tempi di riverberazione misurati in
60 chiese ortodosse in Serbia, mettendo in evidenza la relazione fra
tempi e volume;
60 Capitolo 4

- Prodi et al. [64], verificano la affidabilità di diverse formulazioni


teoriche per il calcolo di RT e di G confrontando i valori calcolati con
quelli misurati in alcune moschee turche;
- Sendra et al. [71], presentano lo studio di tre chiese spagnole finalizzato
al loro riutilizzo come spazi per la musica e per conferenze;
- Sendra et al. [72], presentano un resoconto sulle caratteristiche
acustiche delle chiese in stile gotico-mudejar di Siviglia. Dopo
l’illustrazione delle caratteristiche tipiche di queste chiese vengono
analizzate le correlazioni esistenti fra alcune delle grandezze acustiche
misurate e viene proposta una formula per la previsione di G ottenuta
introducendo dei coefficienti correttivi nella relazione definita da
Barron e Lee [11].
Capitolo 5

L’indagine sperimentale

In questo capitolo saranno analizzate singolarmente nove chiese in


cui sono stati condotti rilievi acustici. Dopo una presentazione
generale che inquadra le chiese nel loro insieme relazionandole al
contesto, si procederà all’analisi individuale. Di ciascuna chiesa
saranno descritte la caratteristiche architettoniche, con particolare
riguardo ai materiali e alla loro distribuzione; si illustreranno poi le
condizioni di misura e, infine, si descriveranno e discuteranno le
caratteristiche acustiche.

5.1 Quadro generale

Lo scopo del presente lavoro è, come detto nell’introduzione, quello di


caratterizzare acusticamente una ben precisa tipologia architettonica, quella delle
chiese romaniche pugliesi. In realtà non è possibile parlare di tipologia “precisa”
dal momento che le chiese, più di ogni altro edificio monumentale, hanno
conosciuto periodi di costruzione molto lunghi e, spesso, hanno seguito
l’evoluzione del gusto architettonico con aggiunte, modifiche e, talora,
ricostruzioni. Le chiese analizzate, tuttavia, hanno conservato solo alcune, più
significative, tracce di tale processo di stratificazione, poiché restauri più o meno
recenti le hanno riportate al loro aspetto originale. In ogni caso è possibile
distinguere diversi “modelli” architettonici all’interno della stessa famiglia anche
se all’interno di tali gruppi non mancano differenze più o meno significative.
La tipologia architettonica più diffusa (ed anche più rappresentata in
questo studio) è quella della chiesa “a matronei”, avente una navata centrale e due
laterali, transetto poco o nulla sporgente rispetto alle navate, e absidi poste in asse
con le tre navate. Le possibili varianti sono rappresentate dalla presenza di
matronei veri e propri o falsi1, dall’assenza del transetto nelle chiese più piccole,
dall’eventuale presenza di cupole in corrispondenza della crociera, dalla presenza
o meno del coro prima dell’abside o in sostituzione di essa.
Un’altra tipologia architettonica tipicamente pugliese, ma di derivazione
bizantina è quella delle chiese a cupola, caratterizzate dall’avere ogni campata

1
I matronei sono superfici praticabili poste sulle navate laterali (che sono quindi voltate) ed aperti
sulla navata centrale mediante trifore; i “falsi” matronei sono caratterizzati dalla presenza delle
sole trifore che, quindi, si aprono sulle navate laterali che sono di conseguenza più alte e con
copertura in legno.
62 Capitolo 5

della navata centrale coperta da una cupola emisferica, mentre le navate laterali
sono coperte con volte a mezza botte. Purtroppo in questo lavoro è stato possibile
prendere in considerazione un solo esempio di questa tipologia, il quale presenta
comunque caratteristiche acustiche abbastanza singolari che rendono di grande
interesse l’approfondimento (futuro) dello studio di queste chiese.
Comunque la caratteristica di maggiore omogeneità per queste chiese è
rappresentata, prima ancora che dalla similitudine delle forme, dall’utilizzo degli
stessi materiali, cioè tufo, pietra calcarea e legno, nonché dal ricorso modesto ad
apparati decorativi superficiali
Pur nel solo ambito delle costruzioni romaniche, le chiese considerate
costituiscono un campione ancora esiguo che si auspica di ingrandire in futuro,
estendendo lo studio anche a stili architettonici diversi ed, in particolare, al
Barocco Leccese.
Tuttavia si può osservare che le chiese prese in considerazione spaziano in
un intervallo di volumi, superfici e tempi di riverberazione (v. Tabella 5.1) tali da
poter trarre interessanti conclusioni.
Tabella 5.1 - Riassunto dei principali parametri caratteristici delle nove chiese analizzate. Nella
prima colonna è riportata la lettera identificativa che sarà utilizzata nel seguito.

Volume Superficie RTmid V/Sp


ID Chiesa
(m3) (m2) (s) (m)
A Basilica di S. Nicola (Bari) 32.298 1530 4,4 21,1
B Cattedrale di Bari 30.142 1274 5,3 23,7
C Cattedrale di Bitonto 15.974 858 4,3 18,6
D Cattedrale di Barletta 15.843 912 6,8 17,4
E Cattedrale di Bisceglie 10.150 534 3,5 19,0
F Cattedrale di Ruvo 6.397 445 3,7 14,4
G Cattedrale di Bovino 3.840 452 3,8 8,5
H Ognissanti (Valenzano) 1.800 258 5,4 7,0
I Auditorium La Vallisa (Bari) 1.521 162 2,1 9,4

5.2 I parametri architettonici considerati

In questo studio, per ciascuna chiesa analizzata, sono stati individuati,


partendo dalla documentazione esistente, ovvero ricorrendo a misure in sito, i
seguenti parametri architettonici:
- larghezza della navata centrale (Wn), delle navate laterali (Wl), e del
transetto (Wt)
- lunghezza delle navate (Ln) e del transetto (Lt);
- altezza media della navata centrale (Hn), delle navate laterali (Hl), dei
matronei (Hm), del transetto (Ht) e delle absidi (Ha, Hal);
- diametro delle absidi (Da, Dl) e delle eventuali cupole (Dc);
- dimensioni di cori, cappelle ed altro non incluso nei precedenti.
Partendo dalla conoscenza di questi dati sono stati quindi calcolati, appros-
simando lì dove le informazioni non erano sufficientemente precise, o dove la
complessità era eccessiva, il volume totale (Vt), il volume della navata principale
(Vn), la superficie totale in pianta (Sp), la superficie della navata (Sn), la superficie
occupata dai banchi (Sb), lo sviluppo superficiale interno (St). Il numero dei posti a
sedere, ove non disponibile direttamente, è stato calcolato considerando che le
Capitolo 5 63

dimensioni medie di un posto a sedere sono di 0,5×0,9 = 0,45 m2. Infine, partendo
dai tempi di riverberazione misurati alle medie frequenze e assumendo valida la
formula di Sabine, si è calcolato l’assorbimento totale (A) e il coefficiente di
assorbimento medio (αmed).

5.3 Le nove chiese

5.3.1 La Basilica di San Nicola a Bari

5.3.1.1 Cenni storici


La Basilica (v. Figura 5.1) fu iniziata nel 1087 per accogliere le spoglie di
San Nicola. Nel 1089 fu ultimata la cripta e nel 1197 fu consacrata la chiesa
superiore. Primo esempio pugliese di chiesa con matronei, perfetta fusione di
novità strutturali provenienti dal nord, esperienze bizantine e campano-cassinesi,
essa divenne il prototipo di tutta una serie di cattedrali erette in terra di Bari tra
XII e XIII secolo. Dopo il terremoto del 1456 vennero aggiunte nella navata
centrale le tre grandi arcate trasversali di rinforzo (v. Figura 5.2 sinistra). Nel
periodo Barocco, invece, venne realizzato il soffitto ligneo con le grandi tele
raffiguranti Scene della vita e dei miracoli di San Nicola (v. Figura 5.2 destra).

5.3.1.2 Descrizione
Attualmente l’interno è diviso in tre navate concluse da tre absidi
semicircolari (v. Figura 5.3). Sui colonnati si aprono le trifore del matroneo,
sovrastato da un claristorio di monofore. Il transetto è tripartito da due arcate
pensili che evidenziano il quadrato della crociera, raccordate da cuffie su cui
doveva impostarsi la cupola, mai realizzata. Le testate del transetto, come in
controfacciata, sono percorse da ballatoi pensili su mensoloni, che permettono il
passaggio tra le torri e l’esaforato esterno.

Figura 5.1 - La Basilica di S. Nicola (Bari) vista dall'esterno.


64 Capitolo 5

Figura 5.2 - Viste interne della Basilica di S. Nicola (Bari). A sinistra vista della navata centrale
con, in primo piano, gli arconi trasversali. A destra, vista del soffitto ligneo affrescato e decorato.
Il pavimento è in marmo ed ospita banchi lignei solo nella navata centrale;
le colonne sono in marmo, mentre la restante struttura muraria è in pietra calcarea
a vista. Il soffitto della navata centrale e del transetto, come già detto, è in legno e
tela, mentre in corrispondenza dei matronei è visibile la struttura della copertura
lignea a capriate. Le navate laterali sono coperte da volte a crociera in pietra
intonacata. Dal punto di vista decorativo le pareti si presentano lisce e prive di
decorazioni, che, al contrario, abbondano sul soffitto; i capitelli e gli archi
presentano un fine ornato superficiale. All’interno della chiesa, nelle navate
laterali sono poi presenti una statua del Santo (racchiusa in una teca), e un
crocifisso; nel transetto vi è da un lato una pala d’altare e dall’altro il tabernacolo
in bronzo finemente decorato.
Le principali dimensioni sono riportate di seguito:
Wn = 13 m Ln = 41 m Hn = 25 m
Wl = 7 m Hl = 11 m Hm = 7 m
Wt = 32 m Lt = 13 m Ht = 25 m
Da = 9 m Ha = 22 m Dal = 4,5 m
Hal = 18 m
Vt = 33.000 m3 Vn = 13.300 m3 Sb = 250 m2
2 2
Sp = 1.570 m Sn = 533 m St = 10.500 m2 (appross.)

5.3.1.3 Il rilievo acustico


Il rilievo acustico è stato condotto in due giornate consecutive: nella prima
sono state acquisite le risposte all’impulso monoaurali con la tecnica MLS durante
il normale orario di apertura della chiesa; nella seconda sono state acquisite le
risposte binaurali impiegando la tecnica dello sweep durante l’orario di chiusura
della chiesa in modo da minimizzare la presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 17,
campionata a 25,6 kHz, della durata di 5,12 s per evitare problemi di time
aliasing, e ripetuta 32 volte per migliorare il rapporto S/R. Lo sweep utilizzato ha
una durata di 6 s durante i quali la frequenza varia da 80 a 12000 Hz. Data la
sostanziale simmetria della chiesa e, considerate le sue dimensioni, sono stati
adottati dieci punti di misura posti in una sola metà dell’ambiente e due punti di
emissione posizionati nella parte centrale dell’area presbiteriale che, in occasione
di concerti, viene occupata dall’orchestra e dal coro (v. Figura 5.3).
Capitolo 5 65

Figura 5.3 - Sezione e pianta della Basilica di S. Nicola a Bari. In pianta sono indicati i punti di
emissione (…) e di ricezione ({). Scala 1:500.
66 Capitolo 5

5.3.1.4 Analisi dei risultati


L’osservazione dei risultati relativi ai tempi di riverberazione misurati per
bande di ottava, mostra (v. Figura 5.4) un andamento simile a quello riscontrato
da Shankland e Shankland [73] nelle Basiliche romane. Come sarà più evidente
nel seguito, dopo aver osservato i valori misurati in altre chiese, i tempi misurati
alle basse frequenze (fino a 500 Hz) appaiono più bassi che altrove e questo è
sicuramente da attribuirsi alla presenza del soffitto decorato e con grandi tele
dipinte, che assorbe maggiormente le frequenze in esame. Alle alte frequenze si
osservano valori più bassi che alle medie frequenze, effetto sicuramente dovuto al
volume molto grande della chiesa e, quindi, all’assorbimento dell’aria. Tale
fenomeno si osserva sistematicamente in tutte le chiese, divenendo
progressivamente meno evidente in quelle di volume minore. Dal punto di vista
dell’effetto del posizionamento della sorgente sui tempi rilevati, non si osservano,
in termini medi, differenze significative, risultando queste al più pari a 0,1 s.
Passando all’analisi dell’andamento dei valori punto per punto, si sono presi
in considerazione i valori alle medie frequenze, i quali mostrano una sostanziale
omogeneità; fanno eccezione i punti di volta in volta più vicini alla sorgente che
hanno valori un po’ più bassi per effetto della prevalenza del suono diretto.
Un aspetto di grande interesse, che è stato messo in risalto in altri studi
([54],[65],[73]) e di cui si è detto nel capitolo precedente, è il fatto che i tempi di
riverberazione misurati appaiono più bassi di quanto ci si aspetterebbe per un
volume simile. Infatti, adottando per i principali materiali i coefficienti di
assorbimento riportati in letteratura e facendo un calcolo (inevitabilmente
approssimato) delle diverse superfici, si ottengono valori dei tempi di
riverberazione quasi doppi rispetto a quelli misurati (v. Tabella 5.2).
4,8 5,5
4,6
4,4 5,0
RT(500-1000 Hz) (s)

4,2
4,5
4,0
RT (s)

3,8 4,0
3,6
3,4 3,5
3,2
3,0
3,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.4 - Basilica di San Nicola (Bari). Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

Tabella 5.2 - Calcolo del tempo di riverberazione della Basilica di S. Nicola con la formula di
Sabine. I coefficienti di assorbimento sono presi da varie fonti.

Materiale Sup. (m2) α125 α250 α500 α1000 α2000 α4000


Pavimento 1034 3 3 4 5 5 5
Pareti 6948 3 3 4 5 5 5
Tetto 1573 30 20 15 10 10 10
Banchi 533 4 5 6 7 7 6
Porte 503 19 14 9 8 10 10
Totale (m2) 10591 RT (s)
Volume (m3) 34043 6,6 8,4 8,6 8,7 8,5 8,5
RT misurati (s) 4,5 4,3 4,4 4,4 4,1 3,3
Capitolo 5 67

5,0 5,5
4,8
4,6 5,0

EDT(500-1000 Hz) (s)


4,4
4,2 4,5
EDT (s)
4,0
3,8 4,0
3,6
3,4 3,5

3,2
3,0 3,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.5 - Basilica di San Nicola (Bari). Andamento dei valori di EDT al variare della frequenza
in funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).

8,0 16,0
7,0 14,0

6,0 12,0

5,0 10,0

G10 (dB)
G10 (dB)

4,0 8,0

3,0 6,0
4,0
2,0
2,0
1,0
0,0
0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.6 - Basilica di San Nicola (Bari). Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).
Questa osservazione pone numerosi interrogativi a cui è possibile dare,
come già osservato nel capitolo precedente, risposte differenti di cui è necessario
valutare la correttezza e l’idoneità. Pertanto, essendo questo un problema comune
alla maggior parte delle chiese, verrà discusso nel capitolo successivo,
considerando i risultati nel loro insieme.
L’analisi dei valori del tempo di primo decadimento misurati per bande di
ottava (v. Figura 5.5) ripropone un andamento simile a quello osservato per RT,
ma con interessanti differenze. In primo luogo si osserva un incremento dei valori
alle medie frequenze particolarmente accentuato quando la sorgente è posta nel
punto B (v. Figura 5.3), ciò potrebbe dipendere dalla presenza delle due colonne
che separano la navata centrale dal transetto, le quali interferiscono con la
propagazione del suono diretto. Questo, giungendo nei punti di ricezione
smorzato, determina l’allungarsi dei valori. Ciò è confermato dall’analisi dei
valori puntuali alle medie frequenze che mostrano come, per i punti “in ombra”
rispetto alla sorgente, i valori dei tempi sono apprezzabilmente più elevati, mentre
per il punto 10, che è all’interno del transetto e quindi non influenzato dalle
colonne, i tempi di primo decadimento sono inferiori alla media.
L’analisi dei valori del livello sonoro, ovvero del fattore di forza G, relativi
alle diverse bande di ottava mostra (v. Figura 5.6) un andamento decrescente al
crescere della frequenza determinato, in parte, dall’andamento dei tempi di
riverberazione (ovvero dall’assorbimento totale dell’ambiente). Alle medie
frequenze si ha Gmid = 5,9 dB, mentre G(A) = 11,3 dB, pertanto i valori rientrano o
sono comunque molto prossimi all’intervallo ottimale, confermando che,
malgrado il volume molto grande, il lungo tempo di riverberazione garantisce un
68 Capitolo 5

apporto di energia sonora sufficiente. Il problema, come si vedrà tra breve, è che
molta di questa energia arriva tardi, contribuendo a confondere, piuttosto che a
chiarire, il messaggio sonoro. L’analisi dell’andamento puntuale dei valori mostra,
in questo caso, un sostanziale dualismo esistente fra Gmid e G(A), dal momento
che le variazioni sono pressoché identiche e i due parametri appaiono solamente
traslati (di circa 5 dB). Escludendo i punti più vicini alle sorgenti, entrambi i
parametri variano in modo contenuto (circa 2-3 dB), mostrando una sostanziale
uniformità del livello sonoro. Tuttavia, l’analisi dei valori in funzione della
distanza dalla sorgente (v. Figura 5.7), mostra una progressiva diminuzione dei
valori secondo una legge di tipo logaritmico. Questo contrasta con la teoria
classica che prevede, in campo diffuso riverberante, la costanza del livello sonoro
una volta superata la distanza critica al disotto dalla quale prevale il campo
diretto. Tale distanza, definita come Hallradius (v. Rif. [29], p.426) è pari, nel
caso in esame, a 5 m e risulta inferiore alla minima distanza sorgente-ricevitore.
La “teoria corretta” elaborata da Barron e Lee [11] mostra invece un buon accordo
con i valori misurati, con differenze che superano 1 dB solo per i punti più vicini
alle sorgenti, per i quali è possibile ipotizzare che forti riflessioni da parte delle
pareti o del pavimento possano incrementare i valori misurati.
L’analisi dei valori della chiarezza (v. Figura 5.8) misurati per bande di
ottava, mostra un andamento medio sfavorevole tanto per la comprensione della
musica che del parlato. Infatti, i valori mostrano un picco negativo alle medie
frequenze per cui l’indice sintetico C80(3) risulta pari a –7,5 dB. È possibile inoltre
osservare che i valori misurati con la sorgente in A appaiono sempre maggiori dei

10,00 0,0
9,00 -2,0
8,00
-4,0
y = -3,06Ln(x) + 15,44
7,00
G10@1kHz

C80@1kHz

R2 = 0,96 -6,0
6,00
-8,0
5,00
y = -5,11Ln(x) + 8,50
-10,0
4,00 R2 = 0,87
3,00 -12,0

2,00 -14,0
0,0 10,0 20,0 30,0 40,0 50,0 0,0 10,0 20,0 30,0 40,0 50,0

Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.7 - Basilica di San Nicola (Bari). Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in
funzione della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei
valori secondo la teoria di Barron [11].

0,0 0,0
-1,0
-2,0
-2,0
C80 (500-2k) (dB)

-3,0 -4,0
C80 (dB)

-4,0
-6,0
-5,0
-6,0 -8,0
-7,0
-10,0
-8,0
-9,0 -12,0
125 250 500 1000 2000 4000
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.8 - Basilica di San Nicola (Bari). Andamento dei valori di C80 al variare della frequenza
in funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).
Capitolo 5 69

valori misurati con la sorgente in B. Ciò può essere dovuto alla maggiore distanza
fra la sorgente B e i ricevitori, che determina una riduzione del contributo del
suono diretto rispetto al campo riverberante. L’analisi dell’andamento puntuale
dell’indice sintetico mostra la grande variabilità di questo parametro al variare
della posizione ed evidenzia che solo i punti più vicini alla crociera, cioè il punto
1 nella navata ed il punto 10 nel transetto, godono di buone o, quantomeno,
accettabili condizioni, mentre in tutti gli altri punti, come già mostrato
dall’andamento dei valori medi, la chiarezza risulta essere del tutto insufficiente.
È interessante osservare, inoltre, che la chiarezza diminuisce con la distanza
secondo un andamento logaritmico (v. Figura 5.7). Ciò è in accordo con la “teoria
corretta” di Barron [11], tuttavia i valori misurati appaiono inferiori a quelli
predetti e ciò potrebbe essere dovuto al fatto che in ambienti complessi come le
chiese, la presenza di colonnati e di soffitti non riflettenti o, comunque, molto
diffondenti, determina un indebolimento (o una dispersione) delle prime
riflessioni. Pertanto, la chiarezza ne risulta essere notevolmente diminuita.
L’osservazione dei dati relativi al tempo baricentrico (v. Figura 5.9),
conduce a osservazioni analoghe a quelle fatte a proposito della chiarezza. In
particolare è possibile notare che gli andamenti puntuale dei valori con la sorgente
posta prima in A e poi in B sono molto più simili tra loro di quanto non accada per
il C80, a riprova della maggiore stabilità del parametro in esame. Se si considera il
Ts fra i descrittori dell’intelligibilità del parlato, è possibile osservare che il suo
valore medio a 1000 Hz è pari a 368 ms corrispondenti, secondo la Tabella 2.3, ad
un giudizio soggettivo “scarso”. L’analisi dei valori puntuali mostra che in nessun
punto (fra quelli presi in esame) sussistono condizioni “sufficienti” per la
comprensione del parlato in assenza di sistemi di amplificazione, mentre in alcuni
punti più distanti dalla sorgente le condizioni risultano “pessime”.
L’analisi dell’andamento degli indici di intelligibilità (v. Figura 5.10,
sinistra) mostra un andamento in tutto analogo a quello del Ts. Il valore medio
dello STI è pari a 0,32, mentre quello del RASTI è pari a 0,31, indicando, quindi,
una intelligibilità del parlato “scarsa”. I valori puntuali mostrano un buon accordo
fra STI e RASTI, e confermano che la comprensione del parlato varia fra “scarso”,
nei punti più vicini alle sorgenti, e “pessimo”, nei punti più lontani dalle sorgenti
o schermati dalla presenza delle colonne, dove il suono diretto arriva
maggiormente attenuato.
L’osservazione dell’andamento dei criteri di eco (v. Figura 5.10, destra)
mostra che per la musica tutti i punti sono al disotto del valore limite (pari a 1,5),
mentre per il parlato, nel punto 7 (con la sorgente in A) il criterio è pari a 0,83,
450 500
400 450
350
400
300
Ts (500-1k) (s)

250 350
Ts (s)

200 300
150
250
100
200
50
0 150
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

125 250 500 1000 2000 4000


Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.9 - Basilica di San Nicola (Bari). Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).
70 Capitolo 5

50,0 1,00
45,0 0,90
40,0 0,80
35,0 0,70

Echo Criterion
STI/RASTI

30,0 0,60
25,0 0,50
20,0 0,40
15,0 0,30
10,0 0,20
5,0 0,10
0,0 0,00
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
Posizioni dei ricevitori Posizioni dei ricevitori
RASTI STI EC_music EC_speech

Figura 5.10 - Basilica di San Nicola (Bari). Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).

1,00 1,0
0,90 0,9
Bilanciamento dei bassi

0,80 0,8

Bilanciamento degli alti


Indici normalizzati

Indici normalizzati
0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
Combinazioni Sorg_Ric Combinazioni Sorg_Ric
EBR BR_l LTR TR

Figura 5.11 - Basilica di San Nicola (Bari). Andamento punto per punto dei parametri caratteristici
del bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto
dei diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono
diagrammati in forma normalizzata.
prossimo, ma comunque inferiore, al valore limite di 0,90. Pertanto si può
concludere che, pur avendosi un volume molto grande, con pareti molto distanti e,
quindi, potenzialmente causa di echi, la permanenza e la forza del campo
riverberante fanno sì che tali eventuali riflessioni siano inglobate nella coda
sonora in modo da risultare inaudibili.
Per quanto riguarda il bilanciamento tonale, i valori medi degli indici
calcolati relativamente alle basse frequenze, risultano essere: BR = 1,01;
BR_L = 0,85 dB; EBL = –3,16 dB. L’analisi dei valori puntuali viene condotta
trascurando BR dal momento che le sue variazioni sono minime e, considerando la
maggiore incertezza che caratterizza la misura di RT alle basse frequenze, poco
significative per formulare un giudizio puntuale. In ogni caso tale parametro varia
fra 0,95 e 1,07, risultando pertanto all’interno dell’intervallo ottimale definito nel
Capitolo 2. L’osservazione dell’andamento puntuale di EBL e BR_L (v. Figura
5.11) va fatta considerando che i valori minimi e massimi entro cui essi variano
sono rispettivamente –8,3 e 3,8 dB per EBL e –0,1 e 2 dB per BR_L. La dinamica
appare quindi molto più estesa per il parametro proposto da Soulodre e Bradley, in
accordo con quanto essi stessi sostengono [75]; inoltre si osserva una diminuzione
quasi sistematica man mano che ci si allontana dalla sorgente oppure ci si sposta
nella navata laterale. Il confronto con l’intervallo di variabilità osservato in [75]
porta a concludere che i valori qui misurati appaiono piuttosto bassi. Al contrario i
valori di BR_L variano entro l’intervallo ottimale proposto nel Capitolo 2,
risultando, anzi, in molti punti superiori; inoltre le fluttuazioni del parametro non
appaiono ascrivibili a motivi particolari. Infine, confrontando gli andamenti dei
due parametri non appaiono visibili correlazioni fra i due, infatti risulta R = 0,39.
Capitolo 5 71

Per quanto riguarda le alte frequenze i valori medi dei due indici risultano
essere: LTR = –9,1 dB e TR = 0,74. Come per EBL, anche il valore di LTR si
colloca in corrispondenza del limite inferiore dell’intervallo considerato da
Soulodre e Bradley, mentre per TR è possibile considerare i valori riportati da
Beranek in [15] e riassunti nella Tabella 2.5, rispetto ai quali il valore medio
misurato appare nei limiti. L’analisi dei valori puntuali mostra (v. Figura 5.11,
destra), tenendo conto che i valori minimi e massimi sono rispettivamente –9,9 e
–8,3 per LTR e 0,66 e 0,79 per TR, che le variazioni sono piuttosto contenute e
che i due indici sono correlati negativamente (R = –0,70), nel senso che variano in
modo opposto. Pertanto, a differenza di quanto accade per i bassi, il bilanciamento
degli alti risulta essere piuttosto uniforme in tutti i punti considerati. Il valore
basso assunto da entrambi i parametri può spiegarsi considerando che il volume
molto grande dell’ambiente comporta un inevitabile assorbimento delle
componenti di alta frequenza da parte dell’aria.
I valori medi dei parametri binaurali per la misura dell’estensione apparente
della sorgente risultano essere (1–IACCE) = 0,68 e IADE = 0,39. Entrambi i valori
sono entro l’intervallo ottimale definito nel Capitolo 2, anche se i valori sono
quasi al limite inferiore. L’analisi dei valori puntuali (v. Figura 5.12) mostra in
primo luogo una scarsa correlazione fra i due indici (R = 0,45), inoltre è possibile
osservare che i valori più bassi dei parametri (corrispondenti, quindi, a segnali
maggiormente correlati), si hanno, come è ovvio, per i punti più vicini alla
sorgente, ma anche in alcuni punti della navata laterale (come il punto 6 o il punto
4). Questi punti, pur essendo localizzati nella navata laterale presentano una forte
componente di suono diretto (specialmente quando la sorgente è in B) che
determina l’abbassarsi del valore dell’indice.
Con riferimento alla misura dell’avvolgimento sonoro i valori medi misurati
sono pari a: 10Log(1–IACCL) = –0,42 e IADL = –0,20. Entrambi i valori sono
prossimi al limite superiore (cioè 0, corrispondente alla totale assenza di
correlazione fra i due segnali), confermando che il campo sonoro all’interno della
chiesa in esame è estremamente diffuso e che, pertanto, la sensazione di
avvolgimento dovrebbe essere molto elevata. A livello puntuale si osserva ancora
una bassa correlazione fra le due misure (R = 0,50), e una maggiore uniformità
(cioè una minore variabilità da punto a punto), per entrambi gli indici. Da notare,
infine, che non avendo utilizzato la differenza interaurale normalizzata, in alcuni
punti la IADL risulta maggiore di zero.

0,90 0,40

0,80 0,20
Log(1-IACC) / IAD (dB)

0,70
0,00
1-IACC / IAD

0,60
-0,20
0,50
-0,40
0,40

0,30 -0,60

0,20 -0,80
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

Combinazioni S_RR Combinazioni S_RR


1-IACCearly IADearly Log(1-IACClate) IADlate

Figura 5.12 - Basilica di San Nicola (Bari). Andamento punto per punto dei valori degli indici
binaurali relativi alla ASW (sinistra) e relativi al LEV (destra).
72 Capitolo 5

5.3.2 La Cattedrale di San Sabino a Bari

5.3.2.1 Cenni storici


La Cattedrale di Bari, dedicata a San Sabino, venne iniziata nel 1034 ma,
nel 1156 fu completamente distrutta a seguito del sacco di Bari da parte di
Guglielmo il Malo. Nel 1170 fu iniziata la ricostruzione e la chiesa fu eretta, in
soli otto anni, sul modello della Basilica di San Nicola. Nel 1267 un terremoto
arrecò nuovi danni alla chiesa, a questa fase si deve la trasformazione della
facciata, con l’introduzione del rosone e la sopraelevazione delle tettoie. La
riconsacrazione si ebbe nel 1292. A partire dal XVI secolo si ebbero ulteriori
modifiche che culminarono nella trasformazione dell’interno in forme
tardobarocche, opera dell’architetto Domenico Vaccaro. Durante i restauri
condotti a partire del 1930 l’interno, ad esclusione della cripta, è stato ricondotto
alle originarie forme medievali.

Figura 5.13 - Cattedrale di Bari. Veduta della navata centrale con, sullo sfondo, l'abside.

5.3.2.2 Descrizione
Internamente (v. Figura 5.13) la chiesa è a croce egizia (a T) ed ha tre
navate suddivise da 16 colonne monolitiche. I matronei sono finti, cioè sono
simulati dalle trifore che mettono in comunicazione la navata centrale con quelle
laterali, più alte e prive di volte e coperte, quindi, direttamente dalla struttura
lignea a spioventi. Il transetto sopraelevato raccorda le tre navate e le conclude
con le tre absidi ad esse allineate. All’incrocio fra navata e transetto si erge, su un
tamburo ottagonale, la cupola.
Il pavimento, in pietra con intarsi in marmo rosa, in corrispondenza della
navata centrale ed in metà di quelle laterali ospita banchi in legno; altre sedie sono
invece poste in corrispondenza dei due bracci del transetto, rispettivamente
utilizzati per il coro e per l’adorazione eucaristica. Le pareti sono in pietra
calcarea a vista con blocchi più o meno levigati. Le colonne sono monolitiche
Capitolo 5 73

Figura 5.14 - Cattedrale di Bari. Sezione e pianta. In pianta sono indicati i punti di emissione (…) e
di ricezione ({). Scala 1:500.
74 Capitolo 5

in marmo con capitelli finemente decorati. La copertura delle navate e delle due
ali del transetto è a capriate lignee in vista, mentre la cupola ed il tamburo sono in
pietra. Altre parti in legno sono i quattro confessionali posti sulla parete nord
(quella del battistero) e le quattro bussole poste in corrispondenza degli ingressi.
In corrispondenza della crociera e lungo l’abside centrale sono disposti dei seggi,
rivestiti in velluto, per le solenni concelebrazioni. L’area presbiteriale è poi
ulteriormente separata dalle due ali del transetto da grate in legno. Le numerose
finestrature sono in alabastro.
Dal punto di vista decorativo la chiesa è abbastanza spoglia; la totalità delle
pareti è priva di qualsiasi rilievo; fra la navata centrale e la navata laterale è invece
presente un ambone molto decorato.
Le principali dimensioni sono riportate di seguito:
Wn = 13 m Ln = 34 m Hn = 25 m
Wl = 6 m Hl = 17,5 m
Wt = 31 m Lt = 12 m Ht = 27,5 m
Da = 10 m Ha = 16 m Dal = 4 m
Hal = 15 m Dc = 12 m
Vt = 30.142 m3 Vn = 11.050 m3 Sb = 320 m2
Sp = 1.274 m2 Sn = 442 m2 St = 9.600 m2 (appross.)

5.3.2.3 Il rilievo acustico


Il rilievo acustico è stato condotto in due giornate consecutive: nella prima
sono state acquisite le risposte all’impulso monoaurali con la tecnica MLS durante
il normale orario di apertura della chiesa; nella seconda sono state acquisite le
risposte binaurali impiegando la tecnica dello sweep durante l’orario di minore
affollamento della chiesa in modo da minimizzare la presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 17,
campionata a 25.6 kHz, della durata di 5,12 s in modo da evitare problemi di time
aliasing, e ripetuta 32 volte in modo da migliorare il rapporto S/R. Lo sweep
utilizzato ha una durata di 15 s durante i quali la frequenza varia logaritmicamente
da 80 a 12000 Hz.
Data la sostanziale simmetria della chiesa e, considerate le sue dimensioni,
sono stati adottati otto punti di rilevazione posti in una sola metà dell’ambiente e
due punti di emissione posizionati entrambi nella parte centrale dell’area
presbiteriale (v. Figura 5.14).

5.3.2.4 Analisi dei risultati


L’osservazione dei risultati relativi ai tempi di riverberazione misurati per
bande di ottava, mostra (v. Figura 5.15) un andamento simile a quello osservato
da Shankland e Shankland [73] nelle basiliche romane. In particolare se per la
Basilica di San Nicola le basse frequenze apparivano attenuate dalla presenza del
soffitto ligneo e dalle grandi tele, in questo caso le basse frequenze risultano
essere molto accentuate. Si può dedurre, quindi, che il tetto ligneo a vista, con
capriate lignee risulta essere meno assorbente di quello riccamente decorato e,
probabilmente, più leggero della Basilica Nicolaiana; inoltre è da tenere in conto
la presenza, nella Cattedrale, della cupola e del tamburo che sono intonacati. È
interessante osservare poi il valore di T20 misurato a 4 kHz; esso è pari a 3,2 s,
quasi identico a quello rilevato nella Basilica (3,3 s), che ha un volume simile a
quello della Cattedrale, confermando, quindi, che alle alte frequenze
Capitolo 5 75

7,0 6,0
6,5

RT(500-1000 Hz) (s)


6,0 5,5
5,5
RT (s) 5,0 5,0

4,5
4,0 4,5

3,5
4,0
3,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.15 - Cattedrale di Bari. Andamento dei valori di T20 al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500
e 1000 Hz (destra).

7,0 5,8
6,5 5,6
5,4

EDT(500-1000 Hz) (s)


6,0
5,2
5,5
5,0
EDT (s)

5,0
4,8
4,5 4,6
4,0 4,4
3,5 4,2

3,0 4,0

B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.16 - Cattedrale di Bari. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).
l’assorbimento è in gran parte dovuto all’aria. I valori medi dei tempi di
riverberazione non appaiono influenzati significativamente dalla posizione della
sorgente.
L’analisi dell’andamento dei valori puntuali relativi alle medie frequenze,
mostra variazioni maggiori che nel caso precedente, con differenze di circa 0,5 s,
pari, in media, al 10% del valore. In particolare i valori più bassi dei tempi di
riverberazione possono essere osservati in corrispondenza dei punti più vicini alle
sorgenti, per effetto della prevalenza della componente diretta.
L’analisi dei tempi di primo decadimento EDT relativi alle sei bande di
ottava (v. Figura 5.16) mostra un andamento molto simile a quello osservato per il
T20, si osservano solo piccole differenze fra i valori medi relativi alle due diverse
posizioni della sorgente. Osservando l’andamento puntuale del parametro alle
medie frequenze, si può notare che nel punto 8, interno al transetto, il valore è più
basso della media. Ciò può essere dovuto sia ad una forte influenza del suono
diretto che alla presenza di riflessioni ravvicinate provenienti dalla parete del
transetto. Inoltre quando la sorgente è in A è possibile notare che il parametro
assume valori inferiori in corrispondenza dei punti della navata centrale e
maggiori per quelli della navata laterale. Quando invece la sorgente è in B i valori
appaiono più omogenei e le variazioni sono più contenute.
L’analisi dei valori medi del fattore di forza G valutati per le diverse bande
di ottava (v. Figura 5.17) rispecchia l’andamento dei tempi di riverberazione o,
più precisamente, quello dell’assorbimento presente nell’ambiente. Alle medie
frequenze risulta Gmid = 6,7 dB, mentre G(A) = 11,6 dB; pertanto il valore alle
76 Capitolo 5

10,0 16,0
9,0 14,0
8,0
12,0
7,0
10,0

G10 (dB)
6,0
G10 (dB)

5,0 8,0
4,0 6,0
3,0 4,0
2,0
2,0
1,0
0,0
0,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.17 - Cattedrale di Bari. Andamento dei valori di G al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500
e 1000 Hz e pesati in scala A (destra).

10,00 0,0

9,00 -2,0
8,00
-4,0
G10@1kHz

C80@1kHz
7,00
-6,0
6,00
-8,0
5,00
y = -4,83Ln(x) + 7,26
y = -2,78Ln(x) + 14,46 -10,0
4,00 R2 = 0,79
R2 = 0,92
3,00 -12,0
0,00 10,00 20,00 30,00 40,00 50,00 0,0 10,0 20,0 30,0 40,0 50,0
Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.18 - Cattedrale di Bari. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in funzione
della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei valori
secondo la teoria di Barron [11].
medie frequenze risulta alquanto superiore ai valori ottimali, mentre il valore
ponderato rientra in quelli fissati precedentemente. In ogni caso il lungo tempo di
riverberazione garantisce un notevole apporto di energia sonora, anche se, come
per la Basilica di San Nicola, buona parte di tale energia arriva tardi e pertanto
non contribuisce a migliorare la chiarezza. È interessante osservare che quando la
sorgente è in B l’indice G risulta inferiore rispetto a quando la sorgente è posta in
A. Ciò potrebbe essere imputabile sia alla maggiore distanza della sorgente B, sia
alla sua posizione non assiale. L’analisi dei valori puntuali mostra che la
differenza fra i livelli al variare della sorgente è sistematico, ad eccezione del
punto 8, e, inoltre, mostra che ad eccezione dei punti più vicini alle sorgenti, il
livello varia in maniera contenuta (di non più di 3 dB), garantendo una copertura
piuttosto uniforme. L’osservazione dei valori di G(A) mostra che in
corrispondenza delle navate laterali, specialmente con la sorgente in A, i livelli
sonori sono un po’ più bassi che nella navata centrale.
Diagrammando i valori di G a 1 kHz in funzione della distanza dalla
sorgente (v. Figura 5.18) appare evidente la diminuzione del livello al crescere
della distanza, si osserva poi che le differenze fra sorgente in A e in B divengono
assai marginali. Infine, confrontando l’andamento misurato con quello predetto
con la teoria di Barron [11] si vede che, come prima, la teoria sottostima i valori
per i punti più vicini e li sovrastima per quelli più lontani.
L’analisi dei valori medi della chiarezza misurati per bande di ottava (v.
Figura 5.19) mostra un andamento molto sfavorevole per la percezione dei
dettagli musicali e per l’intelligibilità del parlato. Come si era già osservato in San
Nicola si ha un picco negativo alle frequenze medio-basse che porta l’indice
Capitolo 5 77

sintetico C80(3) al valore di –7,3 dB, molto lontano dal valore minimo accettabile.
Ancora una volta si osserva una grande disparità fra i valori misurati con la
sorgente in A e la sorgente in B, in quest’ultimo caso essi appaiono più bassi (fino
a 3 dB). Diagrammando i valori ad 1 kHz in funzione della distanza (v. Figura
5.18) si osserva che quando la sorgente è in B essi risultano comunque inferiori
rispetto agli altri, pertanto non si può attribuire la differenza alla maggiore
distanza della sorgente. Una possibile spiegazione potrebbe essere una eventuale
interferenza con la balaustra che separa il presbiterio dalla navata, oppure
l’assorbimento di una parte dell’energia sonora da parte del coro ligneo con le
sedute rivestite di velluto.
L’analisi dell’andamento puntuale dell’indice sintetico mostra che ad
eccezione del punto 1 e del punto 8, con le sorgenti rispettivamente in A ed in B,
in tutti gli altri casi la chiarezza è troppo bassa per ottenere condizioni di ascolto
ottimali. Il confronto fra i valori in funzione della distanza e i valori predetti con
la teoria di Barron [11] mostra che questi ultimi risultano notevolmente
sovrastimati rispetto a quelli misurati; la motivazione potrebbe essere dovuta alla
attenuazione delle prime riflessioni a causa della struttura “complessa” della
chiesa.
L’analisi dei valori medi del tempo baricentrico alle varie frequenze (v.
Figura 5.20) mostra un andamento più regolare di quello della chiarezza e, anche,
più facilmente giustificabile in relazione all’andamento dei tempi di
riverberazione. Anche per questo indice quando la sorgente è posta in B i valori
medi appaiono più alti, corrispondenti quindi ad una minore chiarezza. La media

0,0 0,0
-1,0
-2,0 -2,0
-3,0
C80 (500-2k) (dB)

-4,0
-4,0
C80 (dB)

-5,0 -6,0
-6,0
-7,0 -8,0
-8,0
-10,0
-9,0
-10,0 -12,0
125 250 500 1000 2000 4000
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.19 - Cattedrale di Bari. Andamento dei valori di C80 al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500,
1000 e 2000 Hz (destra).

600 500

500 450

400
400
Ts (500-1k) (s)

350
Ts (s)

300
300
200
250
100 200

0 150
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

125 250 500 1000 2000 4000


Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.20 - Cattedrale di Bari. Andamento dei valori di Ts al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500
e 1000 Hz (destra).
78 Capitolo 5

50,0 0,90
0,85
45,0
0,80
40,0

Echo Criterion
0,75
STI/RASTI

35,0 0,70
0,65
30,0
0,60
25,0
0,55
20,0 0,50
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Posizioni dei ricevitori Posizioni dei ricevitori
STI RASTI EC_music EC_speech

Figura 5.21 - Cattedrale di Bari. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).
dei valori a 500 e 1000 Hz è pari a 416 ms che, in termini di giudizio soggettivo di
intelligibilità del parlato, risulta al limite fra “scarso” e “pessimo”. L’analisi dei
valori puntuali mostra che in buona parte di punti presi in considerazione i valori
oltrepassano il limite di 420 ms, corrispondente ad un giudizio di intelligibilità
“pessima”. È interessante osservare, inoltre, che l’andamento dei valori è molto
più regolare di quello mostrato dalla chiarezza.
L’analisi dell’andamento degli indici di intelligibilità mostra (v. Figura 5.21,
sinistra) che quando la sorgente è in A si hanno condizioni di ascolto “sufficienti”
solo nel punto 1, mentre nel punto 4 (navata laterale) le condizioni sono
“pessime”, in tutti i restanti punti si hanno condizioni “scarse”. Quando invece la
sorgente è in B le condizioni di intelligibilità sono “pessime” in tutti i punti meno
che in 8 dove si raggiungono condizioni “scarse”. Confrontando l’andamento del
RASTI con quello dello STI si osserva un generale accordo (R = 0,91), salvo per
alcuni punti in cui la scelta dell’uno o dell’altro parametro porta ad un diverso
giudizio soggettivo.
L’andamento dei criteri di eco (v. Figura 5.21, destra) mostra che per la
musica i valori sono ampiamente al disotto del valore critico, mentre per il
parlato, nel punto 7 (in fondo alla navata centrale) con la sorgente in B (in
allineamento) il valore arriva a 0,84, prossimo, ma comunque al disotto, del
limite.
Per quanto riguarda i parametri caratterizzanti il bilanciamento delle basse
frequenze, i loro valori sono i seguenti: BR = 1,23; BR_L = 1,45 dB; EBL = –3,3
dB. Si può osservare che il BR supera di poco il valore massimo consigliato da
Beranek [15], denotando una enfatizzazione delle basse frequenze. Analogamente
anche BR_L mostra un valore piuttosto elevato in accordo con l’incremento di BR;
al contrario EBL ha un valore molto simile a quello riscontrato nella Basilica di S.
Nicola, dove gli altri due parametri assumevano invece valori più bassi. In termini
di andamento puntuale per BR valgono le stesse considerazioni fatte in
precedenza, per cui si riporta il solo intervallo di variabilità, compreso fra 1,16 e
1,36. Degli altri due parametri, EBL varia fra –10,9 e 4,4 dB, mentre BR_L varia
fra –0,85 e 3,25 dB, mostrando una dinamica più estesa rispetto alla basilica di S.
Nicola. L’analisi dell’andamento puntuale dei parametri (v. Figura 5.22, sinistra)
mostra che i due indici variano, tendenzialmente, in modo opposto (R = –0,61). I
punti più sfavoriti secondo l’EBL risulterebbero quelli della navata laterale
quando la sorgente è posizionata in B, in tali casi il parametro raggiunge valori di
–11 dB circa, molto al disotto del valore di –4 dB indicato da Soulore e Bradley
come soglia inferiore. Infine, è poi possibile osservare una progressiva
diminuzione del parametro man mano che ci si allontana dalle sorgenti, con una
Capitolo 5 79

lieve ripresa verso il fondo della chiesa. Per BR_L si osserva, invece, un
comportamento opposto.
I valori medi degli indicatori del bilanciamento delle alte frequenze
risultano essere: TR = 0,69; LTR = –9,9 dB. Entrambi i valori appaiono bassi in
confronto ai limiti illustrati nel Capitolo 2, confermando che, in un ambiente
avente un volume molto grande, le alte frequenze sono inevitabilmente attenuate.
L’analisi dell’andamento puntuale, effettuata considerando che i valori minimi e
massimi sono 0,66 e 0,73 per TR e –10,4 e –9,5 dB per LTR, mostra fluttuazioni
piuttosto contenute e fa notare che i due parametri sono, seppur in modo poco
significativo, correlati negativamente (R = –0,41).
Passando a valutare i parametri per la misura dell’estensione apparente della
sorgente si ha che i loro valori medi sono (1–IACCE) = 0,62 e IADE = 0,32,
risultando, quindi, rispettivamente leggermente al disopra e leggermente al disotto
del limite ottimale. L’analisi dei valori puntuali (v. Figura 5.23) mostra una
elevata correlazione dei due indici (R = 0,75), particolarmente accentuata quando
la sorgente è posta in B (R = 0,93). In tale caso si evidenzia come i punti nella
navata centrale presentino sistematicamente valori più bassi rispetto a quelli della
navata laterale dove i segnali risultano essere meno correlati fra loro; il punto 8
(localizzato nel transetto) è invece quello che presenta il valore più basso, ma ciò
è prevedibile alla luce della posizione perfettamente frontale (e simmetrica) fra
sorgente e ricevitore. Quando la sorgente è in A le differenze fra navata centrale e
laterale appaiono più attenuate. Infine è da notare che per il punto 9, posto

1,00 1,0
0,90 0,9
Bilanciamento degli alti - Indici
Bilanciamento dei bassi

0,80 0,8
Indici normalizzati

0,70 0,7
normalizzati

0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

Combinazioni Sorg_Ric Combinazioni Sorg_Ric


EBR BR_l LTR TR

Figura 5.22 - Cattedrale di Bari. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.

0,90 0,20
0,80
0,00
Log(1-IACC) / IAD (dB)

0,70
0,60
(1-IACC) / IAD

-0,20
0,50
-0,40
0,40
0,30 -0,60
0,20
-0,80
0,10
0,00 -1,00
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore


1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.23 - Cattedrale di Bari. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
80 Capitolo 5

nell’abside centrale, i valori di entrambi i parametri risultano fra i più elevati, ciò
malgrado la posizione centrale e prossima alle sorgenti; ciò può spiegarsi con la
presenza del ciborio che si frappone tra sorgenti e ricevitore, determinando, per
effetto della diffrazione, una riduzione del grado di correlazione con cui i segnali
giungono alle orecchie.
Per quanto riguarda l’avvolgimento sonoro i parametri hanno i valori medi
pari a: 10Log(1–IACCL) = –0,48 dB e IADL = –0,30 dB. Il campo sonoro
dovrebbe, pertanto, risultare sufficientemente diffuso e, quindi, la sensazione di
avvolgimento essere elevata. L’andamento puntuale mostra una sostanziale
assenza di correlazione fra i due parametri e, inoltre, non si presta ad
interpretazioni particolari a causa dell’andamento quasi casuale da essi assunto.

5.3.3 La Cattedrale di S. Valentino a Bitonto

5.3.3.1 Cenni storici


La cattedrale di Bitonto (v. Figura 5.24) fu eretta sull’area di una chiesa
benedettina premillenaria e fu portata a termine in un periodo piuttosto breve, cioè
fra il 1175 e il 1200. Ciò può spiegare la perfetta unità e coerenza delle sue forme
che, comunque, riprendono nelle linee essenziali, tanto all’esterno che all’interno,
le due grandi chiese a matronei baresi. Rispetto a queste, anzi, la cattedrale
bitontina costituisce quasi un punto di arrivo dal momento che i principali temi
proposti nelle due chiese precedenti vengono qui compiutamente sviluppati e
armonizzati dalla composizione unitaria. Sottoposta durante il periodo barocco a
cospicue alterazioni (fra cui la trasformazione delle arcate laterali esterne in
cappelle gentilizie) è stata riportata nel suo stato originario da recenti restauri. Fra
gli elementi di maggior pregio architettonico sono da citare il portale principale, il
grande rosone e, all’interno, l’ambone, ritenuto fra i più belli della regione.

Figura 5.24 - Cattedrale di Bitonto. Vista della facciata principale


Capitolo 5 81

5.3.3.2 Descrizione
Internamente la chiesa si presenta con la consueta pianta a croce egizia, con
le tre navate concluse dal transetto rialzato e le tre absidi (v. Figura 5.25). Le
navate laterali, separate dalla centrale da due file di sei colonne monolitiche, sono
voltate a crociera e sono sovrastate dai matronei, che si aprono sulla navata
centrale mediante una teoria di trifore. I matronei sono coperti da una struttura
lignea a vista. Analogamente anche nella navata centrale e nel transetto la
copertura è a tetto con capriate molto fitte e decorate (scolpite e dipinte). Il
pavimento è in marmo con alcuni inserti in vetro spesso che permettono di
osservare i mosaici della chiesa preesistente. Le pareti sono in pietra calcarea a
vista, mentre le volte a crociera delle navate laterali sono intonacate. I banchi
lignei occupano solo una parte della navata centrale, mentre in corrispondenza
dell’ala sinistra del transetto sono disposte delle sedie in legno utilizzate per
l’adorazione eucaristica. Dal punto di vista decorativo la chiesa appare piuttosto
sobria, ma in corrispondenza di arcate e capitelli non mancano gli elementi
decorativi. Elementi di rilievo sono l’ambone, localizzato sulla prima colonna
destra che regge l’arco trionfale, e il fonte battesimale posto nella seconda
campata della navata laterale destra.
Le principali dimensioni sono riportate di seguito:
Wn = 9 m Ln = 32 m Hn = 22 m
Wl = 4,6 m Hl = 8 m Hm = 5 m
Wt = 24 m Lt = 10 m Ht = 22 m
Da = 7 m Ha = 15 m Dal = 3,8 m
Hal = 12 m
Vt = 16000 m3 Vn = 6340 m3 Sb = 113 m2
Sp = 858 m2 Sn = 288 m2 St = 5500 m2 (appross.)

5.3.3.3 Il rilievo acustico


Il rilievo acustico è stato condotto nel corso di una giornata, acquisendo le
risposte all’impulso monoaurali con la tecnica MLS durante il normale orario di
apertura della chiesa; le risposte binaurali sono state ottenute impiegando la

Figura 5.25 - Cattedrale di Bitonto. Pianta con indicazione dei punti di emissione (…) e di
ricezione ({). Scala 1:500.
82 Capitolo 5

tecnica dello sweep durante l’orario di chiusura della chiesa in modo da


minimizzare la presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 17,
campionata a 25,6 kHz, della durata di 5,12 s in modo da evitare problemi di time
aliasing, e ripetuta 32 volte in modo da migliorare il rapporto S/R. Lo sweep
utilizzato ha una durata di 6 s durante i quali la frequenza varia logaritmicamente
da 80 a 12000 Hz.
Data la sostanziale simmetria della chiesa e, considerate le sue dimensioni,
sono stati adottati sei punti di rilevazione posti in una sola metà dell’ambiente e
due punti di emissione posizionati entrambi nella parte centrale dell’area
presbiteriale che, in occasione di concerti, viene occupata dall’orchestra.

5.3.3.4 Analisi dei risultati


L’analisi dei tempi di riverberazione medi relativi alle diverse bande di
ottava (v. Figura 5.26) mostra il tipico andamento decrescente al crescere della
frequenza. In particolare da 500 Hz in su l’andamento è molto simile a quello
riscontrato nella cattedrale di Bari, mentre alle basse frequenze i valori appaiono
più bassi di quanto ci si poteva attendere. Ciò, potrebbe essere imputabile alla
particolare struttura lignea di copertura.
L’analisi dell’andamento puntuale dei valori medi relativi alle frequenze di
500 e 1000 Hz mostra una buona omogeneità del parametro, con variazioni più
significative (intorno a 0,7 s) particolarmente accentuate quando la sorgente si
trova in B. Per i punti a maggiore distanza dalle sorgenti le variazioni divengono
minime, anche fra punti posti nella navata centrale e punti delle navate laterali.
5,5 6,0

5,0 5,5
RT(500-1000 Hz) (s)

4,5
5,0
4,0
RT (s)

4,5
3,5
4,0
3,0
3,5
2,5
3,0
2,0
B_01

B_02

B_03

B_04

B_05

B_06
A_01

A_02

A_03

A_04

A_05

A_06

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.26 - Cattedrale di Bitonto. Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

5,0 5,5

4,5 5,0
EDT(500-1000 Hz) (s)

4,0
4,5
EDT (s)

3,5
4,0
3,0
3,5
2,5

2,0 3,0
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.27 - Cattedrale di Bitonto. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).
Capitolo 5 83

Prendendo in considerazione i valori medi del tempo di primo decadimento


EDT per le diverse bande di ottava (v. Figura 5.27) si osserva un andamento
analogo a quello mostrato dal T20 anche se i valori appaiono di poco inferiori.
Appare però interessante notare la differenza fra i valori relativi alle due diverse
posizioni della sorgente, infatti, quando la sorgente è in A l’EDT risulta sempre
più breve di quanto lo sia quando la sorgente è in B. Ciò può essere osservato
anche prendendo in considerazione l’andamento puntuale del parametro e può
essere spiegato considerando che quando la sorgente è in B il suono diretto viene
in parte attenuato dalla presenza dell’ambone: infatti, per il punto 06 che non è
influenzato dalla presenza di quest’ultimo i valori sono pressoché identici. Infine,
il confronto fra valori puntuali di EDT e di T20 conferma tale ipotesi, dal momento
che quando la sorgente è in A EDT risulta minore di T20, mentre quando la
sorgente è in B ciò accade solo per i punti più vicini alla sorgente (e quindi meno
influenzati dall’interferenza).
L’analisi dei valori medi di G alle diverse frequenze (v. Figura 5.28) mostra
un andamento che rispecchia quello dei tempi di riverberazione, confermando
quanto già si era osservato nelle due precedenti chiese. Tuttavia, in confronto ai
tempi di decadimento, le basse frequenze appaiono meno “depresse”. In termini di
indici sintetici risulta Gmid = 8,7 dB e G(A) = 13,6 dB, entrambi i valori sono
superiori a quelli osservati nelle due precedenti chiese, a conferma della
dipendenza di questo parametro dal volume (oltre che dall’assorbimento totale).
In confronto ai valori ottimali Gmid appare notevolmente superiore al valore
massimo, mentre G(A) lo supera di poco; ancora una volta il lungo tempo di
riverberazione determina un considerevole apporto energetico che, però, non
contribuisce all’intelligibilità del parlato. Si osserva che quando la sorgente è in B
il livello sonoro è, in genere, di circa 1 dB inferiore rispetto a quando la sorgente è
in A, come mostra anche l’analisi dei valori puntuali. Tale comportamento
potrebbe trovare spiegazione nella maggiore distanza dalla sorgente e
nell’interferenza prodotta dalla presenza dell’ambone. Osservando l’andamento di
G in funzione della distanza (v. Figura 5.29, sinistra) si può infatti notare che i
valori decrescono secondo la stessa regola e mostrano piccole differenze
imputabili alla presenza di ostacoli quali l’ambone o le colonne. Infine,
confrontando l’andamento dei valori rilevato con quello predetto dalla teoria di
Barron si riscontra, ancora una volta, che la teoria sottostima i valori nei punti più
vicini alla sorgente e sovrastima i valori nei punti più lontani.
12,0 18,0
16,0
10,0
14,0
8,0 12,0
G10 (dB)
G10 (dB)

10,0
6,0 8,0

4,0 6,0
4,0
2,0 2,0
0,0
0,0
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.28 - Cattedrale di Bitonto. Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).
84 Capitolo 5

12,00 1,0
11,00 0,0
-1,0
10,00
-2,0
9,00
G10@1kHz

C80@1kHz
-3,0
8,00 -4,0
7,00 -5,0
y = -3,28Ln(x) + 17,32 -6,0
6,00 y = -3,84Ln(x) + 6,10
R2 = 0,96 -7,0
5,00 R2 = 0,78
-8,0
4,00 -9,0
0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0

Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.29 - Cattedrale di Bitonto. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in


funzione della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei
valori secondo la teoria di Barron [11].

0,0 0,0
125 250 500 1000 2000 4000
-1,0 -1,0
-2,0
-2,0
C80 (500-2k) (dB)
-3,0
-3,0
-4,0
C80 (dB)

-4,0 -5,0
-5,0 -6,0

-6,0 -7,0
-8,0
-7,0
-9,0
-8,0
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.30 - Cattedrale di Bitonto. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).
Passando all’analisi dei valori della chiarezza in funzione della frequenza (v.
Figura 5.30), si osserva il consueto andamento a V con un picco negativo a 500
Hz e, ancora, si ripropone la disparità fra i valori relativi alle due posizioni della
sorgente con differenze, fra i valori medi, dell’ordine dei 2 dB. Le ragioni di tale
disparità possono ritenersi analoghe a quelle suggerite per il fattore di forza, solo
che l’analisi dei valori in funzione della distanza (v. Figura 5.29, destra) è meno
chiarificatrice dal momento che la chiarezza è molto influenzata da fattori
accidentali. In ogni caso l’indice sintetico C80(3) risulta pari a –4,9 dB, troppo
basso per consentire una percezione chiara della musica sinfonica, mentre a livello
puntuale il parametro raggiunge valori accettabili solo nei punti più vicini alla
sorgente. Infine il confronto con la teoria di Barron mostra dei valori misurati
sistematicamente inferiori a quelli predetti anche se, rispetto ai casi precedenti,
l’errore appare inferiore, probabilmente grazie alle dimensioni più contenute della
chiesa in esame.
Passando ad analizzare l’andamento del tempo baricentrico Ts, sia con
riferimento ai valori medi per bande di ottava che ai valori puntuali (v. Figura
5.31), è possibile trarre conclusioni analoghe a quelle tratte analizzando la
chiarezza, con l’unica differenza che, in questo caso, gli andamenti appaiono più
regolari e continui. In termini globali l’indice sintetico è pari a 310 ms, valore che
corrisponde, secondo la Tabella 2.3, ad una intelligibilità “scarsa”. A livello
puntuale è possibile notare che la condizioni migliori si hanno nei punti 01 e 06,
cioè vicino alle sorgenti.
Capitolo 5 85

400 400

350
350
300

Ts (500-1k) (s)
250 300
Ts (s) 200
150 250

100
200
50

0 150

A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06
125 250 500 1000 2000 4000
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.31 - Cattedrale di Bitonto. Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

50,0 0,80

45,0 0,75

40,0 0,70

Echo Criterion
STI/RASTI

35,0 0,65

30,0 0,60

25,0 0,55

20,0 0,50
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06

A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06
Posizioni dei ricevitori Posizioni dei ricevitori
STI RASTI EC_music EC_speech

Figura 5.32 - Cattedrale di Bitonto. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).
Considerando nello specifico gli indici di intelligibilità del parlato (v. Figura
5.32, sinistra), si ha la conferma di quanto anticipato dal Ts, infatti, solo nei punti
01 e 06 e quando la sorgente è in A si raggiungono condizioni “sufficienti”,
mentre in tutti gli altri casi l’intelligibilità è “scarsa”. È interessante notare la
disparità esistente fra STI e RASTI per la combinazione A_03. Ciò può essere
dovuto all’influenza di alcune delle bande di ottava non considerate dal RASTI, in
particolare si può notare che a 4000 Hz il C80 assume (v. Appendice A.3) un
valore positivo, segno di una maggiore chiarezza che viene, evidentemente, tenuta
in conto dallo STI.
Per quanto riguarda i criteri di eco (v. Figura 5.32, destra), non sono
necessarie considerazioni particolari, dal momento che, tanto per la musica che
per il parlato, i valori rilevati risultano ampiamente al di sotto dei valori limite.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,13; BR_L = 1,42 dB;
EBL = 0,44 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
BR ed EBL sono all’interno degli intervalli, mentre BR_L è lievemente superiore
al valore massimo. In termini puntuali BR risulta variare fra 1,02 e 1,21, coprendo
l’intero intervallo dei valori ottimali. L’osservazione dell’andamento punto per
punto degli altri parametri (v. Figura 5.33, sinistra) fornisce ulteriori informazioni.
Assunto che i valori minimi e massimi sono –4,7 e 7 dB per EBL, e –0,4 e 2,3 dB
per BR_L, si riscontra una discreta correlazione negativa (R = –0,70) che vede
EBL decrescere con la distanza mentre BR_L cresce.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –10,0 dB e TR = 0,71; pertanto entrambi i valori si pongono sul
limite inferiore degli intervalli di accettabilità. In termini puntuali si ha che LTR
86 Capitolo 5

varia fra –10,6 e –9,4 dB, mentre TR varia fra 0,62 e 0,75; l’andamento dei valori
(v. Figura 5.33 destra) evidenzia una correlazione negativa poco significativa
(R = –0,55), mentre le variazioni da punto a punto non sembrano seguire una
regola ben precisa.
Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei
descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,65,
e IADE = 0,40; pertanto risultano mediamente entro i limiti enunciati nel Capitolo
2. L’analisi dei valori puntuali (v. Figura 5.34, sinistra) mostra che i due parametri
sono piuttosto correlati (R = 0,67) e che i valori più bassi vengono assunti nei
punti più vicini alle sorgenti; inoltre quando la sorgente è posta sull’asse di
simmetria appaiono più accentuate le differenze fra navata centrale e navata
laterale.
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,44 dB, IADL = –0,18. A livello puntuale (v. Figura 5.34,
destra) si osserva una scarsa correlazione fra i due indici, un andamento più
regolare del coefficiente di correlazione interaurale rispetto alla IAD. Ancora una
volta i valori positivi sono dovuti all’utilizzo del parametro non normalizzato.

1,00 1,0
0,90 0,9
Bilanciamento dei bassi

0,80 0,8
Bilanciamento degli alti
Indici normalizzati

Indici normalizzati

0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06

A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06
Combinazioni Sorg_Ric Combinazioni Sorg_Ric
EBR BR_L LTR TR

Figura 5.33 - Cattedrale di Bitonto. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.

1,00 0,60
0,90
0,40
0,80
Log(1-IACC) / IAD (dB)

0,70 0,20
(1-IACC) / IAD

0,60
0,00
0,50
0,40 -0,20
0,30 -0,40
0,20
-0,60
0,10
0,00 -0,80
A_01

A_02

A_03

A_04

A_05

A_06

B_01

B_02

B_03

B_04

B_05

B_06

B_01

B_02

B_03

B_04

B_05

B_06
A_01

A_02

A_03

A_04

A_05

A_06

Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore


1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.34 - Cattedrale di Bitonto. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
Capitolo 5 87

5.3.4 La Cattedrale di Santa Maria Maggiore a Barletta

5.3.4.1 Cenni storici


Fondata sui resti di una antica basilica paleocristiana del IV secolo, la
cattedrale fu iniziata intorno al 1140, tuttavia essa fu consacrata solo molto più
tardi, nel 1262. Concepita in forme tipicamente romanico-pugliesi, con una
facciata suddivisa da lesene e timpano ad archetti rampanti (v. Figura 5.35), la
cattedrale fu prolungata nella parte posteriore in forme goticheggianti ai primi del
Trecento e, quindi, nel secolo successivo ampliata ancora nel presbiterio e
nell’abside pentagonale con cappelle radiali. Alla seconda fase dei lavori è ascritta
anche la costruzione del campanile aperto alla base, sul modello della cattedrale di
Trani. Nei secoli successivi le trasformazioni interessarono solo parti decorative
(come il portale centrale di ingresso, rimaneggiato in forme cinquecentesche), e le
cappelle laterali aggiunte nel XV e XVIII secolo. Nel corso del XVII secolo
numerose modifiche interessarono l’interno che venne pesantemente decorato con
la conseguente rimozione di molti degli arredi medievali. Due grossi restauri
avvenuti nel secolo scorso hanno però riportato la chiesa al suo aspetto originale,
ripristinando anche il ciborio del XII secolo (v. Figura 5.36).

Figura 5.35 - Cattedrale di Barletta. Facciata della chiesa.


88 Capitolo 5

Figura 5.36 - Cattedrale di Barletta. Viste interne, dall'ingresso verso l'altare (sinistra) e dall'abside
verso la navata (destra).

5.3.4.2 Descrizione
L’interno della chiesa è a tre navate ma, in seguito all’addizione trecentesca,
si differenzia dal tipico schema a T delle chiese finora analizzate (v. Figura 5.37).
La parte anteriore della chiesa, risalente al periodo romanico, è caratterizzata dal
colonnato con archi a doppia ghiera che si sviluppa per quattro campate. La
copertura è realizzata con capriate lignee nella navata centrale e con tetti a falda
su quelle laterali. Le colonne sono in granito e provengono dalle chiese
precedenti. Nella zona superiore si aprono finti matronei costruiti sul modello
della cattedrale di Bari. Dopo la quarta campata ha inizio la parte di edificio
coperta a volta (v. Figura 5.36): nella navata centrale le volte sono a crociera,
mentre in quelle laterali le volte sono a botte. In entrambi i casi esse sono
intonacate con le costolonature in pietra calcarea a vista, la stessa usata per le
murature e per i robusti pilastri che sostengono le volte. A volta è coperta anche la
terminazione absidale con le cinque cappelle radiali. Il pavimento è in marmo
levigato ed è occupato dai banchi lignei solo in corrispondenza della navata
centrale.
Le principali dimensioni sono riportate di seguito:
Wn = 9 m Ln = 46 m Hn = 25/17 m
Wl = 4,8 m Hl = 12 m Hm = 5 m

Vt = 15.850 m3 Vn = 8.700 m3 Sb = 110 m2


Sp = 912 m2 Sn = 414 m2 St = 5.500 m2 (appross.)

5.3.4.3 Il rilievo acustico


Il rilievo acustico è stato condotto nel corso di una giornata, acquisendo le
risposte all’impulso monoaurali con la tecnica MLS durante il normale orario di
apertura della chiesa; le risposte binaurali sono state ottenute impiegando la
Capitolo 5 89

Figura 5.37 - Cattedrale di Barletta. Pianta con indicazione dei punti di emissione (…) e di
ricezione ({). Scala 1:500.
tecnica dello sweep durante l’orario di chiusura della chiesa in modo da
minimizzare la presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 18,
campionata a 25,6 kHz, della durata di 10,24 s, in modo da evitare problemi di
time aliasing dovuti al lungo tempo di riverberazione, e ripetuta 32 volte in modo
da migliorare il rapporto S/R. Lo sweep utilizzato ha una durata di 6 s durante i
quali la frequenza varia logaritmicamente da 80 a 12000 Hz.
Sono stati adottati nove punti di rilevazione distribuiti in modo da garantire
una copertura significativa dell’ambiente, e due punti di emissione posizionati
entrambi nella parte centrale dell’area presbiteriale.

5.3.4.4 Analisi dei risultati


L’analisi dei tempi di riverberazione medi, misurati per bande di ottava (v.
Figura 5.38), evidenzia la caratteristica peculiare di questa chiesa, cioè il suo
lungo tempo di riverberazione che varia dai 7,9 s a 125 Hz ai 3,8 s a 4 kHz, con
un valore alle medie frequenze di 6,8 s. Se si tiene conto che il volume stimato
non differisce molto da quello della cattedrale di Bitonto si conclude che
l’incremento di circa 3 secondi non può che essere dovuto al diverso tipo di
copertura che è in buona parte a volta e intonacata. Inoltre, la parte con copertura
lignea è caratterizzata da una maggiore altezza media in navata (circa 25 m) che
contribuisce a ridurre l’influenza dell’unica superficie assorbente presente nella
chiesa. L’andamento frequenza per frequenza ripropone quello osservato nelle
altre chiese risultando, anzi, più regolare e più simile alle curve proposte in [73].
La diversa posizione della sorgente sembra non influire sui tempi di
riverberazione dal momento che, in termini di valori medi, non appaiono
differenze se non, minime, a 125 Hz. L’analisi dell’andamento dei valori puntuali,
90 Capitolo 5

9,0 8,0

8,0 7,5

RT(500-1000 Hz) (s)


7,0
7,0
RT (s)

6,0
6,5
5,0
6,0
4,0

5,5
3,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.38 - Cattedrale di Barletta. Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

9,0 8,0

8,0 7,5

7,0 EDT(500-1000 Hz) (s)


7,0
EDT (s)

6,0
6,5
5,0
6,0
4,0

3,0 5,5
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.39 - Cattedrale di Barletta. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).
relativamente alle medie frequenze, mostra una notevole omogeneità dei valori,
con differenze massime dell’ordine del 4%.
L’analisi dei tempi di primo decadimento (v. Figura 5.39) riassunti per
bande di ottava non mostra differenze significative rispetto al T20, solo a 1 e 2
kHz i valori appaiono di 0,2 s più elevati. Questa piccola differenza può essere
interpretata osservando l’andamento puntuale di EDT confrontato con quello di
T20. Si nota infatti che, nei punti più vicini alle sorgenti, EDT è più breve, mentre
diviene più lungo di T20 in corrispondenza dei punti più distanti o schermati, in cui
il suono diretto risulta progressivamente attenuato.
L’andamento del fattore di forza G alle varie frequenze (v. Figura 5.40)
rispecchia l’assorbimento presente nell’ambiente e mostra, pertanto, una
diminuzione verso le ottave più alte analoga a quella vista per i tempi di
decadimento. In termini di indici sintetici si ha Gmid = 10,6 dB e G(A) = 15,2 dB;
entrambi i valori, quindi, risultano al di fuori dei rispettivi intervalli di variabilità
ottimali. Inoltre un tale apporto energetico è prevalentemente dovuto alla lunga
coda riverberante e, di conseguenza, non contribuisce in alcun modo a migliorare
l’intelligibilità del parlato. A conferma del ruolo preminente svolto dal campo
riverberante si può osservare che, al contrario di quanto osservato nelle altre
chiese, la differenza fra i valori medi relativi alle due diverse posizioni delle
sorgenti è del tutto trascurabile. L’analisi dei valori puntuali degli indici sintetici
mostra che il livello decresce allontanandosi dalla sorgente e che la massima
differenza è di circa 5 dB fra il punto più vicino ed il punto più lontano; inoltre
non si riscontrano differenze significative fra punti della navata centrale e punti
Capitolo 5 91

13,0 20,0

12,0 18,0
11,0 16,0
10,0

G10 (dB)
14,0
G10 (dB) 9,0
12,0
8,0
10,0
7,0
8,0
6,0
6,0
5,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.40 - Cattedrale di Barletta. Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).

15,00 -2,0
14,00 -4,0
13,00
-6,0
12,00
G10@1kHz

C80@1kHz
11,00 -8,0
10,00 -10,0
9,00
-12,0
8,00 y = -5,73Ln(x) + 6,15
y = -3,78Ln(x) + 21,81 -14,0
7,00 R2 = 0,88
R2 = 0,86
6,00 -16,0
0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0

Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.41 - Cattedrale di Barletta. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in


funzione della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei
valori secondo la teoria di Barron [11].

-5,0 -8,0
-6,0 -9,0
-7,0
-10,0
C80 (500-2k) (dB)

-8,0
-11,0
C80 (dB)

-9,0
-12,0
-10,0
-11,0 -13,0

-12,0 -14,0
-13,0 -15,0
-14,0 -16,0
125 250 500 1000 2000 4000
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.42 - Cattedrale di Barletta. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).
delle navate laterali. Tracciando i valori di G in funzione della distanza (v. Figura
5.41, sinistra) si osserva il consueto andamento che, confrontato con il modello
teorico di Barron, conferma che la teoria sottostima i valori in prossimità della
sorgente e sovrastima quelli distanti.
In una chiesa caratterizzata da un tempo di riverberazione molto lungo la
chiarezza non potrà che assumere valori molto bassi, infatti l’indice sintetico C80(3)
risulta pari a –11,4 dB, valore incompatibile finanche con la musica organistica
(v. Figura 2.5). L’andamento in funzione della frequenza (v. Figura 5.42) è simile
a quello rilevato in altre chiese, ma la curva risulta traslata verso il basso. Si
riscontra una differenza di circa 1 dB fra i valori relativi alle due posizioni della
92 Capitolo 5

sorgente, ma dal confronto con la Figura 5.41 (destra) si può concludere che tale
differenza è imputabile al solo effetto della maggiore distanza della sorgente B dai
punti di misura. L’andamento puntuale di C80(3) appare piuttosto regolare, con una
progressiva diminuzione dell’indice fino a –15 dB. Uniche eccezioni sono i punti
3 e 8 in cui si osserva, per entrambe le posizioni della sorgente, un picco,
giustificabile con la presenza di prime riflessioni provenienti dalle vicine pareti
(laterali e di fondo). Il confronto con i valori predetti con la teoria di Barron
mostra che questi ultimi sovrastimano notevolmente i valori misurati che
appaiono decrescere con una pendenza molto più accentuata di quella teorica.
Analizzando i risultati relativi al tempo baricentrico (v. Figura 5.43) è
possibile trarre conclusioni analoghe a quelle tratte dall’analisi della chiarezza. Si
evidenzia in particolare la minore influenza della posizione della sorgente con
differenze massime dell’ordine del 5%. Il valore medio sintetico è pari a 591 ms,
mentre i valori puntuali variano fra 467 e 662 ms, denotando, pertanto, condizioni
ovunque pessime per l’ascolto e la comprensione della parola.
L’analisi dell’andamento dei valori puntuali degli indici di intelligibilità del
parlato (v. Figura 5.44, sinistra) conferma quanto anticipato dal Ts, infatti tanto lo
STI che il RASTI risultano ovunque inferiori a 30 (fa eccezione il punto 1 con la
sorgente in A dove lo STI risulta di poco superiore), corrispondenti quindi ad un
giudizio soggettivo “pessimo”. È interessante osservare la disparità esistente fra i
valori di STI e RASTI, imputabile alle considerevoli differenze esistenti fra le
diverse bande di ottava per cui il RASTI, che si basa solo sulle bande di 500 e
2000 Hz, assume valori molto fluttuanti e dissimili dallo STI che, invece, è più

700 700
650
600 650

550
Ts (500-1k) (s)

600
500
Ts (s)

450
550
400
350 500
300
250 450
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

125 250 500 1000 2000 4000


Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.43 - Cattedrale di Barletta. Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

32,0 1,00
0,95
30,0
0,90

28,0 0,85
Echo Criterion
STI/RASTI

0,80
26,0 0,75
0,70
24,0
0,65
0,60
22,0
0,55
20,0 0,50
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

Posizioni dei ricevitori Posizioni dei ricevitori


STI RASTI EC_music EC_speech

Figura 5.44 - Cattedrale di Barletta. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).
Capitolo 5 93

1,00 1,0
0,90 0,9
0,80 0,8

Bilanciamento dei bassi

Bilanciamento degli alti


Indici normalizzati

Indici normalizzati
0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
Combinazioni Sorg_Ric Combinazioni Sorg_Ric
EBR BR_L LTR TR

Figura 5.45 - Cattedrale di Barletta. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.
continuo nella sua diminuzione. In ogni caso, mediamente i due parametri
assumono valori molto simili: 24,2 lo STI e 24,9 il RASTI.
Per quanto riguarda i criteri di eco (v. Figura 5.44, destra) appare evidente
che, nei punti analizzati, i valori misurati risultano inferiori ai limiti fissati nel
Capitolo 2, e quindi, tanto per la musica che per il parlato, la chiesa appare
immune da echi.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,16; BR_L = 1,40 dB;
EBL = –3,7 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
BR ed EBL sono all’interno degli intervalli, mentre BR_L è lievemente superiore
al valore massimo. In termini puntuali BR risulta variare fra 1,10 e 1,23, coprendo
quindi la parte alta dell’intervallo ottimale. L’osservazione dell’andamento punto
per punto degli altri parametri (v. Figura 5.44, sinistra) fornisce ulteriori
informazioni. Assunto che i valori minimi e massimi sono –9,5 e 1 dB per EBL, e
0,8 e 2,3 dB per BR_L, si riscontra una correlazione negativa poco significativa
(R = –0,39) che vede EBL decrescere con la distanza e all’interno delle navate
laterali, mentre BR_L non appare seguire un andamento regolare.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –10,7 dB e TR = 0,63; pertanto entrambi i valori sono al disotto dei
limiti di accettabilità. In termini puntuali si ha che LTR varia fra –11,4 e –9,7 dB,
mentre TR varia fra 0,59 e 0,68, mostrando che in nessun punto vengono
raggiunte condizioni soddisfacenti. È evidente che essendo i tempi di
riverberazione molto lunghi alle medie frequenze, l’effetto di assorbimento
dell’aria è più rilevante, determinando una attenuazione relativa delle alte
frequenze più significativa. L’andamento dei valori (v. Figura 5.33 destra)
evidenzia una correlazione negativa piuttosto evidente (R = –0,84), mentre le
variazioni da punto a punto non sembrano seguire una regola ben precisa.
Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei
descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,69,
e IADE = 0,37; pertanto risultano mediamente entro i limiti enunciati nel Capitolo
2. L’analisi dei valori puntuali (v. Figura 5.46, sinistra) mostra che i due parametri
sono poco correlati (R = 0,51), inoltre appare meno evidente la differenza fra
punti vicini e punti lontani dalle sorgenti e fra punti della navata centrale e delle
navate laterali.
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,44 dB, IADL = –0,30, risultando simili a quelli rilevati nella
94 Capitolo 5

0,90 0,00
0,80
-0,10
0,70

Log(1-IACC) / IAD (dB)


-0,20
0,60
(1-IACC) / IAD

0,50 -0,30
0,40 -0,40
0,30
-0,50
0,20
0,10 -0,60

0,00 -0,70
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore
1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.46 - Cattedrale di Barletta. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
cattedrale di Bari. Pertanto a fronte di un tempo di riverberazione più lungo la
diffusione, misurata da questi parametri, non appare incrementata. A livello
puntuale (v. Figura 5.46, destra) si osserva una scarsa correlazione fra i due indici,
e una fluttuazione piuttosto accentuata.

5.3.5 La Cattedrale di San Pietro a Bisceglie

5.3.5.1 Cenni storici


La Cattedrale (v. Figura 5.47) fu fondata nel 1073 dal conte normanno
Pietro II che la dedicò a S. Pietro, e fu terminata e consacrata solo nel 1295. Al
1167 risale, a seguito del ritrovamento delle reliquie di alcuni martiri, la
realizzazione della cripta. La parte più antica è rappresentata dal corpo absidale,
caratterizzato dalla presenza della sola abside centrale (quelle laterali non furono
realizzate probabilmente a causa della preesistenza di uno dei campanili), e
insolitamente più basso del corpo longitudinale delle navate costruito
successivamente. La facciata, oggi viziata dal finestrone barocco, concludeva, con
le sue forme tipicamente romanico-pugliesi, la composizione. Alla metà del ’700
e ai primi dell’800 risalgono i lavori di trasformazione dallo stile romanico al
barocco: fu demolito il tetto del matroneo, che rimase totalmente chiuso; furono
aperte finestre sui fianchi della navata centrale; fu demolita la quinta posteriore,
con un taglio di muri a partire dal centro del rosone della facciata; fu costruita la
cupola e la navata centrale fu coperta con una finta volta a botte. In questo periodo
fu aggiunta inoltre una cappella laterale ed un secondo campanile, mentre quello
esistente venne sopraelevato. Recenti restauri, condotti fra il 1965 e il 1977,
hanno rimesso in luce, lì dove possibile, le strutture medievali, evidenziando,
inoltre, le diverse fasi costruttive. Ciò ha comportato la demolizione della cupola,
la rimozione della finta volta a botte e la totale ricostruzione dei matronei.

5.3.5.2 Descrizione
La chiesa presenta all’interno il consueto impianto basilicale a tre navate (v.
Figura 5.48) divise da pilastri con semicolonne addossate. Sopra gli arconi si
innalza il matroneo scandito dalle trifore. Le navate laterali sono coperte a volta,
mentre la navata centrale è coperta da capriate in larice. La copertura dei matronei
è pure in legno. Tutte le pareti sono in pietra lasciata a vista. Solo la cappella
laterale risulta intonacata. Il pavimento è in marmo ed è coperto, abbastanza
fittamente nella navata centrale, dai banchi lignei. Il transetto, di dimensioni
contenute e senza ali aggettanti al di fuori della sagoma della chiesa, è
Capitolo 5 95

ulteriormente delimitato dalla presenza sui due lati di un coro ligneo


cinquecentesco con tre ordini di posti (alto circa 3,5 m). Il coro è in noce
massiccio ed è completamente ricoperto di fregi in rilievo. Infine, il pavimento
dell’area presbiteriale è quasi completamente coperto da tappeti di modesto
spessore, con una superficie complessiva di 60 m2.
Le principali dimensioni sono riportate di seguito:
Wn = 10 m Ln = 20,5 m Hn = 21,8 m
Wl = 3,8 m Hl = 9,5 m Hm = 3,8 m
Wt = 17,4 m Lt = 8,5 m Ht = 21,7 m
Da = 8 m Ha = 15,5 m

Vt = 10.150 m3 Vn = 4.470 m3 Sb = 122 m2


Sp = 534 m2 Sn = 205 m2 St = 4.000 m2 (appross.)

Figura 5.47 - Cattedrale di Bisceglie. Immagini della facciata principale (sinistra) e dell'interno
della chiesa (destra).

5.3.5.3 Il rilievo acustico


Il rilievo acustico è stato condotto nel corso di una giornata, acquisendo le
sia le risposte all’impulso monoaurali (con la tecnica MLS) che le risposte
binaurali (con la tecnica dello sweep) durante l’orario di chiusura della chiesa in
modo da minimizzare la presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 17,
campionata a 25,6 kHz, della durata di 5,12 s in modo da evitare problemi di time
aliasing, e ripetuta 32 volte in modo da migliorare il rapporto S/R. Lo sweep
utilizzato ha una durata di 6 s durante i quali la frequenza varia logaritmicamente
da 80 a 12000 Hz.
Date le modeste dimensioni della chiesa, sono stati adottati sette punti di
rilevazione disposti in modo da coprire in modo abbastanza uniforme la superficie
utile e due punti di emissione, uno posto al centro del presbiterio ed uno in
corrispondenza del coro ligneo (v. Figura 5.48).
96 Capitolo 5

Figura 5.48 - Cattedrale di Bisceglie. Sezioni e pianta. In pianta sono indicati i punti di emissione
(…) e di ricezione ({). Scala 1:500.

5.3.5.4 Analisi dei dati


Da quanto visto nella descrizione, la cattedrale di Bisceglie ha delle
caratteristiche che la rendono piuttosto diversa dalle altre chiese analizzate finora
e da quelle che seguiranno. Tale differenza risiede principalmente nella presenza
di materiali assorbenti nell’area presbiteriale e nella più fitta disposizione dei
banchi nella navata centrale. Nel seguito si vedrà in che modo tali diversità
influenzano i parametri acustici.
L’analisi dei tempi di riverberazione medi per banda di ottava (v. Figura
5.49) mostra un andamento piuttosto diverso da quello riscontrato nelle altre
Capitolo 5 97

chiese, infatti, i valori di T20 sembrano decrescere quasi linearmente al crescere


della frequenza, mostrando la presenza di un assorbimento “in eccesso” in
corrispondenza delle frequenze medio-alte. La diversa posizione della sorgente
non determina variazioni apprezzabili in termini di valori medi. Più interessante
risulta l’osservazione dell’andamento puntuale (alle medie frequenze), da cui si
evince una buona omogeneità dei tempi quando la sorgente è in A, mentre quando
la sorgente è in B appaiono differenze significative (intorno al 20%) fra il punto 7
e i rimanenti. Questa differenza appare in modo ancora più evidente prendendo in
considerazione l’EDT (v. Figura 5.50) che presenta variazioni ancora più
accentuate (meno del 30%) in entrambe le posizioni della sorgente. Tale
comportamento non è tuttavia anomalo, in quanto già evidenziato nelle altre
chiese, ed è dovuto all’influenza del suono diretto che, nei punti più vicini alle
sorgenti, è più intenso. Invece il fatto che T20 risulti anch’esso inferiore alla media
può essere dovuto a diverse cause. In primo luogo al fatto sia la sorgente che il
ricevitore sono posti in prossimità di superfici assorbenti (il coro e i tappeti),
inoltre questi stessi materiali potrebbero essere responsabili di un comportamento
autosufficiente del transetto rispetto alle navate dovuto ad un accoppiamento
acustico parziale dei due volumi. Tuttavia la seconda ipotesi avrebbe dovuto
essere confermata da un più basso valore di T20 per la combinazione A_07,
pertanto è da ritenersi meno probabile. L’analisi dei valori medi di EDT per bande
di ottava evidenzia solo piccole differenze alle frequenze più basse.

5,0 5,0

4,5 4,5
RT(500-1000 Hz) (s)

4,0 4,0
RT (s)

3,5 3,5

3,0 3,0

2,5 2,5

2,0
2,0
A_01

A_02

A_03
A_04

A_05
A_06

A_07

B_01
B_02

B_03

B_04

B_05
B_06

B_07
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.49 - Cattedrale di Bisceglie. Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

5,0 5,0

4,5 4,5
EDT(500-1000 Hz) (s)

4,0 4,0
EDT (s)

3,5 3,5

3,0 3,0

2,5 2,5

2,0 2,0
A_01

A_02
A_03
A_04
A_05
A_06

A_07

B_01
B_02
B_03

B_04
B_05

B_06
B_07

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.50 - Cattedrale di Bisceglie. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).
98 Capitolo 5

Passando ad analizzare le caratteristiche acustiche in termini di livello


sonoro, ovvero di fattore di forza G, si osserva che i valori medi seguono un
andamento decrescente al crescere della frequenza (v. Figura 5.51), analogo a
quello dei tempi di decadimento. I descrittori sintetici risultano pari a Gmid = 10,4
dB, e G(A) = 15,7 dB e, pertanto, risultano più elevati dei valori massimi
consigliati e molto simili ai valori rilevati nella cattedrale di Barletta. È
interessante osservare come in una chiesa avente un volume di circa il 50% più
grande, un tempo di riverberazione doppio consenta di avere lo stesso livello
sonoro. In termini di comprensione del parlato e di chiarezza della musica le cose
cambiano drasticamente, come si vedrà di seguito. La differenza sistematica
esistente fra i valori relativi alle due posizioni della sorgente è dovuta alla
maggiore distanza della sorgente B da tutti i ricevitori, infatti tracciando i valori in
funzione della distanza (v. Figura 5.52, sinistra), non si notano differenze
significative. L’andamento puntuale degli indici sintetici mostra dei picchi in
corrispondenza dei punti 1 e 7, dovuti alla forte componente diretta, mentre ad
una certa distanza dalla sorgente (superati i 10 m) la diminuzione diviene meno
accentuata seppure sempre più accentuata di quanto previsto dalla teoria di Barron
che, ancora una volta, sottostima per i punti vicini e sovrastima per quelli lontani.
Analizzando i valori della chiarezza alle varie frequenze (v. Figura 5.53) si
osserva un picco negativo a 250 Hz ed un incremento quasi costante al crescere
della frequenza. Il valore sintetico è pari a –4,5 dB, che è basso, ma risulta idoneo
almeno per la musica organistica. Si riscontrano differenze fra i valori relativi alle

14,0 20,0

13,0 18,0
12,0 16,0
11,0
G10 (dB)

14,0
G10 (dB)

10,0
12,0
9,0
10,0
8,0
8,0
7,0
6,0
6,0
A_01

A_02
A_03

A_04

A_05
A_06

A_07
B_01

B_02
B_03

B_04

B_05
B_06

B_07

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.51 - Cattedrale di Bisceglie. Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).

15,0 4,0
14,0 2,0
13,0
0,0
12,0
G10@1kHz

C80@1kHz

11,0 -2,0
10,0 -4,0
9,0
y = -3,92Ln(x) + 20,10 -6,0
8,0
R2 = 0,85 y = -5,68Ln(x) + 9,94
-8,0
7,0 R2 = 0,64
6,0 -10,0
0,0 5,0 10,0 15,0 20,0 25,0 30,0 0,0 5,0 10,0 15,0 20,0 25,0 30,0
Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.52 - Cattedrale di Bisceglie. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in


funzione della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei
valori secondo la teoria di Barron [11].
Capitolo 5 99

0,0 4,0
-1,0 2,0
-2,0
0,0

C80 (500-2k) (dB)


-3,0
C80 (dB)
-2,0
-4,0
-4,0
-5,0

-6,0 -6,0

-7,0 -8,0

-8,0 -10,0
125 250 500 1000 2000 4000

A_01
A_02

A_03
A_04
A_05

A_06

A_07
B_01

B_02
B_03
B_04
B_05

B_06
B_07
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.53 - Cattedrale di Bisceglie. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).

450 400

400 350
350
300

Ts (500-1k) (s)
300
Ts (s)

250
250
200
200

150 150

100 100
A_01

A_02

A_03

A_04

A_05

A_06

A_07

B_01

B_02

B_03

B_04

B_05

B_06

B_07
125 250 500 1000 2000 4000
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.54 - Cattedrale di Bisceglie. Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).
due sorgenti, in particolare alle alte frequenze. Ciò può essere dovuto alla
maggiore distanza della sorgente B dai ricevitori ma, anche, alla sua posizione
prossima ad una superficie molto diffondente. Analizzando l’andamento puntuale
dell’indice sintetico si nota l’andamento decrescente al crescere della distanza e,
soprattutto, il picco in corrispondenza del punto 7 imputabile al contributo di forti
riflessioni iniziali provenienti dal pavimento e dalla parete posteriore del coro
ligneo. L’anomalia in tale punto può essere evidenziata anche in Figura 5.52
(destra) dove si osserva che i due valori si pongono nettamente al di sopra della
curva di interpolazione. La curva dei valori teorici di Barron sovrastima, ancora
una volta, i valori misurati.
Il tempo baricentrico ha un andamento per bande di ottava (v. Figura 5.54)
affine a quello dei tempi di decadimento; il valore medio sintetico è pari a 272 ms,
uno dei più bassi riscontrati sinora, che denota caratteristiche migliori per
l’ascolto del parlato. A livello puntuale l’andamento dell’indice sintetico è quasi
perfettamente duale di quello della chiarezza, infatti il coefficiente di correlazione
fra i valori dei due parametri è pari a –0,98. Di conseguenza valgono le
considerazioni fatte in precedenza.
Gli indici di intelligibilità, concordemente con i descrittori precedentemente
illustrati, assumono valori più elevati, risultando STI = 38,6 e RASTI = 39,3,
denotando un comportamento più idoneo (seppur ancora “scarso”) nei confronti
dell’intelligibilità della parola. L’andamento puntuale dei due parametri (v. Figura
5.55, sinistra) mostra un significativo accordo fra i due (R = 0,98), nonché fra STI
e Ts per cui risulta R = –0,91. Si sottolinea infine che nel punto 1 con la sorgente
in A e nel punto 7 si raggiungono anche livelli “sufficienti” di intelligibilità,
100 Capitolo 5

infatti le funzioni feriali vengono celebrate con i fedeli raccolti nelle prime file di
banchi e senza l’ausilio di impianti di amplificazione.
L’analisi dei criteri di eco non evidenzia problemi particolari dal momento
che entrambi i parametri risultano sempre inferiori ai valori limite.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,29; BR_L = 1,16 dB;
EBL = 3,7 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
EBL è all’interno dell’intervallo, mentre BR e BR_L sono lievemente superiori ai
rispettivi valori massimi. In termini puntuali BR risulta variare fra 1,16 e 1,48,
risultando spesso al di fuori dell’intervallo ottimale, come era peraltro prevedibile
dall’andamento dei valori medi dei tempi di riverberazione. L’osservazione
dell’andamento punto per punto degli altri parametri (v. Figura 5.56, sinistra)
fornisce ulteriori informazioni. Assunto che i valori minimi e massimi sono –7,9 e
13,5 dB per EBL, e 0,0 e 3,1 dB per BR_L, si riscontra una correlazione negativa
poco significativa (R = –0,51) che vede EBL decrescere con la distanza, mentre
BR_L appare crescere con la distanza e decrescere nelle navate laterali.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –9,0 dB e TR = 0,74; pertanto entrambi i valori sono nei limiti di
accettabilità. In termini puntuali (v. Figura 5.56, destra) si ha che LTR varia fra
–9,4 e –8,5 dB, mentre TR varia fra 0,68 e 0,80, mostrando che il maggiore
assorbimento presente alle medie frequenze consente di avere in numerosi punti
condizioni soddisfacenti. Infine, i due parametri appaiono poco correlati fra loro.

60,0 0,95
55,0 0,90

50,0 0,85
0,80
Echo Criterion

45,0
STI/RASTI

0,75
40,0
0,70
35,0
0,65
30,0 0,60
25,0 0,55
20,0 0,50
A_01

A_02

A_03
A_04
A_05
A_06
A_07

B_01
B_02

B_03

B_04
B_05
B_06

B_07

A_01

A_02

A_03
A_04

A_05
A_06

A_07
B_01

B_02
B_03

B_04

B_05
B_06

B_07

Posizioni dei ricevitori Posizioni dei ricevitori


STI RASTI EC_music EC_speech

Figura 5.55 - Cattedrale di Bisceglie. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).

1,00 1,0
0,90 0,9
0,80 0,8
Bilanciamento dei bassi

Bilanciamento degli alti


Indici normalizzati
Indici normalizzati

0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
B_01
B_02

B_03

B_04
B_05

B_06
B_07

B_01

B_02

B_03

B_04

B_05

B_06

B_07
A_01

A_02

A_03

A_04
A_05

A_06
A_07

A_01

A_02

A_03

A_04

A_05

A_06

A_07

Combinazioni Sorg_Ric Combinazioni Sorg_Ric


EBR BR_l LTR TR

Figura 5.56 - Cattedrale di Bisceglie. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.
Capitolo 5 101

Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei


descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,67,
e IADE = 0,39; pertanto risultano mediamente entro i limiti enunciati nel Capitolo
2. L’analisi dei valori puntuali (v. Figura 5.46, sinistra) mostra che i due parametri
sono piuttosto correlati (R = 0,76), inoltre appare evidente (soprattutto con la
sorgente in A) la differenza fra punti vicini e punti lontani dalle sorgenti e fra
punti della navata centrale e delle navate laterali. Nel punto 1 e nel punto 7 i
parametri assumono i valori minimi, a testimonianza del fatto che i segnali
binaurali che giungono in quei punti sono assai simili fra loro e quindi forniscono
una percezione del suono priva di profondità.
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,50 dB, IADL = –0,41, assumendo i valori più bassi finora
osservati. Ciò denota l’instaurarsi di un campo sonoro meno diffuso, soprattutto in
corrispondenza del transetto dove (v. Figura 5.46, destra), nel punto 7, entrambi i
parametri raggiungono valori minimi.
0,90 0,00
0,80
-0,20

Log(1-IACC) / IAD (dB)


0,70
0,60
(1-IACC) / IAD

-0,40
0,50
-0,60
0,40
0,30 -0,80
0,20
0,10 -1,00

0,00 -1,20
A_01
A_02
A_03
A_04
A_05
A_06
A_07
B_01
B_02
B_03
B_04
B_05
B_06
B_07

B_01
B_02
B_03
B_04
B_05
B_06
B_07
A_01
A_02
A_03
A_04
A_05
A_06
A_07
Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore
1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.57 - Cattedrale di Bisceglie. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).

5.3.6 La Cattedrale di Santa Maria Assunta a Ruvo

5.3.6.1 Cenni storici


La costruzione della celebre cattedrale di Ruvo fu iniziata nel 1070 dal
vescovo Gilberto, su una preesistente basilica a tre navate. Il rosone fu completato
nel 1237. La nuova chiesa conobbe continue modifiche che videro l’aggiunta, mai
conclusa, dei matronei, l’elevazione della navata centrale e, fra ‘500 e ‘600, lo
spostamento delle pareti a filo del transetto per la realizzazione di cappelle. Sul
finire dell’800, tuttavia, fu sottoposta a restauri che la riportarono alle sue
originarie forme romaniche. La caratteristica peculiare è rappresentata dalla
facciata (v. Figura 5.58) connotata dal forte spicco in alzato della navata centrale
rispetto alle laterali con la conseguente forte pendenza degli spioventi laterali.

5.3.6.2 Descrizione
Internamente la cattedrale di Ruvo è a tre navate suddivise da pilastri
compositi su cui si innestano arcate a tutto sesto (v. Figura 5.59) al di sopra delle
quali corre un ballatoio su mensole scolpite che doveva costituire il matroneo mai
realizzato. La navata centrale, come pure il transetto, è coperta da capriate in
legno, mentre le navate laterali sono voltate. Le pareti e i pilastri sono in pietra a
vista. Il pavimento è in marmo ed è ricoperto dai banchi lignei sia nella navata
centrale che in quella laterale destra.
102 Capitolo 5

Figura 5.58 - Cattedrale di Ruvo, facciata.

Figura 5.59 - Cattedrale di Ruvo. Viste interne dall'ingresso verso l'altare (sinistra) e dall'altare
verso l'ingresso (destra).
Capitolo 5 103

Figura 5.60 - Cattedrale di Ruvo. Sezioni e pianta. In pianta sono indicati i punti di emissione (…)
e di ricezione ({). Scala 1:500.
La zona presbiteriale è delimitata da seggi lignei, mentre alla sinistra del
transetto si erge l’organo a canne. Dalla navata sinistra si accede inoltre a due
cappelle, separate mediante tendaggi di velluto.
Le principali dimensioni sono riportate di seguito:
Wn = 5,9 m Ln = 22 m Hn = 18,5 m
Wl = 3,7 m Hl = 8,6 m
Wt = 18,9 m Lt = 7,3 m Ht = 17,5m
Da = 5 m Ha = 13,5 m Dal = 2,5 m
Hal = 10 m
Vt = 6.400 m3 Vn = 2.400 m3 Sb = 70 m2
Sp = 445 m2 Sn = 130 m2 St = 3.500 m2 (appross.)

5.3.6.3 Il rilievo acustico


Il rilievo acustico è stato condotto nel corso di una giornata, acquisendo sia
le risposte all’impulso monoaurali (con la tecnica MLS e con lo sweep), che le
risposte binaurali (con la sola tecnica dello sweep), durante l’orario di apertura
della chiesa, ma con una scarsissima affluenza, in modo da minimizzare la
presenza di rumori di fondo.
Con la tecnica MLS è stata impiegata una sequenza di ordine 17,
campionata a 25,6 kHz, della durata di 5,12 s in modo da evitare problemi di time
aliasing, e ripetuta 32 volte in modo da migliorare il rapporto S/R. Lo sweep
utilizzato ha una durata di 6 s durante i quali la frequenza varia logaritmicamente
da 80 a 12000 Hz.
Date le modeste dimensioni della chiesa, sono stati adottati otto punti di
rilevazione disposti in modo da coprire in modo uniforme le diverse parti
104 Capitolo 5

dell’ambiente, e due punti di emissione, uno posto al centro del presbiterio ed uno
in corrispondenza dell’organo nell’ala sinistra del transetto (v. Figura 5.60).

5.3.6.4 Analisi dei risultati


Come mostrato nel Paragrafo 3.5.1 (pag. 41) fra le misure condotte con le
due tecniche (MLS e sweep) sussiste un buon accordo, per cui esse possono
ritenersi equivalenti. D’altra parte, allo scopo di confrontare fra loro le misure
relative a chiese diverse minimizzando qualsiasi causa di “bias”, la discussione
dei risultati sarà condotta solo sulla base delle misure eseguite con la tecnica
MLS.
Prendendo in esame l’andamento dei tempi di riverberazione alle varie
frequenze (v. Figura 5.61) si osserva l’andamento tipicamente decrescente al
crescere della frequenza, con lieve concavità verso il basso. Alle medie frequenze
il T20 è mediamente pari a 3,7 s, con variazioni da punto a punto contenute entro il
10%. Gli effetti della diversa posizione della sorgente si manifestano soprattutto
alle basse frequenze, dove si osserva una diminuzione dei tempi quando la
sorgente è in B. Benché la variazione, in termini medi, sia minima, essa può
ritenersi imputabile alla vicinanza della sorgente a superfici lignee che,
notoriamente, determinano un assorbimento delle frequenze più basse.
Analizzando i tempi di primo decadimento (v. figura 5.62) appare un
andamento opposto, secondo cui, quando la sorgente è in B, i tempi risultano più
lunghi. Ciò è imputabile alla maggiore presenza di ostacoli fra sorgente e
ricevitori – dovuta alla particolare posizione della sorgente – che, attenuando la

5,0 5,0

4,5
4,5
4,0
T20 (s)
RT (s)

4,0
3,5

3,0 3,5

2,5
3,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

2,0
125 250 500 1000 2000 4000
Combinazioni S_RR
Frequenze (Hz)
Media A Media B Media 125-250 500-1k

Figura 5.61 - Cattedrale di Ruvo. Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

5,0 5,0

4,5
4,5
4,0
EDT - RT (s)
EDT (s)

3,5 4,0

3,0
3,5
2,5

2,0 3,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDTlow EDTmid RTmid

Figura 5.62 - Cattedrale di Ruvo. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).
Capitolo 5 105

componente diretta del suono, determina l’allungamento dell’EDT. A livello


puntuale ciò viene confermato dall’osservazione che nel punto 1 (che è in vista)
l’EDTmid risulta minore (anche di T20), mentre nei rimanenti è maggiore. Alle
basse frequenze si evidenzia tuttavia un comportamento piuttosto singolare, dal
momento che, nel punto 1 e soprattutto nel punto 5 (entrambi in vista della
sorgente), EDTlow risulta alquanto più elevato. Come sarà meglio chiarito
dall’analisi degli altri parametri, ciò potrebbe essere dovuto all’arrivo di un
maggior numero di riflessioni iniziali legato ad una sorta di “incanalamento” delle
onde sonore all’interno della navata laterale dovuto alla presenza di ostacoli su
entrambi i lati della sorgente.
L’analisi dell’andamento del fattore di forza G (v. Figura 5.63) mostra un
andamento simile a quello di T20, i valori degli indici sintetici risultano essere
Gmid = 11,4 dB e G(A) = 16,6 dB e risultano essere molto elevati se confrontati
con i limiti proposti nel Capitolo 2. Tuttavia tali valori limite vanno intesi, in
accordo con Beranek [15], riferiti ad ambienti di notevoli dimensioni (con volumi
intorno ai 15.000-20.000 m3), per cui è naturale attendersi valori più elevati
quando il volume è, come in questo caso, minore. Si riscontra una differenza di
circa 1,5 dB fra i valori medi relativi alle due posizioni della sorgente. Ciò non è
solo dovuto alla maggiore distanza dai ricevitori, dal momento che analizzando i
valori in funzione della distanza (v. Figura 5.64, sinistra) si osserva che buona
parte dei punti corrispondenti alla sorgente B si trovano al di sotto della curva di
interpolazione. È chiaro, quindi, che la schermatura dovuta ai seggi lignei e al
pilastro dell’arco trionfale contribuisce a ridurre l’apporto di energia diretta. Ciò è
evidenziato anche dall’analisi dell’andamento puntuale, da cui appare che nei
14,0 22,0

13,0 20,0
12,0 18,0
11,0
G10 (dB)

16,0
G10 (dB)

10,0
14,0
9,0
12,0
8,0
10,0
7,0
8,0
6,0
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.63 - Cattedrale di Ruvo. Andamento dei valori di G al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500
e 1000 Hz e pesati in scala A (destra).

15,00 1,0
0,0
14,00
-1,0
13,00 -2,0
12,00 -3,0
G10@1kHz

C80@1kHz

B_05
-4,0
11,00
-5,0
10,00 -6,0
9,00 -7,0
y = -5,84Ln(x) + 9,40
y = -2,98Ln(x) + 18,49 -8,0
8,00 R2 = 0,78
R2 = 0,86 -9,0
7,00 -10,0
0,00 5,00 10,00 15,00 20,00 25,00 30,00 0,0 5,0 10,0 15,0 20,0 25,0 30,0
Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.64 - Cattedrale di Ruvo. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in funzione
della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei valori
secondo la teoria di Barron [11].
106 Capitolo 5

2,0
0,0
125 250 500 1000 2000 4000 0,0
-1,0
-2,0 -2,0

C80 (dB)
-3,0 -4,0
C80 (dB)

-4,0 -6,0
-5,0 -8,0
-6,0
-10,0
-7,0
-12,0
-8,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
-9,0
Combinazioni S_RR
Frequenze (Hz)
500-2k 250
Media A Media B Media

Figura 5.65 - Cattedrale di Ruvo. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).
punti 1 e 5, dove non c’è schermatura, il livello è più elevato. Di particolare
rilievo è il fatto che nel punto 5 il picco mostrato da G(A) è più evidente di quello
mostrato da Gmid, a testimonianza dell’ulteriore apporto energetico di bassa
frequenza che giunge in quel punto.
Passando in esame i valori medi della chiarezza (v. Figura 5.65) si osserva
un picco negativo a 500 Hz, l’indice sintetico è pari a –5,2 dB, ma ciò che
colpisce maggiormente l’attenzione è il diverso andamento dei valori al variare
della posizione della sorgente. Si osserva, infatti, che con la sorgente in A il picco
negativo è in corrispondenza dei 250 Hz, mentre con la sorgente in B, a fronte di
una generale riduzione dei valori intorno ai 2 dB, si ha a 250 Hz un picco positivo.
La presenza di tali picchi è dovuta alla combinazione A_07, per quello negativo,
ed al punto B_05, per quello positivo, anche se, con la sorgente in B, molti dei
valori a 250 Hz appaiono superiori ai valori medi. Le differenze fra i valori medi
alle altre frequenze sono da imputarsi essenzialmente alla maggiore distanza dai
ricevitori e all’effetto di schermatura, come mostra chiaramente la Figura 5.64,
dove i punti relativi alla sorgente B appaiono inferiori alla retta di interpolazione
(ad eccezione del punto 5). Infatti, l’analisi dei valori puntuali (v. Figura 5.65)
rivela un andamento piuttosto regolare caratterizzato, però, dai picchi in A_06,
dovuto probabilmente ad un forte campo diretto (si veda anche il basso valore di
EDT), ed in B_05, dovuto agli effetti di cui si è detto prima. In termini di
caratterizzazione acustica della chiesa è possibile osservare che, quando la
sorgente è in A, nei primi tre punti di rilevazione la chiarezza è buona e si presta
anche all’ascolto di musica sinfonica. Man mano che ci si allontana, invece, la
chiarezza diviene idonea solo alla musica d’organo.
Il tempo baricentrico, solitamente più regolare di C80, non evidenzia
anomalie nell’andamento dei valori medi alle varie frequenze al variare della
sorgente (v. Figura 5.66). Mediamente l’indice sintetico è pari a 286 ms, mentre, a
livello puntuale, l’andamento rispecchia quello della chiarezza, infatti la
correlazione fra i due indici è pari a –0,98. Conseguentemente si osservano gli
stessi picchi riscontrati in precedenza, con una variazione compresa fra 166 ms e
351 ms, evidenziando come in nessun punto si raggiungano, a chiesa vuota,
condizioni idonee per il parlato, malgrado le sue dimensioni più contenute.
Per avere un’idea più dettagliata dell’intelligibilità del parlato è possibile
utilizzare i dati relativi agli indici STI e RASTI (v. Figura 5.67, sinistra), da cui si
evince che, quando la sorgente è in A, in corrispondenza dei primi due punti della
Capitolo 5 107

350 400

350
300

300

Ts (500-1k) (s)
250
Ts (s) 250
200
200

150 150

100 100

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.66 - Cattedrale di Ruvo. Andamento dei valori di Ts al variare della frequenza in funzione
delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500
e 1000 Hz (destra).

60,0 0,85
55,0 0,80
50,0
0,75

Echo Criterion
45,0
STI/RASTI

0,70
40,0
0,65
35,0
0,60
30,0
25,0 0,55

20,0 0,50
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Posizioni dei ricevitori Posizioni dei ricevitori
STI RASTI EC_music EC_speech

Figura 5.67 - Cattedrale di Ruvo. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).
navata centrale, si hanno condizioni di ascolto “sufficiente” anche senza impianto
di amplificazione e a chiesa vuota. Nei rimanenti punti l’intelligibilità è “scarsa”.
Mediamente STI e RASTI risultano rispettivamente pari a 37,6 e 37,8, mostrando
un buon accordo fra loro (R = 0,93).
Dal punto di vista dell’immunità da fenomeni di eco le dimensioni
contenute della chiesa costituiscono una garanzia, ed il calcolo dei criteri di eco lo
conferma dal momento che in ogni punto i valori calcolati sono inferiori ai valori
limite (v. Figura 5.67, destra).
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,16; BR_L = 1,0 dB;
EBL = 1,8 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
tutti e tre gli indici risultano interni ai rispettivi intervalli ottimali, denotando
quindi un buon bilanciamento delle basse frequenze. In termini puntuali BR risulta
variare fra 1,09 e 1,25, risultando, a volte, al di fuori dell’intervallo ottimale.
L’osservazione dell’andamento punto per punto degli altri parametri (v. Figura
5.68, sinistra) fornisce ulteriori informazioni. Assunto che i valori minimi e
massimi sono –4,9 e 10,9 dB per EBL, e –0,7 e 1,7 dB per BR_L, si riscontra una
debole correlazione negativa (R = –0,50) che vede EBL decrescere con la
distanza, mentre BR_L appare crescere con la distanza e decrescere nelle navate
laterali. Molto interessante è osservare i picchi presenti in A_06 e B_05 che
denotano l’arrivo di riflessioni iniziali aventi un elevato contenuto di basse
frequenze.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –9,4 dB e TR = 0,71; pertanto entrambi i valori sono ai limiti dei
108 Capitolo 5

1,00 1,0
0,90 0,9
0,80 0,8
Bilanciamento dei bassi

Bilanciamento degli alti


Indici normalizzati
Indici normalizzati
0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Combinazioni Sorg_Ric Combinazioni Sorg_Ric
EBR BR_L LTR TR

Figura 5.68 - Cattedrale di Ruvo. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.

0,90 0,60
0,80 0,40
0,70 Log(1-IACC) / IAD (dB)
0,20
0,60
(1-IACC) / IAD

0,00
0,50
-0,20
0,40
-0,40
0,30
0,20 -0,60

0,10 -0,80
0,00 -1,00
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore
1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.69 - Cattedrale di Ruvo. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
rispettivi intervalli di accettabilità. In termini puntuali (v. Figura 5.68, destra) si
ha che LTR varia fra –9,8 e –9,1 dB, mentre TR varia fra 0,66 e 0,75, mostrando
che in buona parte dei punti le condizioni sono accettabili. Infine, si osserva che i
due parametri appaiono debolmente correlati fra loro (R = –0,68) e che, come già
visto altrove, l’interpretazione dell’andamento puntuale dei valori si sottrae a
facili interpretazioni.
Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei
descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,68,
e IADE = 0,42; pertanto risultano mediamente entro i limiti enunciati nel Capitolo
2. L’analisi dei valori puntuali (v. Figura 5.69, sinistra) mostra che i due parametri
sono ben correlati (R = 0,86), inoltre appare abbastanza evidente la differenza fra i
punti posti in asse (o quasi) con la sorgente ed i rimanenti, mentre la differenza fra
punti della navata centrale e punti delle navate laterali è più evidente quando si
prende in considerazione IACC.
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,50 dB, IADL = –0,17, dando luogo ad un interessante
contrasto poiché il primo rappresenta uno dei valori più bassi finora misurati,
mentre il secondo è uno dei più alti. A livello puntuale (v. Figura 5.69, destra) si
osserva una scarsa correlazione fra i due indici, e una fluttuazione piuttosto
accentuata.
Capitolo 5 109

5.3.7 La Cattedrale di Santa Maria Assunta a Bovino

5.3.7.1 Cenni storici


La Cattedrale di Bovino è una delle prime testimonianze romaniche in
Puglia. Secondo i resti di un’iscrizione, la sua costruzione fu iniziata nel 905, e
questa sua origine antica è testimoniata dalla forma, ancora embrionale, della
chiesa e dalla presenza di elementi bizantini. Conclusa sul finire del XII secolo fu
affiancata poco dopo dalla chiesa-cappella di San Marco, dedicata nel 1197. Tale
cappella è venuta col tempo configurandosi come una vera e propria chiesa
autosufficiente. L’intero complesso, venne notevolmente modificato nel XVII-
XIX secolo con stucchi, aggiunte e superfetazioni. Nel 1930, a seguito di un
terremoto che arrecò considerevoli danni, la chiesa fu restaurata e riportata alle
sue antiche forme.

Figura 5.70 - Cattedrale di Bovino. Vista della facciata dalla piazza.

5.3.7.2 Descrizione
La chiesa è a pianta basilicale, con tre navate, transetto e coro rettangolare.
Fra il coro ed il braccio destro del transetto è innestata la cappella di San Marco, a
pianta rettangolare oblunga. Le colonne che separano le navate sono in pietra,
mentre tutte le murature sono intonacate e lisciate. La copertura delle navate è
realizzata con capriate lignee. Una struttura lignea copre il transetto e la crociera
dove, un tempo, si impostava la cupola. Il coro è invece voltato a botte rialzata ed
110 Capitolo 5

è finito con intonaco. Nel coro sono localizzati l’organo e seggi in legno. La
cappella di San Marco è anch’essa voltata, a botte nel primo tratto (ripartita da tre
arcate trasversali), e nel secondo a cupola impostata su pennacchi angolari conici.
Le volte sono intonacate come pure le pareti, interrotte però da arcate su pilastri e
mensole in pietra squadrata ed in parte occupate da sepolcri marmorei. Il
pavimento, sostituito durante i restauri, è in mattonelle di pietra lavica ruvida. I
banchi lignei sono disposti lungo le tre navate e sono presenti anche nella
cappella, disposti su due file.
Elemento di grande interesse dal punto di vista acustico è la presenza della
cappella, il cui volume (1230 m3) è pari a circa un terzo di quello della chiesa
(3840 m3). Il collegamento con la chiesa è realizzato mediante due aperture di 9 e
24 m2, la più grande delle quali è chiusa da una vetrata all’inglese. L’apertura più
piccola è dotata di una tenda in velluto utilizzata per ridurre la coda sonora
proveniente dalla cappella, particolarmente udibile quando la chiesa è occupata
dall’assemblea.

Figura 5.71 - Cattedrale di Bovino. Sezioni e pianta. In pianta sono indicati i punti di emissione
(…) e di ricezione ({). Scala 1:500.
Capitolo 5 111

Figura 5.72 - Cattedrale di Bovino. Spaccato assonometrico.


Le principali dimensioni sono riportate di seguito:
Wn = 8,5 m Ln = 15,5 m Hn = 11 m
Wl = 5,0 m Hl = 7,0 m
Wt = 18,0 m Lt = 6,0 m Ht = 10,5m
Wa = 6 m La = 7,5 Ha = 8,5 m

Vt = 3840+1230† m3 Vn = 1450 m3 Sb = 102 m2


Sp = 452+140† m2 Sn = 132 m2 St = 2420+820† m2 (appr.)

Dati relativi alla sola cappella

5.3.7.3 Il rilievo acustico


La Cattedrale di Bovino costituisce probabilmente il caso più complesso fra
le chiese analizzate. Tale complessità deriva dalla presenza di una cappella di
grandi dimensioni avente una riverberazione maggiore del volume principale della
chiesa. Pertanto si instaura una situazione di “volumi acusticamente accoppiati” di
notevole interesse.
In conseguenza di ciò sono stati adottati 13 punti di misura distribuiti in
modo da coprire in modo omogeneo le varie parti della chiesa (v. Figura 5.71), in
particolare nella grande cappella sono stati localizzati tre diversi punti di rilievo.
Al fine di studiare gli effetti dovuti all’accoppiamento acustico sono state
impiegate tre diverse posizioni della sorgente: due localizzate nella chiesa,
nell’area presbiteriale, ed una localizzata nella cappella al di sotto della cupola.
Le misure sono state condotte in due riprese adottando tecniche
differenziate nelle due circostanze. La prima volta è stato utilizzato un segnale
MLS della durata di 5.12 secondi campionato a 12,8 kHz per ottenere le risposte
all’impulso monoaurali, mentre per le risposte binaurali è stato utilizzato un
segnale della stessa durata ma campionato a 51,2 kHz. In tale circostanza le
misure binaurali sono state acquisite utilizzando i microfoni da ¼” di una sonda
bicanale. In entrambi i casi, tuttavia, il rapporto S/N non è risultato soddisfacente
(nel senso che non è stato possibile rilevare l’effetto del volume accoppiato).
Pertanto nella successiva tornata è stato ancora utilizzato un segnale MLS della
stessa durata, ma campionato a 25,6 kHz unitamente ad uno sweep logaritmico
112 Capitolo 5

della durata di 6 secondi per acquisire le risposte all’impulso omnidirezionali (con


la sorgente posizionata solo in un punto), mentre lo stesso sweep è stato adottato
per acquisire tutte le risposte binaurali con la sorgente in tutti e tre i punti presi in
considerazione.

5.3.7.4 Analisi dei risultati: effetti dell’accoppiamento acustico sul tempo di


riverberazione
Si è detto in precedenza della presenza in questa chiesa di una grande
cappella comunicante con il volume principale mediante una apertura di modesta
entità. In questi casi la teoria (cfr. Rif. [29] p. 261 e Rif. [53] p. 128) prevede che
se il tempo di riverberazione del volume secondario è (molto) più lungo di quello
del volume principale, la curva di decadimento all’interno del volume principale
mostrerà una “doppia pendenza”, con il ramo terminale di tale curva parallelo alla
curva di decadimento rilevata all’interno dell’ambiente più riverberante.
Nel caso in esame i tempi di riverberazione all’interno dei due ambienti
differiscono di circa 1 s, arrivando ad 1,5 s a 125 Hz (v. Figura 5.73, destra).
Questa differenza relativamente modesta si manifesta nel volume principale sotto
forma di un incremento dei tempi di riverberazione relativi ai diversi intervalli di
decadimento (v. Figura 5.73, sinistra) più evidente alle basse frequenze. È
opportuno osservare, però, che non è inusuale riscontrare valori più bassi di EDT
ogni qual volta la componente diretta del suono è particolarmente forte. In tal
senso la Figura 5.74 è esplicativa, poiché mostra il confronto fra EDT e RT per la
frequenza di 125 Hz e per la media dei valori a 500 e 1000 Hz. Da essa emerge
che per i punti in cui la differenza sussiste alle medie frequenze è possibile
ipotizzare che, anche alle basse frequenze, si avrà un comportamento analogo.
Conseguentemente, nei punti in cui alle medie frequenze non si riscontrano grosse
differenze fra EDT e RT, si può pensare che la differenza presente a 125 Hz sia
imputabile, almeno in parte, all’effetto dell’accoppiamento acustico. L’analisi
della Figura 5.75 mostra come l’effetto dell’accoppiamento acustico si manifesti
in maniera estremamente blanda. Mentre a 1 kHz il decadimento appare
perfettamente lineare, anche a 125 Hz non appare chiaramente visibile alcuna
doppia pendenza. La curva di decadimento mostra una lieve concavità verso l’alto
e, solo quando il decadimento dell’ambiente pricipale è sceso sotto i 30 dB,
compare una seconda pendenza confrontabile con quella rilevata all’interno della
cappella (con la sorgente al suo interno).
La piccola differenza fra i tempi di riverberazione misurati nei due ambienti
non consente, quindi, di osservare chiaramente gli effetti previsti dalla teoria.
4,50 6,0
5,5
4,00
5,0

3,50 4,5
RT (s)

RT (s)

4,0
3,00 3,5
3,0
2,50
2,5
2,00 2,0
125 250 500 1000 2000 4000 125 250 500 1000 2000 4000
Frequenze (Hz) Frequenze (Hz)
T30 T15 EDT T20_C EDT_C T30 chiesa

Figura 5.73 - Cattedrale di Bovino. Andamento dei tempi di riverberazione EDT, T15, T30, al
variare della frequenza, misurati all’interno della chiesa (sinistra) e all’interno della cappella
(destra).
Capitolo 5 113

6,00 4,50

5,50

EDT(500-1000 Hz) (s)


5,00 4,00

RT@125 Hz (s)
4,50
3,50
4,00

3,50
3,00
3,00

2,50 2,50
A_01

A_02

A_03

A_04

A_05

A_06

A_07

A_08

A_09

C_11

C_12

C_13

A_01

A_02

A_03

A_04

A_05

A_06

A_07

A_08

A_09

C_11

C_12

C_13
Combinazioni S_RR Combinazioni S_RR
EDT RT EDT RT

Figura 5.74 - Cattedrale di Bovino. Andamento di EDT e RT per diverse combinazioni sorgente-
ricevitore relativo a 125 Hz (sinistra) e alla media di 500 e 1000 Hz (destra).

Figura 5.75 - Cattedrale di Bovino. Curve di decadimento a 125 Hz (sinstra) e ad 1 kHz (destra)
misurate per le combinazioni A_09 (curva superiore) e C_12 (curva inferiore).

6,00 6,50
5,50
6,00
EDT(500-1000 Hz) (s)

5,00
5,50
4,50
RT (s)

4,00 5,00

3,50 4,50
3,00
4,00
2,50
2,00 3,50
C_01

C_04

C_05

C_08

C_09

C_10
A_11

A_12

A_13

125 250 500 1000 2000 4000


Frequenze
T30 Chiesa A (Hz) T30 Chiesa C Combinazioni S_RR
T30 Cappella A T30 Cappella C EDT RT

Figura 5.76 - Cattedrale di Bovino. A sinistra: andamento dei valori medi dei tempi di
riverberazione in funzione della frequenza, misurati nella chiesa e nella cappella con la sorgente
posta prima in uno e poi nell’altro ambiente. A destra: andamento puntuale di RT ed EDT alle
medie frequenze con sorgente localizzata all’esterno dell’ambiente di appartenenza.
D’altra parte anche l’analisi del comportamento di un ambiente quando la
sorgente è posta in quello adiacente mostra differenze con quanto previsto dalla
teoria. Infatti, la Figura 5.76 mostra che quando la sorgente è in A, nella cappella
si misura un tempo di riverberazione più lungo di quello che si misura nella stessa
quando la sorgente è in C, in contrasto con la teoria secondo cui dovrebbe essere
al massimo uguale a quella dell’ambiente più riverberante, cioè appunto la
cappella. Analogamente, si osserva che quando la sorgente è posta in C il tempo
di riverberazione misurato nella chiesa risulta maggiore di quello misurato in
cappella. Ciò può spiegarsi qualitativamente considerando che, quando la sorgente
è nell’ambiente più riverberante, durante il transitorio di estinzione del suono si
ha, nell’ambiente meno riverberante, un apporto energetico ritardato e non
114 Capitolo 5

trascurabile, dovuto all’energia sonora che, dall’ambiente sorgente passa a quello


ricevente attraverso la superficie di accoppiamento. È evidente che la
combinazione dei due processi di estinzione dà luogo ad un allungamento del
tempo di decadimento.

5.3.7.5 Analisi dei risultati: gli altri parametri acustici


Si è visto nel paragrafo precedente in che modo il tempo di riverberazione
all’interno della chiesa è influenzato dalla presenza della grande cappella di San
Marco. Si procederà adesso alla discussione delle caratteristiche acustiche relative
alla sola chiesa, prescindendo dalla presenza del volume accoppiato. Il tempo di
riverberazione ha un andamento piuttosto tipico (v. Figura 5.73), con un valore
medio alle medie frequenze di 3,6 s. Alle basse frequenze si osserva che a 125 Hz
RT risulta più basso che a 250 Hz, presumibilmente a causa della presenza di
pannellature lignee (in corrispondenza del coro) o per effetto del sottile vetro di
cui è fatta la vetrata che separa i due volumi. Il tempo di primo decadimento
risulta, come detto in precedenza, inferiore ad RT, risultando pari, alle medie
frequenze, a 3,5 s.
Passando a considerare il livello sonoro (v. figura 5.77), i descrittori sintetici
medi risultano essere Gmid = 13,8 dB e G(A) = 18,9 dB. Entrambi i valori sono
molto elevati, in accordo col fatto che il volume della chiesa è di 3840 m3, quindi
decisamente inferiore ai volumi degli ambienti per cui i valori ottimali sono stati
definiti. In termini di frequenza si osserva, in corrispondenza delle ottave più
basse, una depressione dei valori, in accordo con quanto mostrato dai tempi di
riverberazione. In termini puntuali si osserva una buona omogeneità dei valori,
con differenze, fra punti più lontani e più vicini, non superiori ai 4 dB.
Diagrammando i valori in funzione della distanza (v. figura 5.78) si osserva la
consueta diminuzione progressiva dei primi al crescere della seconda. Si notano
poi due punti (corrispondenti a B_05 e B_10), di circa 1 dB al di sotto della curva
di miglior adattamento. Mentre per il punto 10, posto all’interno del coro, dietro
l’altare, è presumibile una attenuazione del suono diretto proprio da parte di
quest’ultimo, per il punto 5 è meno immediato trovare una spiegazione.
Applicando la teoria corretta di Barron si ottengono valori predetti che
sovrastimano quelli misurati per via della minore pendenza, tuttavia l’errore non
supera, nei punti più distanti, 1 dB.
Prendendo in esame la chiarezza (v. figura 5.79), si osserva il tipico
andamento a V con un picco negativo a 500 Hz. Mediamente l’indice sintetico è
pari a –4,7 dB, pertanto la chiesa non si presta molto ad esecuzioni di musica
16,0 24,0

15,0 22,0

20,0
14,0
G10 (dB)

18,0
G10 (dB)

13,0
16,0
12,0 14,0

11,0 12,0

10,0
10,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.77 - Cattedrale di Bovino. Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).
Capitolo 5 115

17,00 1,0

16,00 0,0
-1,0
15,00
-2,0
G10@1kHz

C80@1kHz
14,00 -3,0
13,00 -4,0
y = -4,47Ln(x) + 5,52
-5,0
12,00 R2 = 0,70
-6,0
y = -2,12Ln(x) + 18,00
11,00 -7,0 A_10
R2 = 0,78
10,00 -8,0
0,00 5,00 10,00 15,00 20,00 0,0 5,0 10,0 15,0 20,0
Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.78 - Cattedrale di Bovino. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in


funzione della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei
valori secondo la teoria di Barron [11].

0,0 2,0
1,0
-1,0
0,0

C80 (500-2k) (dB)


-2,0 -1,0
-2,0
C80 (dB)

-3,0 -3,0
-4,0
-4,0
-5,0
-5,0 -6,0
-7,0
-6,0 -8,0
125 250 500 1000 2000 4000

B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.79 - Cattedrale di Bovino. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).

350 330
310
300 290
270
Ts (500-1k) (s)

250
250
Ts (s)

230
200
210
190
150
170
100 150
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

125 250 500 1000 2000 4000


Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.80 - Cattedrale di Bovino. Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).
sinfonica, mentre è indicata per musica organistica. I valori medi non risultano
molto influenzati dalla posizione della sorgente anche perché i due punti di
emissione non risultano molto distanti l’uno dall’altro. L’analisi dei valori
puntuali conferma ciò e mette in evidenza l’effetto di schermatura prodotto dalle
colonne (A_06 e B_02) e, come accennato prima, dall’altare nei confronti del
punto 10. In particolare, quando la sorgente è in A si ha il maggiore effetto, come
mostra anche la Figura 5.78 (destra).
Il tempo baricentrico non presenta, in termini medi, elementi di particolare
rilievo (v. figura 5.80), riproponendo l’andamento dei tempi di riverberazione al
variare della frequenza. L’indice sintetico è pari a 262 ms, mentre a livello
116 Capitolo 5

puntuale si varia fra 150 ms e 311 ms, denotando un comportamento “scarso” in


termini di intelligibilità del parlato. Si nota, inoltre, una più accentuata variazione
di Ts, rispetto a C80, a seconda che il ricevitore si trovi nella navata centrale o
nelle navate laterali.
Considerando gli indici di intelligibilità (v. Figura 5.81, sinistra), si osserva
che mediamente risulta STI = 39,4 e RASTI = 39,2, confermando, quindi, il
giudizio “scarso”. In termini puntuali si osserva che nei punti più vicini alla
sorgente si raggiungono anche condizioni di ascolto “sufficienti”. I due parametri
risultano infine ben correlati, risultando R = 0,93.
L’osservazione dei criteri di eco (v. Figura 5.81, destra), non evidenzia
problemi particolari, dal momento che in tutti i punti i valori calcolati risultano
inferiori ai limiti fissati precedentemente.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,04; BR_L = 0,85 dB;
EBL = 5,2 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
tutti e tre gli indici risultano interni ai rispettivi intervalli ottimali, denotando
quindi un buon bilanciamento delle basse frequenze. In termini puntuali BR risulta
variare fra 0,94 e 1,14, risultando sempre entro l’intervallo ottimale.
L’osservazione dell’andamento punto per punto degli altri parametri (v. Figura
5.82, sinistra) fornisce ulteriori informazioni. Assunto che i valori minimi e
massimi sono 2,0 e 12,0 dB per EBL, e –0,9 e 3,4 dB per BR_L, si riscontra una
correlazione negativa poco significativa (R = –0,49) che vede EBL decrescere con
la distanza, mentre BR_L appare complessivamente crescere con la distanza.
55,0 0,90

50,0 0,85
0,80
45,0
Echo Criterion

0,75
STI/RASTI

40,0
0,70
35,0
0,65
30,0
0,60
25,0 0,55
20,0 0,50
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

Posizioni dei ricevitori Posizioni dei ricevitori


STI RASTI EC_music EC_speech

Figura 5.81 - Cattedrale di Bovino. Cattedrale di Ruvo. Andamento punto per punto dei valori dei
parametri di intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco
(destra).

1,00 1,0
0,90 0,9
Bilanciamento dei bassi

0,80 0,8
Bilanciamento degli alti
Indici normalizzati

Indici normalizzati

0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10

Combinazioni Sorg_Ric Combinazioni Sorg_Ric


EBR BR_l LTR TR

Figura 5.82 - Cattedrale di Bovino. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.
Capitolo 5 117

1,00 0,30
0,90 0,20
0,80 0,10

Log(1-IACC) / IAD (dB)


0,70 0,00

(1-IACC) / IAD
0,60 -0,10
0,50 -0,20
0,40 -0,30
0,30 -0,40
0,20 -0,50
0,10 -0,60
0,00 -0,70

B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore
1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.83 - Cattedrale di Bovino. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –9,4 dB e TR = 0,71; pertanto entrambi i valori sono ai limiti dei
rispettivi intervalli di accettabilità. In termini puntuali (v. Figura 5.82, destra) si
ha che LTR varia fra –10,0 e –7,1 dB, mentre TR varia fra 0,53 e 0,80, mostrando
che in buona parte dei punti le condizioni sono accettabili. Il valore minimo di TR
e il valore massimo di LTR vengono raggiunti entrambi nello stesso punto B_05
che, già prima, era stato messo in evidenza per il suo basso livello sonoro. Infine,
si osserva che i due parametri appaiono ben correlati fra loro (R = –0,87) e che,
come già visto altrove, l’interpretazione dell’andamento puntuale dei valori si
sottrae a facili interpretazioni.
Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei
descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,69,
e IADE = 0,38; pertanto risultano mediamente entro i limiti enunciati nel Capitolo
2. L’analisi dei valori puntuali (v. Figura 5.83, sinistra) mostra che i due parametri
sono abbastanza correlati (R = 0,72), inoltre appare ben evidente, soprattutto
considerando la IAD, la differenza fra punti della navata centrale e punti delle
navate.
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,49 dB, IADL = –0,14, ancora una volta in contrasto, visto
che il primo è fra i valori più bassi finora misurati, mentre il secondo è uno dei più
alti. A livello puntuale (v. Figura 5.83, destra) i due indici non appaiono correlati
e mostrano notevoli fluttuazioni.

5.3.8 La chiesa di Ognissanti a Valenzano

5.3.8.1 Cenni storici


La chiesa di Ognissanti a Valenzano (Bari) è l'unico edificio rimasto di un
complesso che comprendeva anche due chioschi e un monastero che furono
edificati, secondo alcuni critici, sul luogo in cui sorgeva un Pantheon intitolato a
"tutti i Numi", dedica che sarebbe poi stata mutata in "Ognissanti" dal fondatore
del monastero, il benedettino Eustasio. La data di fondazione del monastero si può
far risalire al periodo in cui fu Arcivescovo di Bari Andrea II (1062-1078). Dopo
numerosi passaggi di competenze che videro il monastero passare dall’autonomia
alla dipendenza dalla curia fino alla afferenza alla Basilica di San Nicola, si
giunse, nei primi anni del 1500, alla soppressione del monastero che venne poi
demolito nel 1737.
118 Capitolo 5

La chiesa, risparmiata alla demolizione di cui fu fatto oggetto il monastero,


appartiene al gruppo di edifici a cupole in asse, di cui rappresenta indubbiamente
l'esemplare meglio conservato. Tale tipologia, caratteristica della Puglia,
sembrerebbe di derivazione bizantina.

5.3.8.2 Descrizione
All'interno l'ambiente è suddiviso in nove campate, tre per navata, da pilastri
cruciformi su cui gli archi longitudinali e trasversali scaricano il peso delle tre
cupole semisferiche raccordate alla pianta quadrata mediante pennacchi e
sprovviste di tamburo. Fungono invece da contrafforti le volte rampanti a
semibotte che coprono le due navate laterali divise in campate da archi-diaframma
a tutto sesto forati da oculi che si ripropongono corrispondenti sulle due facciate.
Lo stesso motivo della navata centrale ritorna sui muri perimetrali interni grazie
ad arcate cieche con archivolti lunati.
L'ambiente interno si conclude con le tre absidi semicircolari e con un
presbiterio rialzato di due gradini rispetto al normale piano di calpestio; l'altare,
che è ora presente, non è quello originale andato distrutto.
Tutte le pareti, i pilastri e le volte sono in pietra lasciata a vista. A causa di
un restauro in corso il pavimento non è stato ripristinato e vi è un battuto di ghiaia
e malta. In corrispondenza dell’oculo centrale manca l’infisso e, infine, i soli
elementi lignei sono le tre porte di ingresso alla chiesa.
Le principali dimensioni sono riportate di seguito:
Wn = 6,4 m Ln = 19,3 m Hn = 9,6 m
Wl = 3,2 m Hl = 8,5 m Dc = 5,5 m
Da = 4,5 m Ha = 7,5 m Dal = 1,6 m
Hal = 5,5 m
Vt = 1800 m3 Vn = 1180 m3
2
Sp = 258 m Sn = 124 m2 St = 1300 m2 (appross.)

Figura 5.84 - Chiesa di Ognissanti. Pianta, prospetto e sezione. In pianta sono indicati i punti di
emissione (…) e di ricezione ({). Scala 1:500.
Capitolo 5 119

5.3.8.3 Il rilievo acustico


Nella chiesa di Ognissanti sono stati presi in considerazione 12 punti di
ricezione con 2 punti di emissione, così come riportato in Figura 5.84. Le misure
sono state condotte adottando un segnale MLS della lunghezza di 5,12 s con una
frequenza di campionamento di 12,8 kHz. Poiché il segnale saturava il microfono,
le misure sono state condotte riducendo il guadagno in uscita di 10 dB,
ulteriormente ridotto di altri 10 dB, nei punti più vicini alla sorgente. Per tenere
conto di ciò sono stati introdotti degli opportuni coefficienti correttivi per il
calcolo dei parametri energetici, in particolare G ed EBL, mentre tutti gli altri
parametri non sono influenzati da tali variazioni.
Le risposte all’impulso binaurali sono state acquisite adottando sia un
segnale MLS in combinazione con una coppia di microfoni omnidirezionali da ¼
di pollice, che un segnale sweep in combinazione con la coppia di microfoni
binaurali Core Sound. Le misure sono state eseguite solo in una metà della chiesa
dal momento che essa risulta simmetrica. Il segnale sweep adottato in questa
circostanza si differenzia da quello descritto nel capitolo precedente poiché deriva
dal lavoro di Griesinger [42], che propone un segnale con una più forte
componente di bassissima frequenza allo scopo di ottenere in quella zona dello
spettro un rapporto S/N sufficientemente elevato. Tuttavia l’elaborazione di tali
risposte all’impulso ha mostrato la presenza di una componente tonale parassita in
corrispondenza della frequenza di passaggio fra i due tronchi del segnale. Pertanto
questi dati sono stati utilizzati solo per il calcolo del IACC che è limitato alle
frequenze da 500 Hz in su. In ogni caso i risultati qui presentati fanno riferimento
alle sole misure ottenute con la tecnica MLS. Per tutti gli altri parametri binaurali
si è fatto direttamente uso delle misure ottenute con la tecnica MLS.

5.3.8.4 Analisi dei risultati


Nel panorama delle chiese analizzate, quella di Ognissanti a Valenzano
costituisce un “unicum”, non solo per la copertura a cupole che la caratterizza, ma
anche per l’esigua presenza di materiali lignei e per l’assenza di apparati
decorativi. Ciò, unitamente alla geometria semplice della chiesa, consente di
ricavare una buona stima dei coefficienti di assorbimento relativi alla pietra a
vista, che definisce l’involucro interno. Ovviamente le caratteristiche appena
descritte non possono non influire sulle caratteristiche acustiche e sui parametri
che le descrivono. Come si mostrerà nel successivo capitolo i valori misurati si
differenziano abbastanza da quelli mediamente attesi per una chiesa di queste
dimensioni.
Procedendo, quindi, con l’analisi dei tempi di riverberazione (v. Figura
5.85), si osserva, in termini di frequenza, un andamento che si potrebbe definire
“tipico” se non fosse per le basse frequenze che, rispetto alle medie, appaiono
alquanto depresse. In termini assoluti ciò è imputabile alla presenza dei, pur
esigui, elementi lignei, mentre in termini relativi è la mancanza di assorbimento
alle medie frequenze (coperture, banchi, ecc.) che determina tale sbilanciamento.
La diversa posizione della sorgente non appare influenzare affatto i valori medi e
lo stesso può dirsi analizzando i valori puntuali dove, alle medie frequenze, si
riscontrano differenze inferiori al 5%.
Il tempo di primo decadimento (v. Figura 5.86) ripropone lo stesso
andamento di T20, anche se a 125 Hz si riscontra una maggiore variabilità in
funzione della posizione della sorgente. L’analisi dell’andamento puntuale del
valore medio alle medie frequenze mostra una sostanziale uniformità anche per
120 Capitolo 5

questo indice, nonché una scarsa differenza fra T20 e EDT. È interessante, infine,
notare che la differenza media fra punti simmetrici, con la sorgente in A, è del
2,2%, quindi ampiamente al di sotto della JND1 che è pari al 5%.
Applicando la formula di Sabine è possibile, con riferimento alle medie
frequenze, determinare il coefficiente di assorbimento medio dell’ambiente in
esame. Tale coefficiente, essendo l’assorbimento dovuto alle superfici lignee
sicuramente trascurabile, in questo range di frequenze, rispetto a quello delle
pareti e del pavimento, può ragionevolmente attribuirsi a queste ultime superfici.
Pertanto, considerando che il volume dell’ambiente è di 1800 m3, che la superficie
esposta totale è pari a 1300 m2 e che T20 è pari a 5,2 s, si ha che αmid = 0,04. Alle
basse ed alte frequenze la valutazione è influenzata rispettivamente dalle superfici
in legno e dall’assorbimento dell’aria, tuttavia una stima è possibile ed è riportata
al paragrafo 6.5.
L’analisi dei valori del fattore di forza G (v. Figura 5.87) mostra, in
funzione delle diverse frequenze, un andamento simile a quello dei tempi di
decadimento, anche se, a quelle basse, l’andamento appare meno depresso.
Mediamente i due indici sintetici sono Gmid = 19,3 dB e G(A) = 24,1 dB,
risultando molto elevati a causa del modesto volume dell’ambiente e del limitato
assorbimento sonoro presente nell’ambiente. Le differenze fra i valori relativi alle

6,00 6,0
5,50
RT(500-1000 Hz) (s)

5,00 5,5
4,50
RT (s)

4,00 5,0

3,50

3,00 4,5

2,50
4,0
2,00
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.85 - Chiesa di Ognissanti. Andamento dei valori di T20 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).

6,00 6,0

5,50
EDT(500-1000 Hz) (s)

5,00 5,5

4,50
EDT (s)

4,00 5,0

3,50
3,00 4,5

2,50
2,00 4,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12

125 250 500 1000 2000 4000


Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.86 - Chiesa di Ognissanti. Andamento dei valori di EDT al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz confrontato con l’andamento di RT (destra).

1
La JND è la differenza minima che deve sussistere fra due valori di un parametro acustico
affinchè un soggetto sia in grado di percepirli come distinti, talora viene anche denominata
difference limen. I valori di JND variano da parametro a parametro e sono stati recentemente
riassunti da Bork nel Rif. [17].
Capitolo 5 121

21,0 28,0

20,0 26,0

19,0 24,0

G10 (dB)
G10 (dB)
18,0
22,0
17,0
20,0
16,0
18,0
15,0
16,0
14,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.87 - Chiesa di Ognissanti. Andamento dei valori di G al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz e pesati in scala A (destra).

22,0 0,0

21,0 -2,0

20,0 -4,0
G10@1kHz

C80@1kHz
19,0 -6,0

18,0 -8,0
y = -1,22Ln(x) + 21,60 y = -4,10Ln(x) + 1,10
17,0 -10,0
R2 = 0,91 R2 = 0,84
16,0 -12,0
0,0 5,0 10,0 15,0 20,0 0,0 5,0 10,0 15,0 20,0

Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.88 - Chiesa di Ognissanti. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in funzione
della distanza sorgente ricevitore. La curva tratteggiata riporta l’andamento teorico dei valori
secondo la teoria di Barron [11].
diverse posizioni della sorgente appaiono trascurabili e, ove presenti (cioè nei
punti 1 e 2), sono imputabili alla maggiore distanza dalla sorgente.
Complessivamente i valori di Gmid appaiono variare fra 18,5 dB e 20,5 dB,
mostrando quindi una buona omogeneità. Infine, confrontando i valori relativi ai
punti simmetrici appare che le differenze medie sono pari a 0,15 dB. Tracciando i
valori di G in funzione della distanza si osserva il consueto andamento
decrescente al crescere della distanza. Il confronto con i valori teorici di Barron
mostra che la pendenza della curva di miglior adattamento dei punti sperimentali è
maggiore di quella predetta, tuttavia date le modeste dimensioni della chiesa gli
errori risultano piuttosto contenuti.
L’andamento dei valori medi della chiarezza in funzione della frequenza (v.
Figura 5.89) presenta un andamento simile a quello del tempo di primo
decadimento e, mediamente, l’indice sintetico risulta pari a –7,3 dB, chiaramente
troppo basso se rapportato alle modeste dimensioni dell’ambiente, ma prevedibile
considerando l’alto tempo di riverberazione. L’andamento puntuale dei valori
medi consente interessanti riflessioni. In primo luogo, quando la sorgente è in A,
fra i punti simmetrici il parametro differisce mediamente solo di 0,5 dB. In
secondo luogo va notato che fra i punti 1 e 2 e quelli adiacenti sussiste una
differenza di circa 4 dB, imputabile certamente alla maggiore distanza ma,
probabilmente, anche alla presenza di forti riflessioni iniziali. Infine, è
interessante osservare che quando la sorgente è in B la chiarezza cresce
spostandosi verso la metà in cui essa è localizzata. Tracciando i valori in funzione
122 Capitolo 5

-2,0 -2,0

-3,0 -3,0

-4,0 -4,0

C80 (500-2k) (dB)


-5,0
C80 (dB)

-5,0
-6,0
-6,0
-7,0
-7,0
-8,0
-8,0
-9,0
-9,0 -10,0
125 250 500 1000 2000 4000

B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.89 - Chiesa di Ognissanti. Andamento dei valori di C80 al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500, 1000 e 2000 Hz (destra).

450 500

400 450

350 Ts (500-1k) (s)


400
Ts (s)

300
350
250

300
200

150 250
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
125 250 500 1000 2000 4000
Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.90 - Chiesa di Ognissanti. Andamento dei valori di Ts al variare della frequenza in
funzione delle diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori
medi a 500 e 1000 Hz (destra).
della distanza (v. Figura 5.88, destra), appare comunque un andamento piuttosto
regolare e, ancora una volta, assai diverso da quello predetto dalla teoria di
Barron.
Il tempo baricentrico mostra (v. Figura 5.90) un andamento con la frequenza
simile a quello della chiarezza, pur con un picco più pronunciato a 500 Hz.
Mediamente l’indice sintetico è pari a 406 ms denotando condizioni assai
sfavorevoli per il parlato. A livello puntuale si osservano differenze fra i punti
simmetrici di poco superiori al 2%, quando la sorgente è in A, ed un andamento
più regolare rispetto a C80.
L’analisi dell’andamento del RASTI (v. Figura 5.91, sinistra) mostra che le
condizioni di ascolto del parlato sono “scarse” essendo il suo valore medio pari a
32,1. A livello puntuale si osserva che in numerosi punti le condizioni risultano
anche “pessime”, risultando il parametro inferiore a 30. Solo nelle immediate
vicinanze della sorgente si riscontrano condizioni di intelligibilità prossime alla
sufficienza.
I criteri di eco non evidenziano problematiche particolari dal momento che,
tanto per la musica che per il parlato risultano sempre inferiori ai valori limite
prescritti.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 0,97; BR_L = 0,19 dB;
EBL = 8,1 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
tutti e tre gli indici risultano interni ai rispettivi intervalli ottimali, anche se i
valori dei primi due indici sono fra i più bassi finora riscontrati. In termini
Capitolo 5 123

45,0 0,90
0,85
40,0
0,80

Echo Criterion
0,75
35,0
RASTI 0,70

30,0 0,65
0,60
25,0 0,55
0,50

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
20,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
Posizioni dei ricevitori
Posizioni dei ricevitori EC_music EC_speech

Figura 5.91 - Chiesa di Ognissanti. Andamento punto per punto dei valori dei parametri di
intelligibilità del parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).

1,00 1,0
0,90 0,9
0,80 0,8
Bilanciamento dei bassi

Bilanciamento degli alti


Indici normalizzati
Indici normalizzati

0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
A_09
A_10
A_11
A_12
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
B_09
B_10
B_11
B_12
Combinazioni S_RR Combinazioni Sorg_Ric
EBR BR_L LTR TR

Figura 5.92 - Chiesa di Ognissanti. Andamento punto per punto dei parametri caratteristici del
bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per tenere conto dei
diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi sono diagrammati
in forma normalizzata.
puntuali BR risulta variare fra 0,88 e 1,04, risultando, ad eccezione di un caso,
sempre entro l’intervallo ottimale. L’osservazione dell’andamento punto per
punto degli altri parametri (v. Figura 5.92, sinistra) fornisce ulteriori informazioni.
Assunto che i valori minimi e massimi sono 3,5 e 14,8 dB per EBL, e –1,0 e
0,95 dB per BR_L, i due indici appaiono scarsamente correlati (R = –0,45). EBL
mostra un andamento decrescente con la distanza e in corrispondenza delle navate
laterali, mentre l’andamento di BR_L appare fluttuante e poco rispettoso anche
della simmetria dell’ambiente.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –11,4 dB e TR = 0,59; pertanto entrambi i valori sono al di sotto dei
rispettivi intervalli di accettabilità. In termini puntuali (v. Figura 5.92, destra) si
ha che LTR varia fra –12,1 e –10,7 dB, mentre TR varia fra 0,55 e 0,63,
mostrando che in tutti i punti esaminati le condizioni non sono accettabili. Infine,
si osserva che i due parametri appaiono discretamente correlati (negativamente)
(R = –0,70) e che, come già visto altrove, l’interpretazione dell’andamento
puntuale dei valori si sottrae a facili interpretazioni.
Analizzando, infine, gli indici binaurali si ha che i valori sintetici dei
descrittori dell’estensione apparente della sorgente sono pari a (1–IACCE) = 0,69,
e IADE = 0,43; risultando, quindi, entro i limiti enunciati in precedenza. L’analisi
dei valori puntuali (v. Figura 5.93, sinistra) mostra che i due parametri sono poco
correlati (R = 0,45), inoltre appare ben evidente, soprattutto considerando la IAD,
la differenza fra punti della navata centrale e punti delle navate.
124 Capitolo 5

1,00 0,60
0,90
0,40
0,80

Log(1-IACC) / IAD (dB)


0,70 0,20
(1-IACC) / IAD

0,60
0,50 0,00
0,40
-0,20
0,30
0,20 -0,40
0,10
0,00 -0,60

A_01

A_03

A_04

A_07

A_09

A_10

B_01

B_03

B_04

B_07

B_09

B_10
A_01

A_03

A_04

A_07

A_09

A_10

B_01

B_03

B_04

B_07

B_09

B_10
Combinazioni Sorgente_Ricevitore Combinazioni Sorgente_Ricevitore
1-IACCe IADe 10Log(1-IACClate) IADlate

Figura 5.93 - Chiesa di Ognissanti. Andamento punto per punto dei valori degli indici binaurali
relativi alla ASW (sinistra) e relativi al LEV (destra).
I descrittori dell’avvolgimento dell’ascoltatore assumono i seguenti valori
10Log(1–IACCL) = –0,36 dB, IADL = –0,12. Quest’ultimo assume qui il più basso
valore sinora riscontrato, a testimonianza della elevata diffusione del suono
presente in un ambiente pur privo di apparati decorativi ed, anzi, caratterizzato da
molte superfici focalizzanti. A livello puntuale (v. Figura 5.93, destra) i due indici
non appaiono correlati e, soprattutto la IAD, mostra notevoli fluttuazioni.

5.3.9 La chiesa della Vallisa a Bari

5.3.9.1 Cenni storici


La chiesa della Vallisa è una delle più antiche chiese di Bari. In origine era
dedicata a San Pietro e, probabilmente, risultava annessa al monastero di San
Benedetto. La denominazione “Vallisa” è dovuta alla colonia di Ravellesi che si
stanziarono a Bari nel XII secolo. Dal XVI secolo fra la popolazione locale
prevalse la denominazione “Vallisa”, mentre nel XVII secolo la chiesa venne
dedicata al culto della Vergine SS. della Purificazione. Rimasta abbandonata per
secoli è stata restaurata nel 1962 con la eliminazione di tutte le incrostazioni
barocche e la restituzione al primitivo stile bizantino. Da alcuni anni è utilizzata
come auditorium diocesano ed ospita conferenze e concerti solistici e cameristici.

5.3.9.2 Descrizione
Internamente la chiesa si presenta a tre navate (v. Figura 5.94) divise da una
serie di quattro colonne alternate a due pilastri con semicolonne addossate che
sorreggono archi a tutto sesto con ghiera. La navata centrale ha la copertura a
capriate lignee a vista, mentre le laterali sono coperte da travi oblique che
sorreggono gli spioventi. La parete di fondo è caratterizzata dalle tre absidi
semicircolari. Le colonne e le pareti sono in pietra calcarea a vista. Il pavimento è
in marmo ma, in corrispondenza dell’ultima campata è stato realizzato un palco in
legno. Le restanti campate sono occupate da sedie moderatamente imbottite.
Le principali dimensioni sono riportate di seguito:
Wn = 5,0 m Ln = 15 m Hn = 12 m
Wl = 2,6 m Hl = 7,0 m
Da = 4,0 m Ha = 8,5 m Dal = 2,0 m
Hal = 7,0 m
Vt = 1.521 m3 Vn = 900 m3 Sb = 120 m2
2 2
Sp = 162 m Sn = 75 m St = 1.120 m2 (appross.)
Capitolo 5 125

Figura 5.94 - Auditorium La Vallisa. Sezioni e pianta. In pianta sono indicati i punti di emissione
(…) e di ricezione ({). Scala 1:500.

5.3.9.3 Il rilievo acustico


Alla Vallisa sono stati presi in considerazione 8 punti di ricezione distribuiti
uniformemente all’interno della sala e due posizioni di emissione in
corrispondenza del centro della zona presbiteriale e di un’ala del transetto. Le
misure sono state condotte adottando la tecnica MLS, utilizzando segnali di
lunghezza pari a 2,56 s e una frequenza di campionamento di 51,2 kHz. In questa
chiesa le misure sono state condotte impiegando una catena di misura diversa
dalle altre e utilizzando solo il microfono omnidirezionale. Purtroppo l’inizio di
una serie di lavori di ristrutturazione ha impedito di eseguire le misure con la
catena di misura utilizzata in tutte le altre chiese. Pertanto per questo ambiente
non sono disponibili misure binaurali, mentre per alcuni dei parametri monoaurali
è stato necessario introdurre dei coefficienti correttivi al fine di ottenere risultati
omogenei con il restante campione.
La differenza principale risiede nel fatto che la sorgente omnidirezionale e
l’amplificatore sono diversi da quelli utilizzati in tutto il resto della campagna di
misura, quindi nel calcolo di G, EBL, e LTR sono stati introdotti degli opportuni
coefficienti correttivi per uniformare le misure. Tali coefficienti correttivi sono
stati ricavati misurando, come descritto nel paragrafo 3.4, i livelli di riferimento
per la catena di misura impiegata.

5.3.9.4 Analisi dei risultati


A differenza delle altre chiese finora considerate, quest’ultima è l’unica la
cui destinazione d’uso è stata modificata, essendo destinata ad auditorium. Le
minori dimensioni e la presenza di sedie con modesta imbottitura lasciano
prevedere caratteristiche acustiche diverse, e migliori, di quelle altrove osservate.
Cominciando dall’analisi dei tempi di riverberazione (v. Figura 5.95), si
osserva che i tempi medi alle varie frequenze sono considerevolmente più bassi di
quelli finora riscontrati, in particolare alle medie frequenze RT è pari a 2,1 s, un
valore buono che, a sala occupata, dovrebbe diminuire rientrando nell’intervallo
dei valori ottimali per le sale di musica da camera. Non si osservano differenze
126 Capitolo 5

significative fra i valori medi relativi alle due posizioni della sorgente. In termini
puntuali si osservano variazioni massime del 10%, ma mediamente si ha una
buona omogeneità intorno al valore medio.
Il tempo di primo decadimento (v. Figura 5.96) mostra piccole differenze
rispetto ad RT sia in termini medi, dove si ha EDTmid = 2,1 s, che in termini
puntuali dove, a parte per le combinazioni B_03 e B_04, si riscontrano variazioni
modeste intorno al valore medio, con una minore accentuazione delle differenze
fra punti vicini e lontani, e fra punti della navata centrale e delle navate laterali.
3,5 2,5

3,0 2,3

RT(500-1000 Hz) (s)


2,5 2,1
RT (s)

2,0 1,9

1,7
1,5

1,5
1,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media

Figura 5.95 - La Vallisa. Andamento di EDT e RT per diverse combinazioni sorgente-ricevitore


relativo a 125 Hz (sinistra) e alla media di 500 e 1000 Hz (destra).

3,5 2,5

3,0 2,3
EDT(500-1000 Hz) (s)

2,5 2,1
EDT (s)

2,0 1,9

1,5 1,7

1,0 1,5
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media EDT RT

Figura 5.96 - La Vallisa. Andamento dei valori di EDT al variare della frequenza in funzione delle
diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500 e
1000 Hz confrontato con l’andamento di RT (destra).
L’analisi dei valori del fattore di forza (v. Figura 5.97) mostra un andamento
in funzione della frequenza in tutto simile a quello dei tempi di riverberazione.
Mediamente risulta Gmid = 15,3 dB e G(A) = 21 dB, ed il confronto con i valori
ottenuti nel caso precedente (rispettivamente 19,3 e 24,1 dB), considerato che i
volumi dei due ambienti non sono molto dissimili, mostra chiaramente l’effetto
del maggiore assorbimento, dovuto alle sedie e alla copertura lignea. In termini
assoluti i due valori, pur risultando al di fuori dell’intervallo ottimale, non sono
criticabili, dal momento che il volume dell’ambiente è notevolmente inferiore a
quello degli ambienti per cui quei valori ottimali sono stati fissati. In termini
puntuali si osservano variazioni di Gmid contenute entro i 2 dB, il che denota una
ottima uniformità del livello sonoro nella sala. A fronte di ciò, diagrammando i
valori in funzione della distanza (v. Figura 5.98) si evidenzia una maggiore
dispersione dei punti intorno alla curva di migliore adattamento. Quest’ultima
appare assai simile a quella ottenuta applicando la teoria di Barron, ma traslata di
circa 1,5 dB verso il basso.
Capitolo 5 127

18,0 24,0

17,0 22,0

16,0 20,0

G10 (dB)
G10 (dB) 15,0 18,0

16,0
14,0
14,0
13,0
12,0
12,0

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
125 250 500 1000 2000 4000
Frequenze (Hz) Combinazioni S_RR
Media A Media B Media G(A) Gmid

Figura 5.97 - La Vallisa. Andamento dei valori di G al variare della frequenza in funzione delle
diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500 e
1000 Hz e pesati in scala A (destra).

18,00 2,0

17,00 1,0

0,0
16,00
G10@1kHz

C80@1kHz
-1,0
15,00 y = -3,07Ln(x) + 3,90
-2,0
R2 = 0,66
14,00
-3,0
y = -1,45Ln(x) + 18,00
13,00 -4,0
R2 = 0,64
12,00 -5,0
0,00 5,00 10,00 15,00 20,00 0,0 5,0 10,0 15,0 20,0

Distanza (m) Distanza (m)

A B Teorici (Barron) A B Teorici (Barron)

Figura 5.98 - La Vallisa. Andamento di G (sinistra) e di C80 (destra) a 1 kHz, in funzione della
distanza sorgente ricevitore. Con il rombo è indicato il punto corrispondente alla combinazione
A_06. La curva tratteggiata riporta l’andamento teorico dei valori secondo la teoria di Barron [11].

0,0 1,0
-0,5 0,5
-1,0 0,0
-0,5
C80 (500-2k) (dB)

-1,5
-1,0
C80 (dB)

-2,0 -1,5
-2,5 -2,0
-3,0 -2,5
-3,0
-3,5
-3,5
-4,0
-4,0
-4,5 -4,5
125 250 500 1000 2000 4000
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08

Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.99 - La Vallisa. Andamento dei valori di C80 al variare della frequenza in funzione delle
diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500, 1000
e 2000 Hz (destra).
Passando in esame la chiarezza (v. Figura 5.99) si osserva il consueto
andamento in funzione della frequenza caratterizzato dalla presenza di un picco
negativo a 500 Hz. Mediamente risulta C80(3) = –2,5 dB, valore un po’ basso per
una sala destinata a concerti cameristici, ma tutto sommato accettabile. Al variare
della posizione della sorgente si osserva solo un anomala differenza fra i valori
medi a 125 Hz. L’analisi dei valori puntuali risulta di grande interesse poiché
mostra che per i punti 1 e 2 si hanno condizioni buone, mentre nei rimanenti punti
la chiarezza varia fra –2,5 e –4,0 dB, denotando una qualità acustica inferiore. In
corrispondenza della combinazione A_06 si osserva un picco negativo dovuto alla
attenuazione del suono diretto da parte di uno dei pilastri che risulta frapposto fra
128 Capitolo 5

sorgente e ricevitore. Il bassissimo valore assunto in tale punto alla frequenza di


125 Hz è, in parte, responsabile anche dell’anomalia rilevata precedentemente. Il
confronto con l’andamento teorico di Barron mostra che i valori predetti sono
sovrastimati e che la pendenza della curva di migliore adattamento relativa ai
punti misurati risulta maggiore di quella teorica.
L’andamento del tempo baricentrico al variare della frequenza (v. Figura
5.100), pur risultando abbastanza lineare presenta un picco in corrispondenza dei
500 Hz e ripropone a 125 Hz la notevole differenza fra i valori medi relativi alle
due posizioni della sorgente. Mediamente l’indice sintetico è pari a 169 ms,
corrispondente ad una percezione del parlato quasi “sufficiente”. A livello
puntuale si riscontra una variazione compresa fra 127 e 192 ms, evidenziando un
andamento assai simile a quello di C80(3) testimoniato dall’elevato coefficiente di
correlazione (R = –0,96).
L’andamento degli indici di intelligibilità conferma, risultando STI = 45,3 e
RASTI = 47,4, che nella sala vi sono, mediamente, condizioni “sufficienti”.
L’andamento puntuale rivela una certa discordanza fra i due indici,
particolarmente evidente in alcuni punti. Si osserva inoltre che, quando la
sorgente è in A, nei punti più distanti lo STI risulta inferiore alla soglia di
“sufficienza”, mentre quando la sorgente è in B solo i due punti più vicini
superano significativamente questa soglia.
L’analisi dell’andamento dei criteri di eco non evidenzia problemi
particolari, risultando i valori di entrambi i parametri sempre inferiori ai valori
limite.
260 200
190
240
180
220
170
Ts (500-1k) (s)

200 160
Ts (s)

180 150
140
160
130
140
120
120 110
100 100
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

125 250 500 1000 2000 4000


Frequenze (Hz)
Combinazioni S_RR
Media A Media B Media

Figura 5.100 - La Vallisa. Andamento dei valori di Ts al variare della frequenza in funzione delle
diverse posizioni della sorgente (sinistra) e andamento punto per punto dei valori medi a 500 e
1000 Hz (destra).

60,0 0,80

55,0 0,75

50,0 0,70
Echo Criterion
STI/RASTI

45,0 0,65

40,0 0,60

35,0 0,55

30,0 0,50
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08

Posizioni dei ricevitori Posizioni dei ricevitori


STI RASTI EC_music EC_speech

Figura 5.101 - La Vallisa. Andamento punto per punto dei valori dei parametri di intelligibilità del
parlato (sinistra) e andamento punto per punto dei criteri di eco (destra).
Capitolo 5 129

1,00 1,0
0,90 0,9
0,80 0,8

Bilanciamento dei bassi

Bilanciamento degli alti


Indici normalizzati

Indici normalizzati
0,70 0,7
0,60 0,6
0,50 0,5
0,40 0,4
0,30 0,3
0,20 0,2
0,10 0,1
0,00 0,0

B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08

A_01
A_02
A_03
A_04
A_05
A_06
A_07
A_08
B_01
B_02
B_03
B_04
B_05
B_06
B_07
B_08
Combinazioni S_RR Combinazioni Sorg_Ric
EBR BR_L LTR TR

Figura 5.102 - La Vallisa. Chiesa di Ognissanti. Andamento punto per punto dei parametri
caratteristici del bilanciamento delle basse frequenze (sinistra) e delle alte frequenze (destra). Per
tenere conto dei diversi intervalli di variabilità dei parametri (e delle diverse unità di misura) essi
sono diagrammati in forma normalizzata.
Prendendo in considerazione i parametri caratterizzanti il bilanciamento
delle basse frequenze i valori medi risultano essere: BR = 1,34; BR_L = 1,27 dB;
EBL = 10,6 dB. Il confronto con i valori limite riportati in Tabella 2.5 mostra che
tutti e tre gli indici risultano superiori ai rispettivi intervalli ottimali. Tutti e tre i
parametri assumono i più alti valori fra quelli misurati in questa campagna,
evidenziando che la presenza delle sedie imbottite introduce un assorbimento
maggiore alle frequenze medio-alte che a quelle basse, con la conseguenza di
determinare una enfatizzazione eccessiva di queste ultime. Bisogna infatti tenere
conto che secondo alcuni autori [14] nelle sale per musica da camera il BR
dovrebbe assumere valore unitario. In termini puntuali BR risulta variare fra 1,24
e 1,39, risultando, ad eccezione di un caso, sempre abbastanza elevato.
L’osservazione dell’andamento punto per punto degli altri parametri (v. Figura
5.102, sinistra) mostra che i due parametri non risultano correlati. I valori minimi
e massimi sono 7,3 e 16,1 dB per EBL, e 0,2 e 2,2 dB per BR_L. EBL mostra un
andamento decrescente con la distanza con alcuni picchi difficilmente
interpretabili.
Per il bilanciamento delle alte frequenze i descrittori sintetici risultano
essere LTR = –6,7 dB e TR = 0,83; pertanto entrambi i valori sono all’interno dei
rispettivi intervalli ed, anch’essi, assumono i valori più alti rilevati in questo
lavoro. È evidente che la presenza di un maggiore assorbimento alle frequenze
medio-alte, abbinato al volume relativamente modesto che rende meno importante
l’assorbimento d