Matematica Della Musica

TEMPERAMENTI: MATEMATICA E TEORIA MUSICALE
STEFANO ISOLA
UNIVERSITÀ DI CAMERINO
Musica est exercitium arithmeticae occultum nescientis se numerare animi

Leibniz (1646-1716)
1
1. I NTRODUZIONE
La teoria musicale è un insieme di metodi per analizzare, organizzare e comporre il materiale

musicale. In senso più stretto essa consiste nella descrizione per mezzo di parole e simboli degli
elementi costitutivi della musica - cioè il suono e le sue caratteristiche fondamentali di altezza,
durata, intensità e timbro - nonchè delle relazioni tra la semiografia (notazione musicale), la sua
esecuzione e la sua percezione da parte degli ascoltatori (lo studio di come gli esseri umani in-
terpretano i suoni è chiamato invece psicoacustica). In senso più lato, la teoria musicale consiste
nell’individuare alcuni fatti costitutivi dell’esperienza musicale, come la consonanza, la disso-
nanza, il temperamento, il ritmo, etc., e nel formularne una descrizione a livelli diversi: acustico,
cognitivo, fenomenologico, sociale, etc. basandosi sulle modalità d’indagine che discipline diverse
come la fisica, la psicologia, la filosofia, la sociologia, etc. hanno sviluppato.
Si può poi concepire un livello più astratto di descrizione dei fatti musicali che attraverso l’uso della
matematica renda possibile la costruzione di ‘passaggi’ concettuali da un livello di descrizione a
un altro attraverso la ‘traduzione’ tra i modelli matematici delle corrispondenti strutture o processi.
Una simile formulazione potrebbe poi essere utilizzata non solo a livello della descrizione e or-
ganizzazione di fatti musicali esistenti, ma anche per la creazione di fatti musicali nuovi ottenuti
dalla ‘traduzione’ di modelli matematici alternativi.
Vedremo nel seguito in che modo questo livello astratto può essere costruito basandosi sulla genesi
storica di alcuni fatti musicali fondamentali, in primo luogo l’organizzazione dei suoni in strutture
ordinate dette scale o temperamenti.
La prima civiltà che ha affrontato in profondità e a diversi livelli il rapporto tra musica e matematica
è stata la cosiddetta civiltà ellenica, sviluppatasi principalmente in Grecia e in Italia meridionale
dal VI a tutto il IV secolo a.C., in particolare con la scuola pitagorica (Pitagora, Filolao, Archita) e
le sue derivazioni platoniche (Platone, Eudosso) e i suoi critici di scuola aristotelica (Aristosseno).
Ha poi continuato a svilupparsi nel corso dell’ellenismo, sia nella sua fase greca (Euclide, Didimo,
etc.), dal 323 a.C., anno della morte di Alessandro Magno, al 31 a.C., anno della conquista romana
dell’Egitto, sia nella sua fase romana (Tolomeo, Boezio, etc.), dal 31 a.C. al 529 d.C., anno in
cui l’imperatore Giustiniano nella sua campagna di persecuzione dei pagani ordinò la chiusura
dell’Accademia Platonica di Atene. Dopo una fase di latenza nel corso del Medioevo cristiano,
l’interesse per questo tema è nuovamente esploso nel primo Rinascimento europeo, da parte di
teorici (Gaffurio, Zarlino, Galilei, etc.) ma anche di artisti come Leon Battista Alberti, Leonardo
da Vinci e Filippo Brunelleschi, finendo poi per contribuire alla ricerca scientifica stimolando
in forme diverse l’immaginazione di Keplero, Mersenne, Galileo, Stevino, Cartesio, Huygens,
Hooke, Newton, lungo tutto il corso della Rivoluzione Scientifica, a partire dalla metà del XVI
secolo alla fine del XVII. Nel secolo dei Lumi il tema divenne più che altro elemento di dibattito
su questioni astratte1 quali: cos’è l’arte? cosa s’intende per naturale? E così via. Ma la ricerca
di connessioni profonde tra musica e matematica, e più in generale con il sapere nelle sue varie
1
A parte alcune importanti eccezioni, come Eulero.
2
articolazioni, iniziò a declinare fortemente in seguito al farsi strada di una visione ‘pragmatico-
strumentale’ della scienza e della cultura. Elementi di rinnovato interesse e nuovi contributi sono
emersi nel XX secolo, anche in connessione con la comparsa di strumenti di sintesi elettronica del
suono, e continuano ad emergere in quello attuale, sebbene inevitabilmente confinati nell’ambito
di dipartimenti specializzati e settori disciplinari di vario tipo.
Per dare un’idea di che cosa si poteva intendere con la parola musico all’inizio del XVII secolo,
riportiamo la definizione redatta da William Brouncker2 nella sua traduzione del Compendium
musicae di Cartesio, pubblicata nel 1653.
Al musico completo [...] si richiede più di una conoscenza superficiale di tutti i

generi del sapere umano. Infatti, egli deve essere un fisiologo, per dimostrare la
creazione, la natura, le proprietà e gli effetti di un suono naturale. Un filologo,
per indagare sulla sua prima invenzione, istituzione e successiva propagazione di
un suono artificiale o musicale. Un aritmetico, per essere in grado di spiegare le
cause dei moti armonici coi numeri, e svelare i misteri della nuova musica alge-
brica. Un geometra, per dedurre, nella loro gran varietà l’originale degli intervalli
consonanti-dissonanti attraverso la divisione geometrica, algebrica e meccanica
di un monocordo. Un poeta, per conformare i suoi pensieri e le parole alle leggi
dei numeri precisi, e distinguere l’eufonia delle vocali e delle sillabe. Un mecca-
nico, per conoscere la struttura squisita e la fabbrica di tutti gli strumenti musi-
cali [...]. Un metallista, per esplorare le differenti contemperazioni del baritono
e dell’ossitono3 [...] Un anatomista, per convincere circa il modo e gli organi
dell’udito. Un melotecnico, per progettare un metodo dimostrativo di composizione
o disposizione di tutti i toni e le arie. E, da ultimo, egli deve essere a tal punto un
mago da eccitare lo stupore trasformando nella pratica i taumaturgici, meravigliosi
segreti della musica: penso alle simpatie ed antipatie tra i suoni consonanti e dis-
sonanti [...] e infine, la musica criptologica, attraverso cui le segrete idee della
mente possano essere comunicate, col linguaggio di suoni inarticolati, a un amico
a grande distanza.
2
William Brouncker (1620-1684), matematico irlandese, fondatore della Royal Society di Londra.
3
Un antico il criterio fonico, trasversale alla tripartizione in corde, fiati e percussioni, distingueva gli strumenti
musicali tra ossitoni e baritoni in base all’altezza del suono prodotto.
3
2. I L SUONO
Il fine della musica è dilettare e muovere in noi diversi sentimenti4, il mezzo per raggiungere tale
fine è il suono, che consiste in una vibrazione dell’aria (o altro mezzo elastico) prodotta da un corpo
in movimento. Se un corpo, ad esempio una corda, viene messo in vibrazione, si determina un’onda
sonora di una certa frequenza ν (numero di oscillazioni per unità di tempo) e una certa ampiezza
(differenza tra la massima pressione prodotta dall’onda sonora e la pressione atmosferica).
Quanto più grande è la frequenza, tanto più acuto è il suono. Più in generale, la vibrazione di una
corda è una sovrapposizione dei suoi ‘automodi’, ovvero vibrazioni elementari determinate da un
crescente numero di ventri e di nodi. Il numero di nodi determina la frequenza della vibrazione ele-
mentare ed essendo tale numero necessariamente intero le frequenze sono multiple della frequenza
base. Otteniamo così la serie armonica:
ν, 2ν, 3ν, 4ν, 5ν, 6ν, 7ν . . .
2.1. Il moto armonico e le onde sinusoidali. Una modellizzazione matematica completa di una
corda vibrante fa uso di equazioni differenziali alle derivate parziali e delle serie di Fourier. Possi-
amo tuttavia capire alcune cose anche utilizzando un modello semplificato, consistente nell’immaginare
la massa m della corda in questione tutta concentrata nel punto di mezzo, la cui distanza dalla po-
sizione di equilibrio (corda ferma) indichiamo con y. Durante la vibrazione la corda esercita una
forza F sul ‘punto materiale’ che lo richiama verso la posizione di equilibrio y = 0, e la cui
intensità, almeno per piccoli spostamenti, cioè per y piccolo, è proporzionale ad y stesso:
F = −ky
4
René Descartes, Compendium Musicae, 1618
4
La legge del moto di Newton F = ma dove a = d2 y/dt2 si scrive dunque
d2 y ky
+ =0
dt2 m
la cui soluzione, com’è facile verificare, ha la forma
p p
y = A cos( k/m t) + B sin( k/m t)
p
Si tratta di una funzione che oscilla periodicamente nel tempo con periodo T = 2π m/k e
frequenza ν1 = 1/T .
Il fatto che le soluzioni di questa equazione differenziale siano fatte così è la spiegazione del perchè
le funzioni sinusoidali rivestano un ruolo centrale nel descrivere i fenomeni oscillatori come il
suono. Il fatto che vi compaia anche la funzione coseno non deve far pensare che stiamo usando
una terminologia inappropriata perchè la relazione cos x = sin(x + π2 ) dice che una cosinusoide è
una sinusoide con fase diversa. Ricordiamo che un’espressione del tipo
C sin(2πνt + α)
rappresenta un’onda sinusoidale con frequenza ν, ampiezza C e fase α.
Usando le relazioni trigonometriche

(1) sin(a + b) = sin a cos b + cos a sin b
(2) cos(a + b) = cos a cos b − sin a sin b

possiamo riscriverla nella forma
C sin(2πνt + α) = A cos(2πν t) + B sin(2πν t)
con
A = C sin α, B = C cos α
e inversamente
√
C= A2 + B 2 , tan α = A/B
5
Tornando alla nostra corda vibrante, è abbastanza evidente che se la massa, invece di essere con-
centrata in un punto, la immaginiamo distribuita uniformemente lungo la corda (dunque con den-
sità m/`) allora saranno possibili anche altri ‘modi’ di vibrazione. Ad esempio il punto medio
della corda potrebbe rimanere stazionario mentre le due metà della corda vibrano con fasi opposte,
come la seconda situazione nella figura riportata sopra. Su una chitarra ciò si ottiene facilmente
toccando leggermente con un dito il punto medio di una corda proprio mentre la pizzichiamo e
lasciandola poi subito libera di vibrare. Ora se una corda di lunghezza ` produce un suono di fre-
quenza ν = 512 Hz, una corda di lunghezza `/2 ne produce uno di frequenza doppia 2 ν = 1024
Hz. Pertanto la situazione appena descritta dà luogo alla seconda armonica, un’ottava sopra la
fondamentale. In questo caso il moto di un punto qualsiasi della corda diverso dal punto medio è
descritto dalla funzione
p p
y = A cos(2 k/m t) + B sin(2 k/m t)
che oscilla periodicamente nel tempo con frequenza ν2 = 2ν1 . Se invece mentre pizzichiamo la
corda di una chitarra la tocchiamo leggermente ad una distanza da un suo estremo pari a un terzo
della sua lunghezza lasciandola poi subito libera di vibrare allora otteniamo un’oscillazione in cui
vi sono due punti stazionari e le tre parti della corda in movimento oscillano ciascuna con un’onda
sinusoidale, la parte di mezzo con fase opposta alle altre due. Ciò produce la terza armonica
ν3 = 3ν1 illustrata nella terza situazione nella figura riportata sopra e descritta dalla funzione
p p
y = A cos(3 k/m t) + B sin(3 k/m t)
In generale, una corda che vibra produrrà una mistura di armoniche ciascuna con la sua ampiezza,
per cui la funzione che descriverà il suo moto avrà la forma
X∞
p p
y= An cos(n k/m t) + Bn sin(n k/m t)
n=1
Modi diversi di mettere in vibrazione una corda (per sfregamento, pizzicamento, percussione, ecc)
producono onde sonore di forme diverse, caratterizzate da diversi insiemi di ampiezze An e Bn
e dunque da diversi insiemi di armonici. Gli armonici effettivamente presenti (cioè quelli con
ampiezza non nulla) in un dato suono sono detti parziali, e la qualità e la quantità di questi parziali
rende ragione del suo timbro. Possiamo a questo punto introdurre, a livello euristico e non rig-
oroso, la nozione di spettro di un suono, che consiste in un grafico che indica le ampiezze delle
varie frequenze che fanno parte del suono stesso. Lo spettro di una corda vibrante è uno spettro
discreto come quello mostrato in figura
Un esempio di spettro continuo è invece quello che corrisponde ad un rumore bianco in cui tutte
le possibili frequenze partecipano con la stessa ampiezza (spettro piatto).
6
Evidentemente lo spettro di un suono contiene tutte le ampiezze delle frequenze che lo compon-
gono ma non la loro fase.
2.2. Battimenti. Da un punto di vista matematico, il fatto che una corda possa oscillare con di-
verse frequenze contemporaneamente è un problema che viene risolto dalla teoria delle serie di
Fourier. Limitiamoci qui a dire qualcosa in più sulle onde sinusoidali e sul modo in cui interagis-
cono. Ad esempio se sovrapponiamo due suoni sinusoidali con uguale frequenza otterremo uno
suono della stessa frequenza ma di ampiezza pari alla somme delle ampiezze. Se invece i due suoni
hanno frequenze diverse ma vicine, allora si verifica un interessante fenomeno noto con il nome di
battimenti. Per comprendere di cosa si tratta sostituiamo b con −b nelle relazioni trigonometriche
(1) e (2). Notando che sin(−b) = − sin b e cos(−b) = cos b otteniamo
(3) sin(a − b) = sin a cos b − cos a sin b
(4) cos(a − b) = cos a cos b + sin a sin b

Sommando la (1) con la (3) e la (2) con la (4) si ottengono le relazioni
(5) sin(a + b) + sin(a − b) = 2 sin a cos b
(6) cos(a + b) + cos(a − b) = 2 cos a cos b

Se ora poniamo u = a + b e v = a − b e dunque a = (u + v)/2 e b = (u − v)/2 possiamo riscrivere
queste ultime nella forma
u+v u−v
(7) sin u + sin v = 2 sin( ) cos( )
2 2
u+v u−v
(8) cos u + cos v = 2 cos( ) cos( )
2 2
Vediamo dunque che la sovrapposizione di due suoni con frequenze molto vicine produce un suono
con frequenza pari alla media artimetica delle due frequenze modulato da un’oscillazione lenta, con
frequenza pari alla metà della differenza tra le due frequenze. Più le due frequenze sono vicine, più
lenta è dunque la modulazione. Com’è noto, proprio questo effetto viene utilizzato per intonare
alcuni strumenti musicali.
7
2.3. La propagazione e la percezione del suono. L’acustica è una disciplina che studia le onde
sonore da tre punti di vista:
• quello della loro sorgente, cioè del modo in cui il suono viene generato, includendo la
meccanica dei corpi vibranti e dunque la fisica degli strumenti musicali;
• quello del mezzo in cui si propagano, nella fattispecie l’aria, includendo i meccanismi
(assorbimento, dispersione, interferenza) con cui tale propagazione può essere attenuata,
distorta o bloccata;
• quello del loro ricevitore, cioè di come udiamo i suoni. Ciò include evidentemente il
funzionamento dell’orecchio ma anche gli aspetti psicoacustici legati al modo in cui misure
oggettive di stimoli sonori si traducono in particolari esperienze soggettive.
Riguardo ai primi due punti ci basti osservare che un corpo vibrante trasferisce energia all’aria cir-
costante generando onde longitudinali di compressione e rarefazione. Ma cos’è l’aria? L’aria è un
gas, ovvero una sostanza composta di particelle, atomi e molecole, libere di muoversi assumendo
ciascuna una certa velocità ed urtandosi a vicenda. Per questo un gas non ha un volume definito
ma tende ad occupare tutto lo spazio a sua disposizione, e assume la forma del contenitore che lo
contiene, riempiendolo completamente. Ma perchè le particelle dell’aria non cadono tutte a terra
per effetto della gravità? La risposta risiede nella velocità elevatissima delle suddette particelle (in
condizioni normali di pressione e temperatura circa 450 − 500 metri al secondo, ovvero circa 1800
kilometri all’ora). Essendo poi tali particelle molto leggere, noi non avvertiamo i singoli urti sulla
nostra pelle, ma solo il loro effetto combinato, il quale altro non è che la pressione atmosferica.
Inoltre il libero cammino medio di una molecola d’aria, cioè la distanza percorsa in media tra due
urti successivi, è di circa 6 × 10−8 metri (ovvero 6 centimillesimi di millimetro). Ciò significa che
il numero medio di urti al secondo è 500/6 × 10−8 ∼ 1010 . L’effetto di questo numero enorme di
urti è evidentemente quello di far eseguire a ciascuna particella un moto estremamente disordinato
in cui non riesce a cadere verticalmente senza essere presto risospinta verso l’alto. L’effetto della
gravità sarà dunque solo un effetto medio osservabile in un gradiente di pressione per cui ad alta
quota la pressione atmosferica è significativamente più bassa.
Riassumendo, l’aria consiste in un grande numero di molecole che si urtano continuamente cau-
sando un effetto medio percepito come pressione. Un corpo che vibra vi produce delle onde in
8
cui si susseguono zone di pressione più alta e zone di pressione più bassa. Tali onde si propagano
nell’aria ad una velocità di circa 340 metri al secondo (circa 1200 kilometri l’ora). Ciò non sig-
nifica che una particolare molecola di aria si muova nella direzione dell’onda, ma soltanto che
la perturbazione locale di pressione (compressione o rarefazione) si propaga a quella velocità, in
modo simile a quello che succede sulla superficie del mare mossa dalle onde, in cui non c’è una
particolare massa d’acqua che si muove nella direzione dell’onda, ma quello che si propaga è pi-
uttosto la perturbazione locale del livello della superficie (cresta e valle). Tuttavia, nelle onde del
mare il movimento locale è perpendicolare alla direzione di propagazione, si parla in questo caso
di onde trasversali, mentre le onde sonore sono onde longitudinali, in cui il movimento locale di
compressione e rarefazione avviene nella stessa direzione della propagazione.
Onda trasversale
Onda longitudinale
Riguardo all’ultimo punto, l’orecchio umano si distingue in tre parti: l’orecchio esterno formato
dal padiglione auricolare che raccogli i suoni per inviarli nel canale uditivo, al termine del quale si
trova la membrana del timpano su cui vanno ad infrangersi le onde sonore mettendola in vibrazione.
Tali vibrazioni meccaniche attraversano l’orecchio medio per mezzo di un sistema di tre ossicini,
il martello, l’incudine e la staffa. L’orecchio medio comunica con l’esterno attraverso la tromba di
Eustachio, mantenendo in equilibrio la pressione tra i due lati del timpano.
9
Infine c’è l’orecchio interno, detto anche labirinto auricolare, un sistema di passaggi composto
da due parti: l’organo dell’udito, o coclea, e l’apparato vestibolare, cioè l’organo dell’equilibrio
composto da tre canali semicircolari e dal vestibolo.
Il terzo ossicino dell’orecchio medio, la staffa, muovendosi avanti e indietro entro la finestra ovale
della coclea trasmette l’impulso cinetico alla linfa in essa contenuta. Attraverso il condotto co-
cleare le onde vengono trasmesse dalla rampa vestibolare alla rampa timpanica mettendo in vi-
brazione la membrana basilare, la membrana che separa le due rampe, e che possiamo immaginare
si comporti localmente come una corda vibrante. Adagiato su di essa si trova l’organo di Corti,
una struttura cellulare fatta da una doppia serie di cellule acustiche ciliate, interne ed esterne, in
numero di circa 30.000. Le cellule acustiche sono in contatto con le cellule nervose che fanno parte
del nervo vestibolococleare. Di lì il segnale giunge all’area acustica della corteccia cerebrale e poi
al lobo temporale del cervello: qui avviene la decodifica dell’impulso elettrico e si giunge così alla
percezione del suono.
10
Nella prossima figura è mostrato uno schema semplificato dell’orecchio: 1. canale uditivo, 2.
timpano, 3. martello, 4. incudine, 5. staffa, 6. finestra ovale, 7. coclea (srotolata), 8. membrana
basilare, 9. finestra rotonda, 10. tromba di Eustachio.
In che modo le vibrazioni della membrana basilare riescono a discriminare suoni di diversa fre-
quenza? Il fisico e fisiologo tedesco Hermann von Helmholtz (1821-1894) ne La teoria delle
sensazioni tonali come base fisiologica della teoria musicale (1863) sostenne che il meccanismo di
discriminazione delle frequenze fosse di tipo posizionale: suoni di frequenze diverse mettono in
moto regioni diverse della membrana basilare, cosicché quest’ultima si comporta come una sorta
di analizzatore di spettro che associa posizioni a frequenze. Quando un’onda sinusoidale viene
trasmessa dalla staffa alla linfa cocleare, la velocità di propagazione dell’onda di fluido in ogni
punto della coclea dipenderà essenzialmente da tre fattori: la frequenza dell’onda, l’area della
sezione della coclea in quel punto e le caratteristiche locali, rigidità, spessore e densità, della
membrana. In particolare, quest’ultima è più fine, più rigida e più stretta vicino alla base. Come
11
conseguenza, la velocità di propagazione decresce avvicinandosi all’apice fino ad annullarsi nella
regione dove l’onda non riesce più a sostenersi e tale regione sarà tanto più lontana dalla staffa
quanto più bassa è la frequenza dell’onda.
Ciò dà conto di alcuni fenomeni percettivi fondamentali:

(1) L’esistenza di un intervallo di frequenze udibili, che per l’orecchio umano spazia approssi-
mativamente da 20 a 20000 Hz.
(2) La percezione degli intervalli musicali come rapporti di frequenze (e non come differenze).
Se ad esempio la frequenza raddoppia la posizione del massimo si sposta verso la staffa
di una quantità costante. Dunque nel confronto tra due suoni diversi il nostro orecchio
percepisce non la differenza tra due frequenze ma la differenza tra i loro logaritmi5 La base
b del logaritmo viene poi scelta in modo che l’ottava abbia largezza unitaria:
logb (2ν : ν) = logb 2 = 1 =⇒ b=2
(3) L’effetto del mascheramento, per cui un suono intenso di bassa frequenza attenua forte-
mente la percezione di un altro suono meno intenso di frequenza più elevata, mentre non
accade il contrario, cioè che un suono intenso di alta frequenza attenui la percezione di un
altro suono meno intenso di frequenza più bassa. Ciò si spiega osservando che per raggiun-
gere la regione di risonanza lungo la membrana basilare, il debole suono di bassa frequenza
deve ‘scavalcare’ la forte eccitazione, più vicina alla staffa, causata dal preesistente suono
di alta frequenza. Tale effetto viene ad esempio sfruttato nel protocollo di codifica MP3
per ridurre l’informazione da digitalizzare.
Un’altra nozione interessante in questo contesto è quella di larghezza di banda critica, riferita
al fatto che la regione della membrana basilare che viene posta in vibrazione da un’onda di data
frequenza ha una larghezza definita. Ciò rende tale regione un filtro passa-banda, che lascia passare
alcune frequenze e ne blocca altre. La larghezza di tale banda è dunque il massimo intervallo tra le
frequenze tra due suoni simultanei non risolti dall’orecchio. Se ad esempio due note di 100 Hz e
110 Hz vengono suonate simultaneamente, allora si udirà un unico suono (con battimenti) perchè
5
Anche la percezione dell’intensità sonora avviene su scala logaritmica. L’intensità sonora I è una grandezza fisica
che ha le dimensioni di un flusso di energia (misurato in W/m2 ). Al contrario il livello d’intensità sonora è la quantità
adimensionale LI = 10 log10 (I/I0 ), misurata in decibel (db), dove I0 = 10−12 W/m2 è la soglia di udibilità. Così ad
esempio 20 db corrispondono ad un respiro umano a due metri di distanza, 60 db ad una conversazione animata, 100
db ad un martello pneumatico, etc. Il rapporto tra l’intensità sonora di due suoni il cui livello differisce di k db è pari
a 10k/10 . Così, un incremento di 3 db corrisponde a 100,3 ' 2, cioè al raddoppio dell’intensità sonora.
12
la larghezza di banda critica a 100 Hz è maggiore di 10 Hz. Più in generale, quando percepisce
un suono complesso il sistema uditivo funziona come un analizzatore meccanico di spettro in
cui la coclea opera come se fosse fatta da una serie di filtri di larghezza pari alla larghezza di
banda critica. Tale larghezza è approssimativamente costante fino a 500 Hz e cresce in modo
approssimativamente lineare con la frequenza per frequenze superiori. L’intervallo di frequenze
udibili comprende circa 24 bande critiche. Tuttavia non bisogna pensare che vi siano 24 filtri
indipendenti, al contrario le bande critiche formano un sistema continuo nel senso che un tono di
una qualunque frequenza udibile ‘troverà’ una banda critica centrata su di esso.
3. C ONSONANZA E DISSONANZA
Nella pratica musicale ha poca importanza la capacità di associare ad una data nota la frequenza
corretta (orecchio assoluto). Molto più importante è quella di riconoscere l’intervallo formato tra
due note consecutive, inteso come la distanza tra due note misurata per mezzo del rapporto delle
loro frequenze. Una caratteristica peculiare di un intervallo è la sua qualità di essere più o meno
consonante o viceversa più o meno dissonante.
L’uso di questi termini ha elementi di soggettività, ma come vedremo esistono anche precise basi
fisiche e fisiologiche che fanno sì che tutte le civiltà, in luoghi e tempi diversi, abbiano individuato
alcuni intervalli privilegiati. Ad esempio,
il rapporto 2 : 1 corrispondente all’intervallo [ν, 2ν] si chiama ottava,
il rapporto 3 : 2 corrispondente alla metà dell’intervallo [ν, 2ν] si chiama quinta giusta,
il rapporto 4 : 3 corrispondente ad un terzo dell’intervallo [ν, 2ν] si chiama quarta giusta.
Forse il primo esempio di “legge naturale" espressa in termini numerici è la
13
Legge della consonanza: un intervallo risulta consonante se è rappresentato dal rapporto di
due numeri interi piccoli, più semplice è il rapporto, più consonanti sono le note che formano
l’intervallo.
Tale legge, insieme alla scoperta delle consonanze fondamentali ottava, quinta giusta e quarta
giusta, fu stabilita nell’antica Grecia dai pitagorici (VI-IV sec a.C.), attraverso vari esperimenti,
in primo luogo per mezzo del monocordo, uno strumento composto da una sola corda tesa sopra
una cassa di risonanza tra due ponticelli, e posata su un terzo ponticello intermedio che può essere
spostato in modo da dividere la corda a piacere e ottenere suoni di altezza variabile.
In base alla legge della consonanza il rapporto 2 : 1 è il rapporto più consonante di tutti. Noi
lo chiamiamo ottava perchè tra due note che differiscono per tale rapporto vi sono esattamente
otto note (contando gli estremi) lungo la scala diatonica. I greci definivano invece tale rapporto
diá pason - attraverso tutto - per significare che in esso è contenuto l’intero campionario delle
note (l’intervallo di quinta era invece chiamato diá pénte, quello di quarta diá tesseron). Tutte
le culture basano le loro scale su di esso, dividendolo in modi differenti6. I pitagorici furono
impressionati poi dal fatto che le consonanze fondamentali si esprimessero per mezzo di rapporti
superparticolari, ovvero della forma (n + 1)/n con n = 1, 2, 3, che per loro natura coinvolgono
sempre un numero pari ed uno dispari (il pari (infinito) e il dispari (limitato) erano considerati
all’origine della determinatezza della natura). Tali scoperte ebbero sul pensiero greco un effetto
sconvolgente: l’imprevista ma limpidissima corrispondenza tra suoni e numeri, non mediata, come
accade per noi, dalla teoria fisica degli armonici, costituì per i Pitagorici il principale argomento a
favore della tesi che "tutto è numero". In particolare, i numeri 1, 2, 3, 4 che appaiono in tali rapporti
formano il principale simbolo esoterico dei pitagorici, il tetraktys (4 era simbolo di giustizia, 10 =
1 + 2 + 3 + 4 di perfezione).
6
Ad esempio gli indiani lo dividono in 22 parti, gli arabi in 17 e i cinesi in 5 (vedi più avanti).
14
È bene sottolineare come l’importanza di questi rapporti dipende dalla semplicità dei numeri coin-
volti, e non dal giudizio dell’esperienza percettiva, che ne è piuttosto una conferma. Pitagora
concepisce la consonanza musicale in primo luogo come fonte di piacere intellettuale: la sua di-
mensione percettiva è la conferma dell’appartenenza dell’uomo ad un cosmo armonioso retto dai
numeri semplici. La dottrina pitagorica considera dunque la consonanza come manifestazione del
significato metafisico dei numeri, e per questo motivo attribuisce alla teoria musicale un rilevante
contenuto scientifico.
La figura precedente riproduce l’incisione L’origine della musica che compare nell’opera Theorica
musicae scritta nel 1492 da Franchino Gaffurio (1451-1522), umanista, musicologo e compositore
attivo nella Milano sforzesca insieme a Leonardo da Vinci di cui era amico. Fu anche maestro di
Cappella nel Duomo milanese.
15
Oltre al monocordo ad altri strumenti, vi sono raffigurati i musici Iubal (personaggio biblico
della Genesi a cui viene attribuita l’invenzione della musica), Pitagora e Filolao, che con la ra-
gione e l’esperimento scoprono le leggi matematico-musicali della Creazione. Gl’ignari esecutori
dell’esperimento nel primo riquadro sono dei fabbri che producono suoni di diverse altezze for-
giando il ferro con martelli di diverso peso.
La storia dei fabbri era narrata nel De institutione musica del filosofo latino Severino Boezio (476-
525), mediatore tra il mondo classico e il mondo medioevale. Come i pitagorici e come Platone,
Boezio non considerava il suono prodotto con gli strumenti come la forma musicale più elevata.
Ben prima di essa c’era infatti musica mundana, l’armonia del mondo, la musica delle sfere celesti
e degli astri, seguita dalla musica humana, l’armonia dell’uomo, il canto dell’unione tra l’anima
incorrutibile e il corpo mortale. Il soggetto della musica instrumentalis, l’armonia dell’arte come
manifestazione sensibile della musica universale, si limitava essenzialmente alla classificazione
degli strumenti musicali in corde, fiati e percussioni.
La musica non è un intrattenimento piacevole o una consolazione superficiale per
un animo abbattuto, ma una chiave essenziale per interpretare l’armonia segreta
di Dio e della natura, in cui l’unico elemento dissonante è il male che si annida nel
cuore degli uomini.7
La tripartizione boeziana è la variante musicale della tripartizione della filosofia teoretica in metafisica,
matematica e fisica, a sua volta fondata sulla triadicità platonica dell’essere (intelligibile, medio e
sensibile). Il Musicus per Boezio è dunque il filosofo che dalle armonie sensibili risale alle armonie
universali attraverso le armonie intermedie dell’anima e del corpo.
Riprendendo e rielaborando questa tradizione, Gaffurio contribuì a sviluppare una filosofia della
musica vista come arte pratica e come disciplina speculativa al tempo stesso. Se il canto polifonico
raggiungerà poi i vertici toccati da Pierluigi da Palestrina, il merito è anche di Franchino Gaffurio
che ne pose le basi teoriche e pratiche.
3.1. Intervalli e proporzioni. La determinazione degli intervalli della scala musicale rimase a
lungo il più frequentato campo di applicazione della teoria delle proporzioni.
Se moltiplichiamo i rapporti 11 , 34 , 32 , 21 per il m.c.m. dei loro denominatori, cioè 6, otteniamo la
progressione 6, 8, 9, 12. Questi numeri hanno alcune peculiarità aritmetiche8. Innanzitutto si ha
6 9 6 8
= e =
8 12 9 12
In musica ciò significa che così come due corde di lunghezza 12 e 9, anche due corde di lunghezza
8 e 6 producono un tono e la sua quarta, mentre due corde di lunghezze rispettive 12 e 8, ovvero 9
e 6, producono un tono e la sua quinta.
Inoltre
1 1 1 1 1
9 = (6 + 12) e = ( + )
2 8 2 6 12
Per interpretare queste relazioni ricordiamo che nel linguaggio di Pitagora, con armonia si inten-
deva il problema matematico d’individuare, con differenti prescrizioni, un terzo termine c com-
preso tra due termini assegnati a e b. Essa prevedeva in particolare lo studio delle tre differenti
proporzioni, o medie, aritmetica, geometrica e armonica.
7
S. Boezio, De institutione musica (500-507).
8
Nicomaco di Gerasa, un matematico e filosofo neopitagorico vissuto nel I secolo d.C, chiamò la quaterna 6, 8, 9, 12
"divina proporzione", per la sintesi perfetta di armonia musicale, rapporti numerici e simmetria spaziale.
16
La media aritmetica tra due numeri era definita come il numero che supera il più piccolo della
stessa misura con cui esso stesso è superato dal più grande. Detto altrimenti, se a < b sono i due
numeri e c la loro media aritmetica allora
c−a a+b
= 1 ovvero c =
b−c 2
dove la seconda espressione è la definizione equivalente moderna. In questo caso si osserva che
9 − 6 = 12 − 9 e dunque la prima relazione scritta sopra dice che 9 è la media aritmetica di 6 e 12.
La media geometrica tra due numeri era invece tale che la differenza tra la media e il numero più
piccolo divisa per la differenza tra il più grande e la media è uguale al rapporto tra il più piccolo e
la media stessa. In formule se a < b sono i due numeri e c la loro media geometrica allora
c−a a √
= ovvero c = a · b
b−c c
dove, ancora una volta, la seconda espressione è la definizione equivalente moderna. Ad esempio
6 è la media geometrica di 2 e 18.
Infine la media armonica era definita in modo tale che lo stesso rapporto tra le differenze usato
sopra è uguale al rapporto del primo dei due numeri con il secondo: se a < b sono i due numeri e
c la loro media armonica allora
1
c−a a 1 +1
= ovvero = a b
b−c b c 2
con la stessa avvertenza di cui sopra riguardo alla seconda espressione. La formula scritta più
sopra dice dunque che 8 è la media armonica di 6 e 12.
Per quanto visto, si ha che la quinta 3 : 2 è la media artimetica di 1 : 1 e 2 : 1 mentre la quarta è la
loro media armonica. Osserviamo che
4 3 2
× = (quarta + quinta = ottava)
3 2 1
Più in generale, Archita9 osservò che il prodotto della media aritmetica e della media armonica è
uguale al quadrato della media geometrica, come si vede facilmente essendo
(a + b) 2
· 1
=a·b
2 a
+ 1b
Osserviamo che 5 : 4 e 6 : 5, cioè la terza maggiore e la seconda maggiore nel temperamento
naturale (vedi più avanti), sono rispettivamente media aritmetica e media armonica di 1 : 1 e 3 : 2.
Possiamo dunque dividere la quinta come:
5 6 3
× = (terza mag + seconda mag = quinta)
4 5 2
In questo modo il rapporto 3 : 2 è suddiviso in 6 : 5 : 4. In modo analogo si ha 4 : 3 è il prodotto
di 7 : 6 e 8 : 7, e dunque la quarta 4 : 3 è suddivisa in 8 : 7 : 6. I rapporti 7 : 6 e 8 : 7 possono
essere pensati rispettivamente come una terza minore diminuita e un tono intero allargato.
9
Matematico, filosofo e stratega greco, governatore di Taranto, vissuto tra il 428 e il 347 a.C., ultimo rappresentante
in senso forte del pensiero pitagorico. È stato il primo a proporre il raggruppamento delle discipline canoniche in quello
che sarà il quadrivium medievale: l’aritmetica, la geometria, l’astronomia e la musica.
17
Un altro teorema di Archita (riportato nella Sectio Canonis attribuita a Euclide) sancisce l’impossibilità
che intervalli come l’ottava 2 : 1, la quinta 3 : 2, la quarta 4 : 3 e più in generale della forma
(n + 1) : n si possano dividere in due intervalli uguali per mezzo di numeri razionali10. Vedremo
come questo fatto abbia conseguenze importanti nella genealogia dei temperamenti musicali.
Nota 3.1. Durante il regno di Diocleziano, Pappo di Alessandria, intorno all’anno 320, compose
un’opera in 8 Libri dal titolo ‘Collezione", importante sia per la preziosa documentazione stor-
ica sugli sviluppi della matematica nel mondo greco, sia per alcuni rilevanti contributi personali.
Nel libro III Pappo espone la teoria delle medie e presenta una costruzione che include la media
aritmetica, quella geometrica e quella armonica in un unico semicerchio.
Sul diametro AB si sceglie un punto C, dal quale si traccia la semicorda CD, ortogonale al di-
ametro AB. Si congiunge il centro O della semicirconferenza con il punto D, ed infine si traccia
il segmento EC perpendicolare al segmento OD. È immediato verificare che OD è la media ar-
timetica dei due segmenti AC e BC. La similitudine dei triangoli ABD e DCB mostra poi che
DC è la loro media geometrica, mentre la similitudine dei triangoli OCD e DEC mostra che DE
è la loro media armonica. •
Il numero degli intervalli considerati consonanti non è ovviamente rimasto costante nel corso del
tempo ma è cresciuto in accordo con l’evoluzione del gusto musicale. Mentre per Pitagora e i suoi
seguaci erano consonanti solo l’unisono, l’ottava, la quinta e la quarta, nel Rinascimento Gioseffo
Zarlino (1517-1590), di cui riparleremo più avanti, nella sua opera Istitutioni harmoniche (1558)
rinnova dall’interno questa tradizione, sostituendo al quaternario pitagorico il proprio senario, cioè
i numeri da 1 a 6, i cui rapporti generano non soltanto le consonanze conosciute agli antichi ma
i nuovi intervalli musicali consonanti di terza e sesta maggiore e minore introdotti dalla polifo-
nia medievale e soprattutto dalla madrigalistica rinascimentale. Furono poi Cartesio (1596-1650)
e soprattutto Marin Mersenne (1588-1649) nella sua Harmonie universelle (1636) ad affermare
l’esistenza di diversi gradi di consonanza ed escludere così ogni reale dicotomia tra intervalli con-
sonanti e dissonanti.
Va notato che questo processo di arrichimento non si avviò in maniera indolore. Due trattati quasi
contemporanei, l’Ars novae musicae del 1319, di Johannes de Muris, matematico e astronomo alla
Sorbona, e l’Ars nova del 1320, dell’umanista Philippe de Vitry, anch’egli attivo alla Sorbona,
posero chiaramente l’esigenza di un rinnovamento musicale sia in senso armonico, includendo
10
Se così non fosse si potrebbe scrivere (n + 1)/n = (p/q)2 con (p, q) = 1 e ciò darebbe q < p < q + 1 il che è
impossibile.
18
nuove consonanze, sia in senso ritmico. La reazione della Chiesa fu immediata: nel 1324, da Avi-
gnone, Papa Giovanni XXII11 emise una bolla papale, la Docta sanctorum patrum, in cui esprimeva
una forte condanna nei confronti dei musicisti che utilizzavano la “nuova musica" e disponeva che
era consentito l’uso soltanto di accordi di ottava, quinta e quarta, in grado di arricchire la melodia
ed accompagnare il semplice canto ecclesiastico.
3.2. Altre speculazioni. La peculiarità dei numeri 6, 8 e 12 osservata sopra, oltre che all’intervallo
di quarta, fu applicata dai pitagorici anche ad altri oggetti. Ad esempio, un cubo ha 6 facce, 8 ver-
tici e 12 spigoli e dunque fu chiamato solido armonico. Si può osservare qui una caratteristica del
procedimento pitagorico: in natura si scopre un’armonia associata ai numeri 6, 8, 12; a partire da
ciò il carattere armonico viene associato ai numeri stessi, ed ogni volta che tali numeri si mani-
festano in altri oggetti (in questo caso il cubo), il loro carattere armonico è espresso dall’oggetto
stesso. In questo modo le proprietà dei numeri forniscono non solo una teoria musicale ma anche
una connessione tra musica e geometria. Una parallela connessione speculativa tra aritmetica e ge-
ometria, detta aritmogeometria, consiste nell’associare numeri interi a oggetti geometrici come
ad esempio 8 = "due al cubo", 9 = "tre al quadrato", 10 = "quattro al triangolo", 12 = "tre al
pentagono", etc.
3.2.1. La musica delle sfere. Nella concezione pitagorica, ripresa e sviluppata da Platone nel
Timeo, le consonanze musicali rispecchiano l’armonia delle sfere celesti ed in particolare il moto
dei pianeti.
Alcuni esempi concreti:
• Per Mercurio il rapporto tra i periodi di rotazione e di rivoluzione attorno al Sole è 3 : 2
(quinta)
• Per la Luna il rapporto tra i periodi di rotazione e di rivoluzione attorno alla Terra è 1 : 1
(unisono)
• Le lune galileiane Ganimede, Europa e Io hanno una risonanza orbitale 1 : 2 : 4 attorno a
Giove (ottave)
Quest’idea viene ripresa nel decimo (ed ultimo) libro della Repubblica di Platone dove, nel mito
di Er, assegna una nota fissa a ciascun pianeta:
11
Il “Papa banchiere”, che figura nell’Inferno dantesco come simbolo della corruzione della Chiesa.
19
Sull’alto di ciscuno dei suoi cerchi stava una sirena che, trascinata in quel movi-
mento circolare, emetteva un’unica nota su un unico tono; e tutte otto le note crea-
vano un’unica armonia.
Nel settimo libro della stessa opera, Platone, riprendendo i pitagorici, affianca l’astronomia e la
teoria musicale come la terza e la quarta delle discipline (dopo la matematica e la geometria) il cui
studio costituisce il preludio allo studio della dialettica (la quale ha per termine la conoscenza del
Bene) per i filosofi destinati al governo dello Stato. Socrate le chiama "sorelle", in quanto entrambe
hanno a che fare col moto: l’una con la sua forma visibile, l’altra con quella udibile. Questo
affiancamento si è poi perpetuato, tramite Agostino, nella classificazione medievale delle sette
arti liberali, il "trivio": grammatica, retorica, dialettica, e il "quadrivio" : aritmetica, geometria,
musica, astronomia, ovvero il curriculum di studi seguito dai chierici prima di accedere agli studi
universitari. Nella metafisica pitagorico-platonica il termine musica delle sfere indicava dunque
il suono inaudibile prodotto dal moto dei pianeti, e ha continuato ad attrarre curiosità e interesse
fino al XVII secolo (Keplero, Fludd, Mersenne, Kircher), per poi sparire del tutto dall’astronomia
moderna.
In particolare, nel quadro astronomico costruito da Giovanni Keplero (1571-1630) tutto questo
viene ripreso e riformulato radicalmente. Qui, le orbite non sono più circolari ma ellittiche e
dunque le velocità dei pianeti mutavano continuamente. Ciò per la seconda legge di Keplero
secondo la quale la velocità areolare (oggi diremmo il momento angolare) è costante. Il pianeta
va più veloce vicino al Sole (presso il perielio), più lento lontano dal Sole (presso l’afelio). Così,
nel modello kepleriano a ciascun pianete non veniva assegnata una nota fissa ma una successione
di note corrispondenti alle variazioni di velocità. Nel suo Harmonices Mundi (1619), Keplero fece
innanzitutto corrispondere a ciascun pianeta un intervallo che risultava dal rapporto tra le distanze
angolari, misurate in secondi d’arco, che il pianeta percorrerebbe in un giorno se si muovesse con
le velocità massima e minima raggiunte lungo la sua orbita ellittica (rispettivamente al perielio e
all’afelio). Ad esempio il moto di Saturno apparirebbe con la velocità al perielio un arco lungo
2’15”, ovvero 135 secondi, al giorno, ma di soli 106 secondi al giorno con quella all’afelio. Il
rapporto tra questi due numeri è 135 : 106 che è molto vicino ad una terza maggiore 5 : 4 (l’errore
è 1, 018). Operando in questo modo per ciascuno dei sei pianeti noti a quel tempo12 si ottiene la
seguente tabella
pianeta rapporto perielio/afelio intervallo corrispondente

Saturno 20 1500 : 10 4600 ' 5 : 4 terza maggiore
0 00 0 00
Giove 5 30 : 4 35 = 6 : 5 terza minore
Marte 380 0100 : 250 2900 ' 3 : 2 quinta
0 00 0 00
Terra 61 18 : 57 28 ' 16 : 15 semit. diat. nat.
0 00 0 00
Venere 98 47 : 94 50 ' 25 : 24 semit. crom. nat.
Mercurio 3940 000 : 1640 000 ' 12 : 5 ottava + terza min.
Si possono poi calcolare i rapporti tra le velocità massime (o minime) di pianeti diversi, ottenendo
ancora una serie di intervalli armonici (ad eccezione della coppia Marte-Giove che dà un rapporto
"dissonante", interpretato da Keplero come "incompatibilità astrale"). Ora, è chiaro che i toni
associati ai vari pianeti in questo modo non cadono nella medesima ottava. Per riportare tutti i
12
In realtà noti da millenni. Urano e Nettuno vennero invece scoperti nel 1781 e nel 1846, rispettivamente.
20
toni entro la stessa ottava Keplero prese come ottava di base quella di Saturno, associando il Sol al
tono emesso all’afelio (il più basso), e poi divise ciascuno dei due numeri che esprimono le velocità
estreme per una potenza di due sufficiente a che i quozienti ottenuti siano numeri meno che doppi
dei corrispondenti numeri di Saturno. Ad esempio, la velocità della Terra all’afelio si può scrivere
nella forma 570 2800 = 25 · 10 4700 . Confrontando con il numero 10 4600 di Saturno, vediamo che la
nota corrispondente è ancora un Sol ma cinque ottave più in alto. Procedendo in questo modo con
tutti i pianeti si trova la melodia del coro planetario riportata nella figura seguente, che copre un
intervallo di oltre sette ottave.
Si vede come vi sia una stretta relazione tra le velocità dei pianeti, e dunque i loro periodi di
rivoluzione, e la loro distanza dal Sole: più lontano è il pianeta dal Sole e più bassa l’ottava entro
cui si articola la sua melodia. Il passo successivo nella descrizione del sistema solare doveva
essere dunque una relazione armonica tra i periodi di rivoluzione e i raggi delle orbite. E fu questa
la celebre “terza legge" sul moto ellittico dei pianeti T 2 /R3 = costante, ottenuta da Keplero dopo
17 anni di calcoli sulle osservazioni astronomiche del suo maestro Tycho Brahe, in cui compare il
rapporto di quinta tra i quadrati dei periodi di rivoluzione dei pianeti intorno al Sole e i cubi delle
loro distanze massime dal Sole13.
Osserviamo per concludere che Keplero ha costruito i suoi risultati e le sue leggi avvalendosi sis-
tematicamente della matematica e dell’osservazione sperimentale sotto la guida della sua metafisica
pitagorico-platonica, la quale non era un sovrappiù irrazionale, come recita la vulgata manualistica,
ma la base stessa della sua indagine, la forma della sua razionalità scientifica. Le tre leggi di Ke-
plero sono state poi riderivate successivamente nel quadro della meccanica newtoniana e come tali
vengono riportate sistematicamente nei manuali. Per il resto l’opera di questo scienziato è stata per
lo più ignorata dal successivo sviluppo della scienza moderna, trovando invece una celebrazione
musicale nel XX secolo da parte del compositore tedesco Paul Hindemith nel suo lavoro orches-
trale Die Harmonie der Welt (1951), suddiviso a sua volta nei tre movimenti musica instrumentalis,
musica humana e musica mundana, in accordo con la tripartizione boeziana.
3.3. Musica, scienza e cultura umana. L’importanza della teoria musicale come disciplina dello
spirito non si limita alla civiltà greca. Molti protagonisti ed immediati epigoni della Rivoluzione
Scientifica dell’Occidente moderno, come Keplero, Mersenne, Galileo, Stevino, Cartesio, Hooke,
13
J. Kepler, Harmonices Mundi (1619), Lib. V, cap. III.
21
Huygens, Newton, Eulero ed altri, erano profondamente coinvolti nelle discussioni legate ai prob-
lemi della teoria musicale, problemi che si intrecciavano con tutte quelle ricerche che, dal punto
di vista moderno, appaiono più direttamente collegate allo sviluppo scientifico. Ciò non era un
interesse casuale di pochi scienziati isolati. Rifletteva piuttosto la ripresa a pieno titolo, dopo un
lungo intervallo di tempo, dell’interesse iniziato con i pitagorici per problemi quantitativi di natura
musicale, il primo dei quali consisteva appunto nella ‘divisione dell’ottava’, ovvero di quali note
facciamo uso per fare musica. Tale interesse assumeva tuttavia forme assai diverse e talvolta in
aperta opposizione. In modo particolare, un’aspra polemica oppose due teorici e musici rinasci-
mentali: il primo è Gioseffo Zarlino (1517-1590), francescano, studioso di logica, greco, ebraico
nonchè organista e autore del celebre trattato Istitutioni harmoniche (1558) che delineava le basi
filosofiche, matematiche e pratiche della composizione musicale basata sul temperamento naturale
(vedi più avanti), e del successivo Dimostrazioni harmoniche (1571), un dialogo su i rapporti tra
teoria antica e pratica musicale moderna. Il secondo è Vincenzo Galilei (1525-1591), padre di
Galileo, accademico della Crusca ed esponente della Camerata Fiorentina14, valente liutista15 ed
autore del celebre dialogo Fronimo (1568).
La discussione tra Zarlino e Vincenzo Galilei segna un punto di svolta nel Rinascimento. Alla
ben’ordinata Natura di Zarlino, che sussurra all’orecchio dell’uomo le consonanze nelle lor vere
forme naturali, e ha voluto che cotali forme si trovassero, come registrate nelle cose naturali, a
perpetua memoria, collocate per ordine, secondo i gradi loro ne i loro proprii luoghi; accioche
l’huomo conoscesse, che non fussero state fatte a caso; ma ordinate con gran sapientia e non
senza gran misterio16, Galilei oppone l’immagine di una Natura che procede senza cognitione, con
principi e fini estranei all’uomo. Contro di essa l’uomo si avvale dell’arte meccanica per conseguire
un fine che la Natura stessa non può conseguire. L’attacco agli ‘universali musicali’ continuava
poi nel mostrare la dipendenza del ‘numero sonoro’ dalle condizioni materiali del ‘corpo sonoro’,
tensione delle corde, massa del materiale, volume delle canne, etc. A questo scopo Vincenzo fa
esperimenti, cioè crea dei contesti precisi, nel quali mantiene costanti tutte le variabili tranne una,
e osserva il risultato. Ad esempio, prende corde di uguale lunghezza, fatte dello stesso materiale, e
applica alla loro estremità pesi diversi, come raffigurato nell’incisione di Gaffurio. Aumentando il
peso applicato a una corda, e quindi la sua tensione, il suono prodotto si fa più acuto. Ma di quanto
si deve aumentare il peso per raggiungere l’ottava, cioè la nota che, a parità di peso, si otterrebbe
dimezzando la lunghezza della corda? Vincenzo scopre che il rapporto dei pesi deve essere 4:1,
cioè il quadrato di 2:1. Nel suo Discorso intorno all’Opera di Messer Gioseffo Zarlino da Chioggia
(1589) Galilei afferma di avere egli stesso condiviso gli errori del suo maestro e della tradizione
14
Di cui faceva parte un gruppo assai attivo di filosofi, poeti e compositori, tra cui l’umanista Girolamo Mei,
profondo conoscitore delle fonti sulla musica greca, i musicisti Jacopo Peri, Giulio Caccini e Ottavio Rinuccini. La
Camerata si riunì in casa del conte Giovanni Bardi per una decina d’anni a partire dal 1580, ed elaborò lo stile recitativo
e la melodia accompagnata in cui, a differenza del madrigale, le voci inferiori accompagnano in modo compatto la
voce superiore, a cui è affidato un testo monodico. Tale stile ebbe poi la sua naturale evoluzione nella nascita dell’opera
lirica (una delle prime opere è l’Euridice di Jacopo Peri, del 1600).
15
Ma pare che il figlio Galileo lo abbia superato in quest’arte. Vincenzo Viviani, allievo e biografo di Galileo,
nel suo Racconto istorico della vita di Galileo Galilei del 1654 scrive: “Nel toccar i tasti e il liuto, con l’esempio e
l’insegnamento del padre suo prevenne a tanta eccellenza che più volte si trovò a gareggiare coi primi professori di
quei tempi in Firenze e in Pisa, essendo in tale strumento ricchissimo d’invenzione, e superando nella gentilezza e
grazia del toccarlo il medesimo padre".
16
Sopplimenti musicali (1588), p.97
22
(egli fu inizialmente allievo di Zarlino) finché non accertai la verità con l’esperienza, maestra di
tutte le cose.
E nel 1627, Marin Mersenne scrive nel suo Traité de l’harmonie universelle:
Sono davvero stupito che [...] Boezio e gli altri antichi, e dopo di loro Zarlino [...],
siano stati così negligenti da non effettuare un solo esperimento per restituire la
verità al mondo.
Si potrebbe obiettare che non è la verità che si sta imponendo, quanto piuttosto un nuovo modello
di razionalità. Il primato ontologico del movimento e della materia sul numero diventa la premessa
alla scienza musicale galileiana e moderna. In effetti Galileo Galilei (1564-1642) mettendo insieme
le teorie del padre e quelle del filosofo e matematico veneziano Giovanni Battista Benedetti (1530-
1590) propone una teoria della consonanza che dà inizio agli studi musicali nel quadro del modello
di razionalità caratteristico della filosofia naturale meccanicista, cioè il modello che si è poi imposto
come esito ‘vincente’ della Rivoluzione scientifica. Vediamo così come la nascita dell’acustica
moderna segni anche la fine del modello musicale come possibile strumento di interpretazione dei
fenomeni naturali.
Parallelamente, il lento ma progressivo affermarsi del temperamento equabile (sostenuto con forza
dallo stesso Vincenzo Galilei), se da una parte ha fornito un semplice criterio ‘universale’ per
l’accordatura degli strumenti musicali, dall’altro ha ulteriormente contribuito a ‘svuotare’ le ques-
tioni legate alla ‘divisione dell’ottava’ da ogni contenuto speculativo.
Tutto questo, insieme alla prorompente affermazione dei diritti della soggettivtà borghese moderna
in campo filosofico, estetico-musicale, artistico ed educativo, determina il collasso definitivo del
cosmo musicale unitario e dell’enciclopedia circolare del sapere rinascimentale di cui la musica
era musa armonizzatrice.
3.4. Alcune teorie della consonanza.
3.4.1. Galileo e le coincidenze. Nei Discorsi e dimostrazioni matematiche intorno a due nuove
scienze (1638), Galileo affronta il tema della consonanza e della dissonanza da due punti di vista.
Innanzitutto sulla base dello studio della forma (lunghezza, tensione e sezione) delle corde musi-
cali:
(...) stetti lungo tempo perplesso intorno a queste forme delle consonanze, non mi
parendo che la ragione che comunemente se n’adduce da gli autori che sin qui
hanno scritto dottamente della musica, fusse concludente a bastanza. Dicono essi,
la diapason, cioè l’ottava, esser contenuta dalla dupla, la diapente, che noi diciamo
la quinta, dalla sesquialtera, etc.; perchè, distesa sopra il monocordo una corda,
sonandola tutta e poi sonandone la metà, col metter un ponticello in mezzo, si sente
l’ottava, e se il ponticello si metterà al terzo di tutta la corda, toccando l’intera
e poi li due terzi, ci rende la quinta; per lo che l’ottava dicono esser contenuta
tra ’l due e l’uno, e la quinta tra il tre e ’l dua. Questa ragione, dico, non mi
pareva concludente per poter assegnar iuridicamente la dupla e la sesquilatera per
forme naturali della diapason e della diapente: e l’mio motivo era tale. Tre sono
le maniere con le quali noi possiamo inacutire il tuono a una corda: l’una è lo
scorciarla; l’altra, il tenderla più, o vogliam dire tirarla; il terzo è assottigliarla...
In secondo luogo Galileo, tracciando un parallelo tra la soddisfazione visiva che caratterizza le
oscillazioni di due pendoli che abbiano periodi tra loro in rapporti semplici, i quali si ritrovano
23
frequentemente in sincronia di movimento, e quella uditiva di un timpano che venga colpito da due
suoni con analoghe caratteristiche, giunge a una sua interpretazione fisiologica della consonanza e
della dissonanza:
La molestia di queste [dissonanze] nascerà, credo io, dalle discordi pulsazioni di
due diversi tuoni che sproporzionatamente colpeggiano sopra ’l nostro timpano, e
crudissime saranno le dissonanze quando i tempi delle vibrazioni fussero incom-
mensurabili. [...] Consonanti e con diletto ricevute, saranno quelle coppie di suoni
che verranno a percuotere con qualche ordine sopra ’l timpano; il qual ordine
ricerca, prima, che le percosse fatte dentro all’istesso tempo siano commensurabili
di numero, acciò che la cartilagine del timpano non abbia a star in perpetuo tor-
mento d’inflettersi in due diverse maniere per acconsentire e ubbidire alle sempre
discordi battiture.
In figura sono mostrate due sinusoidi le cui frequenze si trovano a distanza di una quinta giusta.
Così, ad esempio,
le pulsazioni della corda grave dell’ottava vanno tutte accompagnate da quelle
dell’acuta, e di queste una s’interpone solitaria ed in distanze eguali ed in certo
modo senza far scherzo alcuno, onde tal consonanza ne diviene sdolcinata troppo e
senza brio. Ma la quinta, con quei suoi contrattempi, e con l’interpor tra le coppie
delle due pulsazioni congiunte due solitarie della corda acuta ed una pur solitaria
della grave, e queste tre con tanto intervallo di tempo quanto è la metà di quello
che è tra ciascuna coppia e le solitarie dell’acuta, fa una titillazione ed un solletico
tale sopra la cartilagine del timpano, che temperando la dolcezza con uno spruzzo
d’acrimonia, par che insieme soavemente baci e morda.
La “teoria delle coincidenze” di Galileo, se anche rifletteva alcune caratteristiche della teoria arit-
metica, era tuttavia irrimediabilmente sbagliata. Infatti, se fosse vera due corde potrebbero suonare
in armonia solo se iniziassero a vibrare precisamente nello stesso istante, perchè in caso contrario
le loro pulsazioni non avrebbero mai modo d’incontrarsi, ma l’esperienza mostra che non è così.
Su questa base Newton rifiutò in blocco la teoria. Keplero, che la lesse durante il viaggio intrapreso
per difendere sua madre dalle accuse di stregoneria17, la giudicò ‘rovinosa’.
3.4.2. Keplero e i poligoni regolari. La teoria kepleriana della consonanza risale al 1599 ed uti-
lizza un linguaggio interamente geometrico. Si parte dall’osservazione che un qualunque poligono
regolare inscritto in un cerchio suddivide quest’ultimo in un certo numero di archi uguali. Ad
esempio un pentagono divide il cerchio in cinque archi ciascuno pari a un quinto del totale. Defini-
amo parte uno di tali archi o l’unione di più archi, ma sempre in modo che complessivamente non
si superi la metà della circonferenza, e residuo il complementare della parte. Si considera poi il
rapporto tra l’intera circonferenza e il residuo. Così, per un triangolo equilatero la parte può essere
17
La madre di Keplero fu infatti arrestata e rimase in carcere tredici mesi, e nel suo rilascio ebbe grande influenza
l’opera difensiva del figlio. Tuttavia essa morì poco dopo.
24
soltanto un arco e il residuo due archi. Il rapporto tra intero e residuo è dunque 3/2 ovvero un inter-
vallo di quinta. Per un quadrato le parti possono essere uno o due archi e i corrispondenti residui tre
o due archi, per cui gli intervalli prodotti sono 4/3 e 2/1 che corrispondono alla quarta e all’ottava.
Nel caso del pentagono le parti possono essere ancora due e si trovano gli intervalli 5/4 e 5/3 che
corrispondono alla terza e alla sesta maggiori. Questo criterio permette di trovare, al variare dei
poligoni regolari, tutti gli intervalli considerati all’epoca consonanti, ma anche alcuni intervalli in
più. Keplero pose allora alcune limitazioni, la prima delle quali fu di limitarsi a considerare solo
i poligoni regolari costruibili con riga e compasso18. In questo modo, limitandosi ai poligoni di 3,
4, 5 e 6 lati, il modello di Keplero seleziona tutte e sole le consonanze ritenute tali all’inizio del
Seicento, ivi inclusa la sesta minore (8:5) non ottenibile nell’ambito del senario zarliniano. E fu
l’unico metodo a riuscire in tal senso. Keplero rifiuta l’idea irrazionale dell’ipotetica superiorità
del numero sei e, con autentico ‘spirito scientifico’, si ostina a voler includere anche terze e seste
che al suo orecchio suonano consonanti, fino ad elaborare il modello dei poligoni inscritti. Dunque
l’utilizzo di un modello geometrico-metafisico per spiegare il fenomeno della consonanza non ne
riduce il carattere matematico-sperimentale.
Vediamo in conclusione che non soltanto Gioseffo Zarlino e Vincenzo Galilei esprimono due vi-
sioni antitetiche, ma anche due protagonisti della Rivoluzione scientifica quali Giovanni Keplero e
Galileo Galilei esprimono non una ma due diverse razionalità scientifiche, entrambe di tipo matem-
atico e sperimentale, ma basate l’una su un allargamento in senso metafisico del contenuto dei
concetti e delle forme, l’altra su una sua restrizione in senso pragmatico.
3.4.3. Rameau e il basso fondamentale. Una nuova base razionale sulla quale fondare la naturalità
dell’armonia (e in particolare del fenomeno della consonanza) si trova nella struttura ‘interna’ dei
suoni, ovvero nell’esistenza e nella struttura dei parziali di cui, come abbiamo visto, ogni suono
è composto. Se Galileo è stato il primo ad impostare l’acustica nella prospettiva moderna, ricon-
ducendo le altezze dei suoni alla frequenza di vibrazione delle corde che li producono, non sembra
tuttavia aver còlto il problema fondamentale della spiegazione della struttura interna dei suoni
emessi dalle corde. È stato Marin Mersenne a studiare sperimentalmente i “piccoli suoni delicati”
che una corda vibrante emette assieme al proprio “suono naturale”. Ma il problema dei parziali
concomitanti presentava una difficoltà teoriche insormontabili: per la teoria completa delle serie
di Fourier occorre attendere fino al 1822. Alla fine del seicento, il matematico Joseph Sauveur
(1653-1716) ha studiato i correlati fisici (ventri e nodi) della serie degli armonici19, accennando
però solo vagamente al problema della loro generazione simultanea (per gli stessi problemi di
natura matematica). Almeno sul piano sperimentale, però, era ormai assodata la struttura interna
particolarmente semplice e armoniosa dei suoni prodotti da corde e tubi sonori. Jean Philippe
Rameau (1683-1764), compositore, clavicembalista e organista francese, contemporaneo di Vi-
valdi, Bach e di Haendel, acquisì una certa notorietà con la pubblicazione nel 1722, del suo Traité
de l’harmonie réduite à ses principes naturels, in cui si prefiggeva lo scopo di fondare la teoria
musicale sull’armonia e in particolare sulla nozione di accordo. Si trattava di una impostazione
d’impronta rinascimentale e dunque di derivazione pitagorica, anche se sul piano del metodo il
18
Cosa che si può facilmente realizzare per 3, 4, 5 e 6 lati. Si può poi estendere la costruzione a un numero di
lati doppio, quadruplo, etc. Il diciannovenne Gauss nel 1796 dimostrò che se n si può scrivere nella forma n =
n
2k0 F1k2 · · · Fsks dove Fi è l’i-esimo numero di Fermat primo (espresso dalla formula Fn = 22 + 1 di cui solo
F0 = 3, F1 = 5, F2 = 17, F3 = 257, F4 = 65537 sono stati sinora verificati essere primi) allora il poligono regolare
con un numero p di lati è costruibile con riga e compasso.
19
Saveur fu anche il primo a suggerire il termine acustica per la scienza dei suoni.
25
modello di Rameau era Cartesio: partire da un principio certo, l’io penso cartesiano è per Rameau
il fenomeno della risonanza di un corpo sonoro e i primi armonici superiori da esso prodotti, i
quali danno l’accordo maggiore naturale (vedi più avanti). Se ad esempio il suono naturale è il La
sotto il Do centrale del pianoforte, a 220 Hz, i suoi primi quattro armonici sono il La a 440 Hz,
sopra il Do centrale, il M i a 660 Hz, un altro La a 880 Hz, ancora un’ottava più in alto, e infine
un Do ] a 1100 Hz. Questi suoni insieme formano appunto un accordo maggiore. Osserviamo che
il La a 220 Hz, divisore comune di tutte queste frequenze, funziona da basso fondamentale per
differenza. Ad esempio, il La a 440 Hz e il M i a 660 Hz sono due note consonanti perchè sono
entrambi armonici del La a 220 Hz che risulta dalla loro differenza. Rameau attribuisce dunque la
consonanza alla generazione per differenza di un basso fondamentale. E tutta la varietà possibile
degli accordi armonici è riconducibile a questo unico principio. Dire cha la musica è una scienza
non significa per Rameau sottrarle il suo potere di esprimere o imitare i sentimenti, ma fondarlo
su un principio saldo e razionale che lo garantisca contro la varietà capricciosa degli stili e delle
mode. La musica è dunque la scienza dell’espressione e la varietà degli accordi può costituire
una specie di vocabolario delle emozioni e degli affetti i cui significati sono fissi e inalterabili nel
tempo.
Rameau non ebbe immediati seguaci e rimase un isolato. In un’epoca in cui in tutta Europa si
tendeva a radicalizzare l’antitesi tra arte e scienza, tra sensibilità e ragione, tra gusto e regola, era
decisamente fuori luogo affermarne la perfetta conciliazione e la salda alleanza.
3.4.4. Helmholtz e i battimenti. Vari scienziati, tra cui Mersenne, Cartesio, Huygens e d’Alembert
rilevarono che se un intervallo è rappresentato da un rapporto di numeri interi piccoli allora le due
note si trovano ad avere dei parziali in comune e dunque, se suonate insieme, formano un accordo
caratterizzato da un certo grado di fusione armonica. Quest’idea fu poi ripresa da Helmholtz: un
intervallo è consonante quando le note che lo costituiscono hanno in comune uno o più parziali.
Maggiore il numero dei parziali in comune migliore la consonanza. Prendiamo ad esempio i due
La sopra e sotto il Do centrale e il M i che si trova una quinta giusta sopra il La più basso e una
quarta giusta sotto il La più alto, corrispondente a 330 Hz. I loro parziali sono dunque
440, 880, 1320, 1760, 2200, 2640 . . .

330, 660, 990, 1320, 1650, 1980, 2310, 2640 . . .
220, 440, 660, 880, 1100, 1320, 1760, 1980, 2200, 2420, 2640 . . .
Si vede che la sottoserie degli parziali pari del La basso coincide con quella completa del La alto
(ovvero nell’intervallo di ottava la nota più bassa ‘contiene’ la nota più acuta), mentre la sottoserie
per multipli di tre dei parziali del La basso coincide con quella degli armonici pari del M i.
Se ora suoniamo due note con frequenze 220 Hz e 445 Hz (che differiscono approssimativamente
per un’ottava + un comma sintonico di 81:80, vedi più avanti) allora le serie dei parziali sono:
445, 890, 1335, 1780, 2225, 2670, . . .

220, 440, 660, 880, 1100, 1320, 1760, 1980, 2200, 2420, 2640 . . .
La presenza di componenti a 440 Hz e 445 Hz, a 880 Hz e 890 Hz, 1320 Hz e 1335 Hz, causa
una sensazione di ‘ruvidezza’, dovuta al fenomeno dei battimenti tra i parziali vicini, e interpretata
26
dall’orecchio come dissonanza. Fu Helmholtz (1863) il primo a dare una spiegazione della disso-
nanza in termini degli effetti sommati dei rapidi battimenti tra parziali vicini, ipotizzando che la
massima sensazione di ruvidezza corrisponda a battimenti di circa 32 Hz.
Infine, se suoniamo due note con frequenze 440 Hz e 825 Hz (che corrispondono a un La e un
Sol ] nell’ottava successiva della scala naturale, ovvero differiscono per una settima naturale di
15:8) allora le serie dei parziali sono:
825, 1650, 2475, 3300, 4125, 4950, . . .

440, 880, 1320, 1760, 2200, 2640, 3080, 3520, 3960, 4400, 4840, . . .
In questo caso, la presenza di componenti a 1650 Hz e 1760 Hz oppure a 2475 Hz e 2640 Hz (che
differiscono esattamente per un semitono diatonico di 16:15) causa una sensazione di ‘asprezza’,
di nuovo interpretata dall’orecchio come una forma di dissonanza.
Più in generale, nella comprensione dei fenomeni legati alla sensazione soggettiva di consonanza e
dissonanza ritorna la nozione di larghezza di banda critica. Dai dati sperimentali risulta infatti che
in un esperimento di psicoacustica in cui si registra la sensazione soggettiva di consonanza (o dis-
sonanza) tra due suoni inizialmente all’unisono, il primo con frequenza fissa mentre la frequenza
del secondo viene fatta crescere gradualmente, si passa prima rapidamente dalla percezione della
consonanza a quella della dissonanza dovuta ai battimenti, massima per intervalli dell’ordine del
25 per cento della larghezza di banda critica. Poi quando i battimenti divengono troppo frequenti
da non poter essere più risolti dall’orecchio, si passa ad una sensazione di asprezza fino al ristabil-
imento progressivo di una sensazione di consonanza, che raggiunge il suo massimo per intervalli
maggiori del 100 per cento della larghezza di banda critica. Tutto questo processo avviene en-
tro l’intervallo di frequenze corrispondente alla larghezza della banda critica per la frequenza del
suono fisso. Nella figura seguente riportiamo i risultati di un esperimento eseguito da Plomp e
Levelt nel 196520 che illustra bene questo fenomeno.
20
R. Plomp and W. J. M. Levelt, Tonal consonance and critical bandwidth, J. Acoust. Amer. Soc. 38 (4) (1965),
548-560.
27
Questi risultati implicano una modifica del criterio di Helmholtz di 32 Hz per la massima ru-
videzza, essendo la larghezza di banda critica dipendente dalla frequenza del tono fisso. Per questo
motivo può accadere che certi intervalli, come ad esempio la terza minore, risultino consonanti ad
alta frequenza e dissonanti a bassa frequenza21. In un ulteriore esperimento, gli stessi autori esam-
inarono che cosa accadeva con suoni aventi contenuto armonico più ricco (utilizzando suoni con
parziali fino ala sesta armonica) nell’ipotesi semplificatrice che la dissonanza totale sia la somma
delle dissonanze provocate da ogni coppia di parziali vicini, per ciascuna delle quali utilizzarono
il grafico precedente.
Nella figura si vedono chiaramente i picchi corrispondenti agli intervalli di 1:1 (unisono), 1:2
(ottava), 3:2 (quinta giusta), 3:4 (quarta giusta), 3:5 (sesta giusta maggiore), 4:5 (terza giusta mag-
giore) e 5:6 (terza giusta minore).
21
Ciò è consistente con la pratica musicale in cui gli intervalli piccoli appaiono più frequentemente nelle parti di
soprano, mentre gli intervalli grandi, come quinte o ottave, appaiono più spesso nelle parti di basso.
28
Nota 3.2. Con i sintetizzatori digitali si possono costruire suoni artificiali i cui parziali non siano
multipli esatti della frequenza fondamentale. In questo modo è possibile rendere consonanti in-
tervalli che non lo sarebbero naturalmente e viceversa rendere dissonanti intervalli anche molto
consonanti. •
4. I L TEMPERAMENTO PITAGORICO
Uno dei problemi centrali in musica è quello di organizzare sistemi di suoni (scale) che diano
una percezione di consonanza, armonia, gradevolezza, ecc. Un temperamento è un criterio per
costruire le scale a partire da alcuni intervalli di riferimento. Gli intervalli fondamentali già visti
sono 2 : 1 (ottava), 3 : 2 (quinta giusta) e 4 : 3 (quarta giusta).
Il temperamento pitagorico consiste nell’ottenere le note della scala partendo dai soli due intervalli
di quinta e di ottava, cioè usando le due sole regole22 :
(1) Raddoppiando la frequenza si sale di un’ottava (nella figura Do → Do)
(2) Triplicando la frequenza si sale alla quinta nell’ottava successiva (nella figura Do → Sol0 )
Invertendo la prima regola possiamo portare Sol0 alla nota Sol nella prima ottava.
22
Esistono notazioni differenti per le note musicali, quella anglosassone e quella nostrana, con diverse orgini. A
partire dal VI secolo, data la crescente difficoltà nel memorizzare melodie sempre più lunghe ed articolate, si cominciò
a ‘notarle’ usando una notazione di origine greca che utilizzava le lettere dell’alfabeto e che nei paesi anglosassoni è in
uso ancora oggi (A = La, B= Si, C = Do, D = Re, E = Mi, F = Fa, G = Sol). I nomi delle note che utilizziamo noi, invece,
risalgono al XII secolo e corrispondono alle sillabe iniziali dei primi sei versetti di un inno a San Giovanni Battista: UT
queant laxis REsonare fibris MIra gestorum FAmuli tuorum SOLve polluti LAbii reatum, SAncte Iohannes ("affinché i
tuoi servi possano cantare con voci libere le meraviglie delle tue azioni, cancella il peccato, o santo Giovanni, dalle loro
labbra indegne"). Fu il teorico della musica Guido d’Arezzo (995-1050) a notare che ciascun versetto corrispondeva a
una diversa tonalità e ad utilizzarne le iniziali per definire le note. Solo nel XVI secolo la settima nota riceverà un nome
definitivo (Si, dalle iniziali di Sancte Iohannes), mentre nel XVII secolo, in seguito ad una proposta del musicologo
Giovanni Battista Doni, nel nostro paese la nota UT viene indicata con la sillaba Do (come quella iniziale di Dominus,
il Signore, ma anche di Doni...)
29
È chiaro che applicando la combinazione delle due regole consistente nel moltiplicare la frequenza
per 3/2 otteniamo l’effetto di salire di una quinta giusta. Così triplicando la frequenza di Sol si
giunge a Re00 nella terza ottava e usando due volte l’inversa della prima regola ci riportiamo nella
prima ottava alla nota D, corrispondente all’intervallo 9 : 8 = 32 : 23 .
Usando ancora il rapporto 3 : 2 partendo da Re arriviamo a La corrispondente all’intervallo 27 :

16 = 33 : 24 .
Procedendo in questo modo si giunge alla scala maggiore diatonica di sette note riportata, in
notazione nostrana, nel seguente schema.
30
Vi sono solo due intervalli tra note successive, alternati come T − T − S − T − T − T − S:
• il tono intero T = 9 : 8 = 32 : 23
• il semitono diatonico (o limma) S = 256 : 243 = 28 : 35
Un semitono diatonico S non è proprio la metà di un tono T , ma quasi. Il complementare S 0 di S
in T (ovvero S 0 + S = T ) si chiama semitono cromatico (o apotome) e vale23
9/8 2187
S0 = =
256/243 2048
Il sistema pitagorico si basa su fatto che la differenza tra semitono diatonico e semitono cromatico,
è molto piccola (poco più di un nono di tono):
2187/2048 312 531441
= 19 = = 1, 013643...
256/243 2 524288
Tale differenza prende il nome di comma pitagorico, e sembra sia stato proprio Pitagora a scoprirla
in maniera empirica: in 7 ottave ci stanno infatti 12 quinte, perchè un’ottava contiene 12 semitoni,
e una quinta 7. D’altra parte, dimezzando 7 volte una corda tesa si otteneva un suono distintamente
differente da quello ricavato diminuendola per 12 volte di un terzo. In effetti si ha24
12
3
= 129, 746 6= 27 = 128
2
La differenza è piccola, tuttavia genera alcuni problemi. Per capire quali possiamo procedere così.
Posto n
3
zn = = 2k rn , 1 ≤ rn < 2 , n ∈ Z
2
è facile rendersi conto che partendo da z0 = 1, cioè dal Do fondamentale, e variando n, il
fattore rn rappresenta la nota ottenuta applicando la combinazione delle due regole pitagoriche
n volte e poi riportando la nota all’ottava iniziale applicando la prima regola un numero k di
volte, pari al numero di ottave di cui siamo allontanati da quella iniziale. Ad esempio per n =
−4, −3, −2, . . . , 6, 7, 8 si trovano i valori di rn :
128 32 16 4 1 3 9
La [ → Mi [ → Si [ → F a → Do → Sol → Re
81 27 9 3 1 2 8
27 81 243 729 2187 6561
→ La → Mi → Si → Fa] → Do ] → Sol ]
16 64 128 512 2048 4096
23
Ricordiamo che già Archita aveva mostrato che gli intervalli della forma (n + 1) : n, e dunque in particolare il
tono intero 9 : 8, non si possono dividere in due intervalli uguali per mezzo di numeri razionali.
24
Più in generale, l’equazione (3/2)q = 2p non ha soluzioni intere.
31
Osserviamo innanzitutto che la quinta tra Do ] e La [ vale
128/81 262144
=
2187/2048 177147
ed è inferiore alla quinta giusta - che intercorre tra Do ] e Sol ] - di un comma pitagorico:
3/2 128/81 531441
= =
262144/177147 6561/4096 524288
Le note La [ e Sol ] - ottenute l’una dall’altra salendo 12 quinte e ridiscendendo 7 ottave e le cui
frequenze differiscono appunto per un comma pitagorico - formano una coppia enarmonica.
Se ora riordiniamo in ordine di frequenza crescente le prime dodici note ottenute partendo da C
otteniamo la scala cromatica
Do Do] Re Mi [ Mi Fa F a] Sol La[ La Si [ Si Do
S − S0 − S − S0 − S − S0 − S − S − S0 − S − S0 − S
dove sul secondo rigo abbiamo riportato la sequenza di intervalli tra note successive. Tuttavia,
come abbiamo visto, se aggiungiamo nuove note a questa scala otteniamo subito nuovi intervalli,
come ad esempio le coppie enarmoniche. Iterando la procedura otteniamo la spirale delle quinte:
Poniamoci ora il seguente problema: la spirale si richiude prima o poi? Se sì, quando?
Lemma 4.1. Il sistema di intervalli ottenuto applicando ripetutamente le due regole pitagoriche
non è chiuso.
32
3 n

Dimostrazione. Prendendo il logaritmo in base due dell’uguaglianza zn = 2
= 2k rn si ottiene
(9) nα = k + log2 rn con α = log2 (3/2)
Se la spirale si chiudesse allora vi sarebbero due numeri interi n1 e n2 tali che n1 6= n2 e rn1 = rn2 .
In tal caso avremmo che n1 α − k1 = n2 α − k2 e quindi
k 1 − k2 p
α= ≡
n1 − n2 q
cioè α sarebbe un numero razionale. Ma allora si avrebbe 3/2 = 2p/q ovvero 3q = 2p−q . D’altra
parte il primo termine è sempre dispari mentre il secondo è sempre pari.
In particolare α è un numero irrazionale25. Osserviamo che se α fosse razionale, cioè α = p/q,
allora da
nα = k + log2 rn , 1 ≤ rn < 2
con la scelta n = q si avrebbe che rq = 1 e dunque la spirale si richiuderebbe dopo esattamente q

iterazioni. In altri termini, a partire dalle regole pitagoriche si potrebbe costruire un temperamento
‘chiuso’ dividendo l’ottava in q intervalli. Vedremo più avanti in che modo α = 0, 584963 . . . si
può approssimare con alcuni numeri razionali, ad esempio:
3 7 31
= 0, 6 = 0, 583333 . . . = 0, 584906 . . .
5 12 53
in modo da costruire sistemi chiusi con 5, 12, 53, . . . intervalli.
4.1. Rotazioni irrazionali. Quanto visto sopra può essere riguardato come conseguenza del com-
portamento generale di sistemi dinamici noti come rotazioni del cerchio. Sia X = S 1 = R/Z il
cerchio unitario, α ∈ (0, 1) e Rα : S 1 → S 1 la rotazione Rα (x) := x + α (mod 1). L’equazione
(9) può allora essere riscritta nella forma
log2 rn = Rαn (0) con α = log2 (3/2)
D’altra parte, le trasformazioni Rα si comportano in modo molto differente a seconda che α sia
razionale o meno. Se α = pq con p, q interi, allora Rαq (x) = x + q α = x + p = x, e dunque tutti i
punti su X sono periodici di periodo q per Rα .
25
La scoperta dei numeri irrazionali, ovvero delle grandezze incommensurabili, è a dir poco incerta, ma si ritiene
localizzabile in Italia meridionale verso la fine del V secolo a.C., possibilmente ad opra di Ippaso di Metaponto, un
pitagorico che, proprio per averne divulgato l’esistenza fu espulso dalla setta e addirittura costretto a morire annegato.
33
100 iterate di Rα con α = 2/3
Se invece α è irrazionale allora vale il seguente risultato (ricordiamo che un insieme A è denso
nell’insieme B se in ogni intorno arbitrariamente piccolo di ogni punto di B si può trovare un
punto di A):
Lemma 4.2. Se α è irrazionale ogni orbita di Rα è densa in X.
√
5−1
100 iterate di Rα con α = 2
Dimostrazione. Innanzitutto notiamo che i punti dell’orbita di un qualunque 0 < x < 1 sono
tutti distinti. Infatti se fosse Rαn (x) = Rαm (x) allora si avrebbe (n − m)α = k con k intero e
34
dunque n = m (perchè abbiamo supposto α irrazionale). Ora, ogni insieme infinito sul cerchio
deve avere un punto di accumulazione. Quindi, dato > 0, devono esistere due interi n e m
tali che |Rαn (x) − Rαm (x)| < . Poniamo k = n − m. Allora |Rαk (x) − x| < . D’altra parte,
Rα preserva le lunghezze in X. Dunque Rαk trasforma l’arco che connette x a Rαk (x) nell’arco
che connette Rαk (x) a Rα2k (x), anch’esso di lughezza più piccola di . In altre parole, i punti
x, Rαk (x), Rα2k (x), . . . formano una partizione di X in intervalli di lunghezza minore di . Ciò è
sufficiente a provare l’asserto per l’arbitrarietà di .
La struttura degli intervalli generati dall’iterazione di una rotazione irrazionale è descritta dal
seguente risultato di Slater (1967), che ci limitiamo ad enunciare.
Teorema 4.1. (Teorema delle tre distanze). Per ogni α ∈ R \ Q la sequenza {Rαn (0)} = {nα}
con 0 ≤ n < ` partiziona il cerchio unitario in ` intervalli le cui lunghezze assumono al più tre
valori, uno uguale alla somma degli altri due.
Così, ad esempio, se α = log2 (3/2) e ` = 12 si trovano due lunghezze possibili: quella corrispon-
dente al tono T , cioè J1 = log2 9 − log2 8 = 2α − 1 e quella corrispondente al semitono diatonico
S, cioè J2 = log2 (256) − log2 (243) = 3 − 5α. Aumentando `, compaiono progressivamente altre
lunghezze, la prima delle quali è proprio quella corrispondente al semitomo cromatico S 0 , ovvero
J3 = J1 − J2 = log2 (2187) − log2 (2048) = 7α − 4. Riprenderemo questo aspetto più avanti.
5. C ENTESIMI
Abbiamo visto come sommare intervalli equivalga a moltiplicare i corrispondenti rapporti di fre-
quenze, in modo da rispettare la nostra percezione logaritmica della distanza musicale tra due note
(la funzione logaritmo ha la proprietà di trasformare un prodotto in una somma: log(a · b) =
log a + log b). Un sistema molto usato per misurare rapporti di frequenza è quello dei centesimi,
introdotto dal matematico (e filologo) inglese Alexander Ellis intorno al 1875. In questa scala
logaritmica un intervallo di ampiezza r corrisponde a26
log10 r
c = 1200 · log2 r = 1200 · centesimi
log10 2
Così, l’ottava r = 2/1 corrisponde a 1200 · log2 2 = 1200 centesimi, mentre la quinta giusta
r = 3/2 corrisponde a 1200 · log2 (3/2) = 701, 955 centesimi. Viceversa, un intervallo di c
centesimi corrisponde ad un rapporto di frequenze pari a
c
r = 2 1200 : 1
Ad esempio, il tono pitagorico (9 : 8) vale 203, 910 centesimi, mentre i semitoni diatonico (256 :
243) e cromatico (2187 : 2048) valgono rispettivamente 90, 225 e 113, 685 centesimi. La loro
differenza, il comma pitagorico, vale 23, 460 centesimi.
26
Ricordiamo la formula del cambiamento di base per i logaritmi: loga r = logb r/logb a.
35
6. T EMPERAMENTI NATURALI
Il sistema pitagorico rimase in uso fino al basso Medioevo, soddisfacendo le esigenze della compo-
sizione monodica e della polifonia medievale, in cui gli accordi conclusivi contenevano solo ottave
e quinte. Ma nel corso del XV secolo si affermò un uso sempre più frequente degli intervalli di
terza e sesta, che nella scala pitagorica risultano poco consonanti.
Nel 1558 il teorico musicale Gioseffo Zarlino - riprendendo e formalizzando precedenti apporti di
matematici quali Archita, Filolao, Didimo, Tolomeo - propose una costruzione della scala musicale
che includesse anche i rapporti 5:4 e 6:5 (terza maggiore e minore) come intervalli fondamentali
(temperamento naturale). Nei secoli XVII e XVIII diversi autori (Cartesio, Mersenne, Rameau,
d’Alembert) posero a fondamento della teoria musicale la spiegazione scientifica della "giustezza"
degli intervalli basati su rapporti semplici.
Il temperamento naturale è un sistema aperto che consiste nel prendere un certo numero di ar-
moniche
ν, 2ν, 3ν, 4ν, 5ν, 6ν, 7ν . . .
di una nota fondamentale ν e riportarle all’ottava di partenza.
In questo modo otteniamo i rapporti
1:1 per la prima, seconda, quarta, ottava, . . . , armonica
3:2 per la terza, sesta, dodicesima, . . . , armonica
5:4 per la quinta, decima, . . . , armonica
7:4 per la settima, quattordicesima, . . . , armonica
36
e così via. Limitandoci alle prime tre serie, oltre all’ottava, la quinta e la quarta, otteniamo:
• le terze maggiori (5 : 4) e minori (6 : 5)
• le seste minori (8 : 5) e maggiori (5 : 3)
Osserviamo che una terza maggiore + una terza minore = una quinta giusta:
5 6 3
× =
4 5 2
e una sesta maggiore + una terza minore = una sesta minore + una terza maggiore = un’ottava:
5 6 8 5 2
× = × =
3 5 5 4 1
Vi sono tre intervalli possibili tra note successive, alternati come come T −T 0 −S −T −T 0 −T −S:
• il tono maggiore T = 9 : 8
• il tono minore T 0 = 10 : 9
• il semitono diatonico S = 16 : 15
La terza maggiore naturale (5 : 4) è più consonante di quella pitagorica (81 : 64). In particolare
si ha ora una triade naturale maggiore (Do-Mi-Sol) con rapporti 4 : 5 : 6. Le tre note di
una triade maggiore possono dunque essere riguardate come armoniche successive di una stessa
fondamentale. Gran parte delle scale usate nel mondo occidentale incorporano in qualche forma
questa triade, composta da una terza maggiore (Do-Mi) e da una terza minore (Mi-Sol). Invertendo
l’ordine di questi intervalli si ottiene la triade naturale minore, come ad esempio Mi-Sol-Si.
Queste tre note hanno rapporti 10 : 12 : 15 e dunque hanno in comune le armoniche caratterizzate
da
6 × Mi = 5 × Sol = 4 × Si
Confrontando la scala pitagorica con quella naturale, troviamo la discrepanza
81 5 27 5 243 15 81
: = : = : =
64 4 16 3 128 8 80
La stessa discrepanza, chiamata comma sintonico, si trova anche confrontando la quinta giusta
[Do, Sol] con la quinta [Re, La] che vale 40 : 27. Un comma pitagorico meno un comma sintonico
si chiama scisma e vale
32805
(531441 : 524288)/(81 : 80) = ' 1, 953 centesimi
32768
37
6.1. Temperamenti naturali e numeri primi.
Moltiplichiamo i rapporti della scala naturale
1 9 5 4 3 5 15 2
, , , , , , ,
1 8 4 3 2 3 8 1
per il m.c.m. dei loro denominatori, cioè 24. Otteniamo la sequenza:
Do 24 = 2 · 2 · 2 · 3
Re 27 = 3 · 3 · 3
Mi 30 = 2 · 3 · 5
Fa 32 = 2 · 2 · 2 · 2 · 2
Sol 36 = 2 · 2 · 3 · 3
La 40 = 2 · 2 · 2 · 5
Si 45 = 3 · 3 · 5
Do 48 = 2 · 2 · 2 · 2 · 3
Si vede in tal modo che le sette note del genere diatonico si possono ricavare usando i primi tre
numeri primi 2, 3 e 5. Applicando il 3 e il 5 (modulo 2) si ottengono le quinte giuste e le terze
maggiori rispettivamente.
“Anche ammettendo solo questi toni si è già in grado di comporre bellissime e vari-
atissime melodie, la cui bellezza è fondata unicamente sulla semplicità dei numeri
che hanno fornito questi toni".27
D’altra parte, con gli stessi tre numeri primi, possiamo ottenere una scala cromatica di dodici note:
• applicando il 5 al Re = 9/8 otteniamo il nuovo tono Fa ] = 45/32
• applicando ancora il 5 a Mi = 5/4, La = 5/3, Fa] = 45/32 e Si = 15/8 otteniamo i nuovi
toni Sol] = 25/16, Do] = 25/24, La] = 225/128 e Re] = 75/64
Riassumendo abbiamo ottenuto la scala cromatica naturale di dodici note
1 25 9 75 5 4 45 3 25 5 225 15 2
, , , , , , , , , , , ,
1 24 8 64 4 3 32 2 16 3 128 8 1
In questa scala scala ci sono tre quinte "stonate", due per difetto e una per eccesso:
[Re, La], [F a], Do]] (40 : 27) e [La], F a] (1024 : 675)
dove (3/2) : (40/27) = 81/80, mentre il rapporto (1024/675) : (3/2) = 2048/2025 si chiama
diascisma. Vi è inoltre un nuovo semitono, ad esempio l’intervallo [Do, Do ]] che vale 25/24,
detto semitono cromatico naturale. Il rapporto tra semitono diatonico e semitono cromatico, cioè
(16 : 15)/(25 : 24) = 128 : 125 si chiama comma enarmonico.
Se ora procediamo come sopra, moltiplicando i rapporti della scala cromatica naturale per il loro
m.c.m., che vale 384, si ottiene
27
Eulero, Lettere a una principessa tedesca, Lettera 7, Sui dodici toni del clavicembalo, 1768
38
Do 384 = 2 · 2 · 2 · 2 · 2 · 2 · 2 · 3
Do ] 400 = 2 · 2 · 2 · 2 · 5 · 5
Re 432 = 2 · 2 · 2 · 2 · 3 · 3 · 3
Re ] 450 = 2 · 3 · 3 · 3 · 5
Mi 480 = 2 · 2 · 2 · 2 · 2 · 3 · 5
Fa 512 = 2 · 2 · 2 · 2 · 2 · 2 · 2 · 2
Fa ] 540 = 2 · 2 · 3 · 3 · 3 · 5
Sol 576 = 2 · 2 · 2 · 2 · 2 · 2 · 3 · 3
Sol ] 600 = 2 · 2 · 2 · 3 · 5 · 5
La 640 = 2 · 2 · 2 · 2 · 2 · 2 · 2 · 5
La ] 675 = 3 · 3 · 3 · 5 · 5
Si 720 = 2 · 2 · 2 · 2 · 3 · 3 · 5
Do 768 = 2 · 2 · 2 · 2 · 2 · 2 · 2 · 2 · 3
Si vede di qui come le differenze fra questi toni non siano affatto uguali fra loro, ma
alcune siano più grandi e altre più piccole, proprio come esige la vera armonia.
Molti musicisti vogliono considerarle effettivamente eguali, quantunque questo sia
contrario ai principi dell’armonia, perché a questa maniera nessuna quinta, nes-
suna terza è esatta e l’effetto che se ne ottiene è come se questi toni non fossero
bene accordati. Convengono anche che si deve rinunciare all’esattezza di questi
accordi in cambio del vantaggio dell’eguaglianza di tutti i semitoni, di modo che
la trasposizione di un tono in un altro qualsiasi non cambi nulla nelle melodie [...]
ma è chiaro che, quantunque i musicisti si sforzino di renderli uguali, non tutti i
semitoni lo sono effettivamente, opponendosi la vera armonia alla riuscita di un
simile progetto che le è contrario.
Ecco dunque la vera origine dei toni oggi in uso: essi sono ricavati dai numeri
2, 3 e 5. Se poi si volesse ancora introdurre il numero 7, il numero dei toni in
un’ottava si accrescerebbe e tutta la musica verrebbe portata a un più alto grado
di perfezione. Ma è qui che la matematica abbandona l’armonia alla musica.28
Sappiamo che ogni intero positivo a si può fattorizzare nel prodotto

a = pe11 · pe22 · · · penn
di potenze intere positive ei di numeri primi p1 < p2 < · · · < pn . Dunque ogni numero razionale
si può esprimere nella forma
2i 3j 5l 7m · · ·
con i, j, l, m ∈ Z. Ad esempio 2−1 31 rappresenta una quinta giusta mentre 2−2 51 una terza mag-
giore. I temperamenti naturali sono appunto quelli in cui tutti gli intervalli sono espressi da numeri
razionali.
28
Ibid
39
D EFINIZIONE . Se p è un numero primo, una scala naturale di ordine p è una scala che usa
solo numeri razionali il cui numeratore e denominatore si fattorizzano per mezzo di numeri primi
minori o uguali a p (eventualmente ripetuti).
Ad esempio, considerando tutte le potenze dei primi due primi 2 e 3 si ottiene l’insieme
(10) {2i 3j : i, j ∈ Z}
in cui vi sono interi come 1, 2, 3, 4, 6, . . . , ma anche frazioni come 23 , 34 , 98 etc. D’altra parte, possi-
amo scrivere 2i 3j nella forma
j q
i j i+j 3 p 3
(11) 23 =2 =2
2 2
con p = i + j e q = j. Pertanto, se consideriamo tutti i numeri dell’insieme (10) come rapporti
di frequenze vediamo che ciascuno di essi può essere costruito con un certo numero di ottave e un
certo numero di quinte. Abbiamo quindi stabilito che il temperamento pitagorico è una scala
naturale di ordine 3.
6.2. Altri esempi di scale naturali.

1. La cornamusa scozzese è accordata su una scala naturale di ordine 7 con dieci toni:
1 9 5 4 27 3 5 7 16 9 2
, , , , , , , , , ,
1 8 4 3 20 2 3 4 9 5 1
2. Il sistema musicale indiano, risalente al II sec. a.C. è basato su una scala naturale di ordine 5
con ventidue toni:
1 256 16 10 9 32 6 5 81 4 27 45 729 3 128 8 5 27 16 9 15 243 2

, , , , , , , , , , , , , , , , , , , , , ,
1 243 15 9 8 27 5 4 64 3 20 32 512 2 81 5 3 16 9 5 8 128 1
Nella musica classica indiana l’ottava è suddivisa come nel sistema occidentale, in sette note
(swara) chiamate Sa (Shadaja), Ri (Rishabha), Ga (Gandhara), Ma (Madhyama), Pa (Panchama),
Dha (Dhaivata) e Ni (Nishada). Ma la sua organizzazione è resa più complessa dal fatto che tra due
note successive vi possono essere due, tre o quattro microintervalli, detti sruti, come nel seguente
schema
Troviamo tre tipi di microintervalli: 256 : 243 (semitono diatonico pitagorico, circa 90, 225 cen-
tesimi), 25 : 24 (semitono cromatico naturale, circa 70, 672 centesimi) e 81 : 80 (comma sintonico,
circa 21.506 centesimi). Osserviamo inoltre che vi è una simmetria quasi perfetta nel fatto che
ogni intervallo dal basso in alto rispetto alla fondamentale è anche un intervallo dall’alto in basso
rispetto all’ottava, con le eccezioni che manca l’intervallo appaiato a 27/20 (che sarebbe 40/27) e
che al posto di 729/512 dovrebbe esserci 64/45.
3. Harry Partch (1901-1974) ha costruito una scala naturale di ordine 11 con 43 toni, con perfetta
simmetria, e l’ha usata in numerose sue composizioni (con strumenti spesso costruiti apposita-
mente).
40
4. The Well-Tuned Piano, l’opera più importante di La Monte Young (1935-), è basata sulla scala
di ordine 7 con dodici toni:
1 567 9 147 21 1323 189 3 49 7 441 63 2
, , , , , , , , , , , ,
1 512 8 128 16 1024 128 2 32 4 256 32 1
6.3. Descrizione gruppale e geometrica dei temperamenti naturali.

L’insieme di numeri definito in (10) costituisce un gruppo.
D EFINIZIONE . Si dice gruppo un insieme non-vuoto G insieme ad un’operazione binaria ◦ su G
che soddisfa:
• Proprietà associativa: (x ◦ y) ◦ z = x ◦ (y ◦ z) per ogni x, y, z ∈ G.
• Esiste un unico elemento e ∈ G, chiamato identità di G, tale che x ◦ e = e ◦ x = x per
ogni x ∈ G.
• Per ogni x ∈ G esiste un unico elemento x−1 ∈ G, detto inverso di x, con la proprietà che
x ◦ x−1 = x−1 ◦ x = e.
Un gruppo G si dice abeliano se i suoi elementi commutano, ovvero se x ◦ y = y ◦ x per ogni
x, y ∈ G.
Se ora riprendiamo la descrizione della scala pitagorica fatta più sopra (cf (10)-(11)), vediamo che
l’insieme (10) costituisce un gruppo abeliano P2 con infiniti elementi rispetto all’operazione di
moltiplicazione (l’elemento identità è 1 e l’inverso di un suo elemento x è 1/x). Scriviamo dunque
q
p 3
(12) P2 = 2 : i, j ∈ Z
2
In modo simile, il gruppo P3 può essere definito da {2i 3j 5k : i, j, k ∈ Z} o, in modo equivalente,
da
q r
p 3 5
(13) P3 = 2 : p, q, r ∈ Z
2 4
cosicchè i suoi elementi possono essere riguardati come tutti gli intervalli costruiti con ottave,
quinte giuste e terze maggiori. In generale, si può costruire allo stesso modo il gruppo Pn per
ogni n intero positivo per mezzo dei primi n numeri primi, e i temperamenti risultanti saranno
temperamenti naturali di ordine p = n-esimo numero primo. È evidente che Pn è un sottogruppo
di Pn . Posto P1 = {2p : p ∈ Z} si ha dunque P1 ⊂ P2 ⊂ P3 ⊂ · · · .
Concentriamoci ora sul temperamento naturale di ordine 5 rappresentato dal gruppo P3 . Si può
mostrare facilmente (usando l’unicità della fattorizzazione degli interi) che la mappa
q r
3 p 3 5
(14) φ : (p, q, r) ∈ Z ←→ 2 ∈ P3
2 4
stabilisce un isomorfismo tra P3 e il gruppo Z3 . D’altra parte, se ci limitiamo a considerare solo gli
intervalli di P3 entro l’ottava [1, 2) possiamo costruire una proiezione π : P3 → Z2 che suddivide
P3 in classi di equivalenza costituite dagli stessi intervalli trasposti su tutte le ottave, ciascuna delle
quali ha un rappresentante in [1, 2). Ad esempio gli intervalli 5/4, 10/4, 5/8, 5/1 stanno tutti nella
stessa classe di equivalenza, e il loro rappresentante in [1, 2) è 5/4. La proiezione π, data da
q r
p 3 5
π:2 → (q, r)
2 4
41
soddisfa π(1) = 0, π(x−1 ) = −π(x) e
π(xy) = π(x)π(y) ∀x, y ∈ P3
In algebra, una funzione tra gruppi f : G → H che è compatibile con la struttura di gruppo, nel
senso appena visto, si dice omomorfismo di gruppi. Si dice nucleo di f l’insieme degli elementi
g ∈ G tali che f (g) è uguale all’elemento identità di H. Inoltre, il primo teorema dell’isomorfismo
afferma che dato un omomorfismo di gruppi f : G → H, esiste un isomorfismo (cioè una appli-
cazione biunivoca)
Dunque π : P3 → Z2 è un omomorfismo di gruppi il cui nucleo è P1 (ovvero tutti gli elementi di
P1 vengono mandati nell’elemento unitario (0, 0) ∈ Z2 ). Inoltre, il gruppo quoziente P̃3 = P3 /P1
ovvero il gruppo dei laterali29 di P1
P̃3 = {xP1 : x ∈ P3 }
è isomorfo a Z2 . Una porzione di P̃3 ordinata in accordo con gli elementi di Z2 è mostrata in figura.
Sulla riga orizzontale centrale si possono facilmente individuare gli elementi della scala pitagorica,
mentre, ad esempio, la scala diatonica naturale si può individuare tra gli elementi centrali della
prima e della seconda riga. Più in generale, ogni scala naturale di ordine 5 può essere individuata
come un sottoinsieme di P̃3 .
29
Dato un sottogruppo H di un gruppo G, l’insieme degli elementi ottenuti componendo tutti gli elementi di H da
sinistra per un elemento x ∈ G, cioè l’insieme gH = {g ◦ h : h ∈ H}, si dice laterale (sinistro) di H. Analogamente
si definisce il laterale destro Hg. Il sottogruppo H si dice normale se i suoi laterali sinistro e destro coincidono.
L’indice di un sottogruppo normale H, indicato con [G : H], è il numero dei suoi laterali in G. Se ad esempio G = Z
con l’operazione di addizione, e H è il sottogruppo costituito solo dai numeri pari, allora gH = Hg = H se g ∈ H,
mentre gH = Hg = G \ H se g ∈ / H. H è dunque un sottogruppo normale di indice due.
42
Osserviamo che la scala cromatica naturale discussa in precedenza, cioè
1 25 9 75 5 4 45 3 25 5 225 15
, , , , , , , , , , ,
1 24 8 64 4 3 32 2 16 3 128 8
è esattamente contenuta nel parallelogramma di vertici 25/16, 16/9, 9/8 e 75/64 (quest’ultimo non
riportato in figura ma immediatamente a destra di 225/128).
Ora, il gruppo Z2 ha come generatori (1, 0) e (0, 1), che nella figura mostrata sopra corrispondono
agli intervalli di quinta 3/2 e terza maggiore 5/4. Ogni altro elemento del reticolo può essere
ottenuto come combinazione lineare dei due generatori. D’altra parte questi non sono unici. Due
vettori (a, b) e (c, d) sono generatori di Z2 ogni volta che l’area del parallelogrammo costruito su di
essi è uguale a uno, cioè se ad − bc = 1. Così, due generatori alternativi sono ad esempio (1, −1)
e (0, 1), che corrispondono agli intervalli di terza minore 6/5 e terza maggiore 5/4. Osserviamo a
questo proposito che si può scrivere, come prima,
q r
i j k 3 5
p
23 5 =2 , p = i + j + 2k, q = j, r = k
2 4
oppure
q r
i j k 5 p 6
23 5 =2 , p = i + j + 2k, q = j + k, r = j
4 5
ed in entrambi casi la mappa (i, j, k) → (p, q, r) è una biiezione. Possiamo dunque costruire una
rappresentazione equivalente di P3 della forma
q r
p 5 6
(15) 2 : p, q, r ∈ Z
4 5
q 6 r
e la proiezione 2p 45 5
→ (q, r) fornisce la seguente rappresentazione di P̃3 generata dagli
intervalli di terza maggiore e minore.
43
Ora la scala cromatica naturale è contenuta nel parallelogramma di vertici 9/8, 4/3, 25/24 e 225/128
(quest’ultimo non riportato in figura ma immediatamente a destra di 45/32).
Ragionando in modo simile a quanto fatto per mostrare che il temperamento pitagorico non è un
sistema chiuso, si mostra facilmente che anche il temperamento naturale di ordine 5 non lo è. In
particolare le (infinite) frazioni che compaiono nelle rappresentazioni riportate sopra sono tutte
distinte. Se ad esempio nella prima figura partendo da Si [(16/9) ci muoviamo quattro passi verso
destra, passando per Fa (4/3 =, Do (1/1), Sol 3/2 e arrivando al Re (9/8), e poi uno verso il
basso (4 quinte - 2 ottave - 1 terza maggiore) arriviamo ad un Si [ pari a 9/5, che è più grande
di quello di partenza di un comma sintonico 81/80. Oppure, se nella seconda figura partendo dal
Do centrale (1/1) ci muoviamo tre passi verso destra (tre terze maggiori), passando per Mi (5/4)
e Sol ](25/16), arriviamo a Si ](125/64), che differisce da un’ottava (per difetto) di un comma
enarmonico 128/125.
In generale, possiamo dire che nell’ambito dei temperamenti naturali i rapporti tra le frequenze
all’interno dell’ottava non si possono fissare una volta per tutte senza creare leggere distorsioni, in
modo simile a come non è possibile schiacciare in maniera perfetta una semisfera su un piano, e
quindi occorre decidere che cosa conservare più fedelmente e cosa meno. Ciò dà origine appunto
44
all’esistenza di microintervalli, detti comma e di loro combinazioni dette scisma, caratteristici
di ciascun tipo di ‘accordatura’. Riassumendo quanto visto fin qui, vi sono tre tipi principali di
comma e due tipi principali di scisma:
• il comma pitagorico risulta dal fatto che dodici quinte giuste consecutive non possono
dare l’ottava. Il microintervallo risultante vale poco meno di un nono di tono:
531441
12 quinte − 7 ottave = ' 23, 460 centesimi
524288
• il comma sintonico risulta dal fatto che quattro quinte giuste consecutive non possono dare
la terza maggiore naturale. Il microintervallo risultante vale poco più di un decimo di tono:
81
4 quinte − 2 ottave − 1 terza maggiore = ' 21, 506 centesimi
80
• il comma enarmonico risulta dal fatto che tre terze maggiori consecutive non possono
dare l’ottava. Il microintervallo risultante vale poco meno di un quarto di tono:
128
1 ottava − 3 terze maggiori = ' 41 centesimi
125
• un comma pitagorico meno un comma sintonico si chiama scisma e vale
32805
3 quinte + 1 terza maggiore − 5 quarte = ' 1, 953 centesimi
32768
• un comma sintonico meno uno scisma si chiama diascisma e vale
2048
3 ottave − 4 quinte − 2 terze maggiori = ' 19, 552 centesimi
2025
Temperare30 uno o più di questi microintervalli significa costruire sistemi di note in cui essi
spariscano. Ad esempio, un modo di temperare il comma sintonico dà luogo al cosiddetto temper-
amento mesotonico.
7. T EMPERAMENTO MESOTONICO
Nell’accordatura degli strumenti un problema pratico è che, come abbiamo visto, nel tempera-
mento naturale non tutti gli intervalli di quinta sono giusti:
[Re, La] vale 40/27 e (3/2) : (40/27) = 81/80
L’esistenza del comma sintonico fa sì che uno strumento ad intonazione fissa accordato sec-
ondo la scala naturale di Do suona bene solo nella tonalità di Do. Per cambiare la tonica
(modulazione) bisogna cambiare strumento, o riaccordarlo.
Nota 7.1. Tuttavia nel temperamento naturale è possibile imbattersi nel comma sintonico anche
senza cambiare tonalità. Consideriamo l’esempio illustrato in figura.
30
Termine latino che significa porre nella misura conveniente.
45
Nel primo accordo il Re è intonato una quarta giusta 4/3 sotto al Sol. Nell’accordo adiacente, il
La si trova una quinta giusta 3/2 sopra il Re. Nell’accordo ancora successivo, il Do si trova una
sesta maggiore 5/3 sotto il La. Ed infine nell’accordo finale il Sol si trova una quinta giusta 3/2
sopra il Do. Confrontando l’ultimo Sol con il primo vediamo che tra i due intercorre un intervallo
pari a
3 3 3 3 81
× × × =
4 2 5 2 80
Questo esempio fu portato da Benedetti nel 1585 come argomento contro Zarlino, il quale nella
seconda parte della sue Istituzioni harmoniche sosteneva che il canto senza accompagnamento
strumentale tende a svilupparsi in intonazione giusta. •
Lo stesso Zarlino introdusse la variante del temperamento mesotonico (o del tono medio), in se-
guito generalizzata da vari autori (Praetorius, Mersenne, Werckmeister, ecc), in cui si tiene fisso il
rapporto di 5:4 per le terze maggiori (d’importanza crescente nella musica polifonica a partire dal
tardo medioevo) e i restanti intervalli si interpolano
√ rendendoli più omogeni possibile. In questo
modo Do−Re−M i stanno nei rapporti 1 : 5/2 : 5/4,√così come F a−Sol −La e Sol −La−Si.
Ne risulta una scala con cinque toni uguali di rapporto 5 : 2 e due semitoni uguali ciascuno pari
a q √
2/( 5/2)5 : 1 = 8 : 55/4
L’intervallo di quinta si abbassa di un quarto di comma sintonico, cioè di (81/80)1/4 = (2/3)51/4 ,
diventando 51/4 : 1.
• In questo modo si mette a posto il comma sintonico e si riescono a fare cambiamenti di
tonalità (modulazioni) in un certo numero di chiavi.
• Ma il comma pitagorico resta: tentando di chiudere la spirale delle quinte ci si imbatte nella
quinta del lupo. Ad esempio [Do ] , La [] ha un rapporto di (25 : 16)/(8 : 55/4 ) = 513/4 :
27 , che rispetto alla quinta [Do, Sol] è ‘calante’ di un comma enarmonico 51/4 /(513/4 :
27 ) = 128/125 ' 41 centesimi, ossia circa un quarto di tono.
8. T EMPERAMENTI IRREGOLARI
Ai tempi di Bach era definito "buon temperamento" qualsiasi sistema di accordatura che perme-
ttesse di suonare in tutte le tonalità. Gli esempi più antichi di "buon temperamento" sono quelli
descritti dall’organista e teorico musicale Andreas Werckmeister alla fine del diciassettesimo sec-
olo: fu proprio lui a coniare il termine Wohltemperierte Stimmung (buona accordatura). Si tratta
46
di scale di dodici note ottenute modificando in modo irregolare la scala mesotonica per farla fun-
zionare su tutte le dodici chiavi, eliminando la quinta del lupo. Con ognuna di queste accordature,
era possibile suonare in tutte le tonalità ma l’alterazione di ciascun accordo rispetto alle conso-
nanze perfette variava da una tonalità all’altra. Ogni tonalità acquistava in questo modo un "colore"
caratteristico, che tuttavia dipendeva dal particolare "buon temperamento" adottato.
J. S. Bach, Das Wohltemperirte Clavier (1722, 1744)
Il manoscritto autografo del primo libro dell’opera Das Wohltemperirte Clavier si apre su una pag-
ina compilata e decorata da Bach stesso. L’intestazione rivela l’intento pedagogico dell’opera e
la vastità di conoscenza in essa contenuta ed elargita: ll Clavicembalo ben temperato, ossia Pre-
ludi e Fughe in tutti i toni e semitoni, tanto nella tertia major ossia Ut Re Mi quanto nella tertia
minor o Re Mi Fa. Ad uso e profitto della gioventù musicale desiderosa di apprendere, e anche
per diletto di coloro che sono già esperti in quest’arte. Composto e preparato da Johann Sebastian
Bach attuale Kapellmeister di Sua Altezza Serenissima il Principe di Anhalt-Köthen e direttore
della di lui Musica da Camera. Recentemente (Bradley Lehman, 2005) è stata avanzata l’ipotesi
che Bach avesse voluto lasciare ai suoi allievi precise indicazioni sullo schema di temperamento
da lui preferito, celate nel fregio calligrafico irregolare sovrapposto al titolo del manoscritto auto-
grafo. Secondo questa ipotesi, la serie di riccioli sopra il titolo codifica le istruzioni per costruire
il temperamento. Ad esempio in ogni ricciolo vi sono 0, 1 o 2 circoletti, nella sequenza: 1-1-1-0-
0-0-2-2-2-2. Potrebbe indicare all’accordatore quanto rendere le undici quinte vicine alla quinta
giusta (la dodicesima non dovendo essere specificata).
9. T EMPERAMENTO EQUABILE
Il temperamento equabile è il sistema musicale per la costruzione della scala fondato sulla suddi-
visione dell’ottava in intervalli tra di loro uguali. Nell’uso più frequente, l’ottava è suddivisa in 12
parti. Già descritto da Aristosseno di Taranto nel IV secolo a.C., come parte di un sistema per molti
versi alternativo a quello pitagorico, questo sistema fu ripreso nel XVI secolo da numerosi autori,
tra cui il discepolo "rinnegato" di Zarlino, Vincenzo Galilei (1525-1591), il filosofo e matematico
veneziano Giovanni Battista Benedetti (1530-1590), per essere compiutamente teorizzato nel 1585
dal matematico fiammingo Simone Stevino (1548-1620).
Tuttavia la sua adozione fu molto graduale, sia per resistenze di natura estetica e filosofica che con-
tinuano ancora oggi ad alimentare accese controversie, sia a causa delle difficoltà nell’accordatura
degli strumenti (per mancanza di intervalli giusti di riferimento).
Dividendo l’ottava in dodici semitoni uguali, l’ampiezza a di ciascuno deve soddisfare
a12 = 2 : 1 ⇒ a = 21/12 : 1
47
e dunque a è ora un numero irrazionale. Poiché 21/12 ' 1, 059, un semitono equabile è appena
più grande del semitono pitagorico 256/243 ' 1, 053. Il tono 22/12 ' 1, 122 è invece più piccolo
di quello naturale-pitagorico 9/8 ' 1, 125. Tuttavia, al contrario di quello, si può dividere in due
parti esattamente uguali (ma, appunto, irrazionali). Anche la quinta 27/12 ' 1, 498 è un po’ più
piccola di 3/2. È evidente che in questo temperamento il vantaggio di avere un’approssimazione
costante si paga con il fatto che nessun intervallo segue gli armonici.
Generalmente parlando, il problema del temperamento equabile è quello di fare in modo che le
scale risultino il più consonanti possibile su tutte le tonalità. Essendo l’intervallo di quinta giusta
il più consonante (dopo l’ottava), si cerca di dividere l’immagine logaritmica di un’ottava in un
numero di parti uguali in modo tale che il numero irrazionale
log2 (3/2) = 0, 584962500721 . . .
sia ben approssimato.
9.1. Frazioni continue. Una frazione continua è un’espressione del tipo
1
a0 + ≡ [a0 ; a1 , a2 , a3 , . . . ]
1
a1 +
1
a2 +
1
a3 +
..
.
dove ai ∈ Z, ai ≥ 1 per i ≥ 1, si chiamano quozienti parziali. Ad esempio
7 1
= = [0; 1, 1, 2, 2]
12 1
1+
1
1+
1
2+
2
1
Ma 1/2 = 1/(1 + 1 ) , e dunque si può anche scrivere 7/12 = [0; 1, 1, 2, 1, 1]. Ogni numero reale
ammette un unico sviluppo in frazione continua, che si arresta se e solo se il numero è razionale.
Per vedere questo fatto mostriamo come si fa a calcolare lo sviluppo in frazione continua di un
numero reale x.
A questo scopo chiamiamo [a] la parte intera del numero a (cioè il più grande intero minore o
uguale ad a). Allora se poniamo a0 = [x0 ] si ha
x = a0 + x 0 con 0 ≤ x0 < 1
Poi scriviamo
1
= a1 + x 1 con a1 = [1/x0 ] e 0 ≤ x1 < 1
x0
e
1
= a2 + x2 con a2 = [1/x1 ] e 0 ≤ x2 < 1
x1
e così via, fintanto che xn 6= 0. Si arriva a xn = 0 per qualche n precisamente quando x è razionale.
In questo caso x = [a0 ; a1 , . . . , an ] e lo sviluppo è unico se adottiamo la convenzione che an > 1.
Se il numero è irrazionale lo sviluppo è invece infinito. Per π = 3, 141592653589793238 . . . si
trova
π = 3 + x0 , x0 = 0, 14159 . . .
48
1
= 7, 06251 · · · = 7 + x1
x0
1
= 15, 99659 · · · = 15 + x2
x1
1
= 1, 00341 · · · = 1 + x3
x2
1
= 292, 63459 · · · = 292 + x4
x3
e così di seguito. Iterando questa procedura otteniamo lo sviluppo
π = [3; 7, 15, 1, 292, 1, 1, 1, 2, 1, 3, 1, 14, 2, 1, 1, 2, 2, 2, 2, 1, 84, 2, 1, 1, 15, 3, . . . ]
Per ottenere buone approssimazione razionali possiamo troncare lo sviluppo subito prima di grandi
quozienti parziali an . Ad esempio arrestandosi prima del 15 si ottiene π ≈ 3 + 1/7 = 22/7 '
3, 142, che è l’approssimazione (per eccesso) calcolata da Archimede utilizzando il suo metodo di
approssimazione poligonale del cerchio. Arrestandosi prima del 292 si ottiene invece l’approssimazione
(sempre per eccesso)
1 355
π ≈3+ = = 3, 1415929 . . .
1 113
7+
1
15 +
1
utilizzata dal matematico cinese Tsu Ch’ung-chih (430-501).
Le approssimazioni razionali ottenute troncando lo sviluppo in frazione continua si chiamano con-
vergenti veloci. Quelli di π sono
3 22 333 355 103993 104348 208341
, , , , , , , ···
1 7 106 113 33102 33215 66317
I convergenti si possono calcolare dai quozienti parziali mediante una formula ricorsiva.
Teorema 9.1. Dato x = [a0 ; a1 , a2 , a3 , . . . ] poniamo
p−2 = 0, p−1 = 1, pn = an pn−1 + pn−2
q−2 = 1, q−1 = 0, qn = an qn−1 + qn−2
allora
pn
= [a0 ; a1 , . . . , an ] , n≥0
qn
Dimostrazione. Procediamo per induzione. Per n = 0 e n = 1 si ha
p0 p1 a1 a0 + 1 1
= a0 , = = a0 +
q0 q1 a1 a1
Supponiamo ora che la formula sia vera per n − 1 e osservando che

1
[a0 ; a1 , . . . , an ] = a0 ; a1 , . . . , an−1 +
an
si ha

an−1 + a1n pn−2 + pn−3 an (an−1 pn−2 + pn−3 ) + pn−2 an pn−1 + pn−2 pn
= = =
a + 1 q +q an (an−1 qn−2 + qn−3 ) + qn−2 an qn−1 + qn−2 qn
n−1 an n−2 n−3
49
e l’induzione è completa.
Alcune conseguenze:
• I denominatori qn crescono almeno esponenzialmente:
qn ≥ qn−1 + qn−2 ≥ 2 qn−2 ≥ 22 qn−4 ≥ · · · ≥ 2(n−1)/2
• Essendo qn pn−1 − qn−1 pn = −(qn−1 pn−2 − qn−2 pn−1 ) per ogni n > 0 e q0 p−1 − q−1 p0 = 1
vale la formula di Lagrange:
qn pn−1 − qn−1 pn = (−1)n , n≥0
• Il numero x si può esprimere nella forma

1 rpn + pn−1
(16) x = a0 ; a1 , a2 , . . . , an + = , n≥1
r rqn + qn−1
dove il numero r soddisfa
an+1 ≤ r < an+1 + 1
D’altra parte, dalla formula di Lagrange si ha
rpn + pn−1 pn qn (rpn + pn−1 ) − (rqn + qn−1 )pn (−1)n
(17) − = =
rqn + qn−1 qn qn (rqn + qn−1 ) qn (rqn + qn−1 )
Usando il fatto che
qn+1 = an+1 qn + qn−1 ≤ rqn + qn−1 < (an+1 + 1)qn + qn−1 < qn+1 + qn
otteniamo l’importante stima:

1 n pn 1
(18) < (−1) x − < , n≥1
qn (qn + qn+1 ) qn qn qn+1
Osserviamo che se si sceglie un denominatore q ‘a caso’ allora il meglio che possiamo
fare (variando p) è |x − p/q| ≤ 1/2q. Dunque i convergenti veloci danno approssimazioni
molto migliori di quelle con denominatori casuali.
Tornando al temperamento equabile, lo sviluppo in frazione continua dell

log2 (3/2) = [0; 1, 1, 2, 2, 3, 1, 5, 2, 23, 2, 2, 1, . . . ]
e i suoi convergenti sono
1 1 3 7 24 31 179 389 9126
, , , , , , , , , ···
1 2 5 12 41 53 306 665 15601
Ciascuna di queste approssimazioni divide l’ottava in intervalli uguali, in numero pari al suo de-
nominatore, in modo che una quinta corrisponda ad un numero di intervalli pari al suo numeratore.
L’approssimazione 7/12 divide l’ottava in 12 semitoni e 7 di essi corrispondono a una quinta.
L’approssimazione 3/5 è usata nella musica orientale (scale pentatoniche).
Altre approssimazioni interessanti sono 31/53 e 389/665 (subito prima di grandi denomina-
tori).
50
9.2. La scala equabile con 53 note. Nel 1876, Robert Bosanquet costruì un armonium con 53
note per ottava.
In questa scala ciascun microintervallo vale 1200/53 ' 22, 642 centesimi, di poco inferiore al
comma pitagorico (23, 460 centesimi). L’intervallo di quinta in questa scale corrisponde a 31 di
tali microintervalli e corrisponde a
31
× 1200 = 701, 887 centesimi
53
un’approssimazione della quinta giusta, che vale 701, 955 centesimi, migliore di quella di 700
centesimi della scala equabile con 12 note. Già il teorico musical cinese Ching Fang (78-37
a. C.) osservò che 53 quinte giuste (3/2)53 approssimano 31 ottave 231 e determinò l’errore
177147/176776. Nel XVII secolo il matematico e teorico musicale Nicholas Mercator calcolò esat-
tamente l’errore, pari a 19383245667680019896796723/19342813113834066795298816 ' 3, 615
centesimi. In seguito, nel 1694, l’ecclesiastico e teorico musicale inglese William Holder, pub-
blicò un trattato in cui illustrò come il temperamento equabile con 53 toni approssima molto bene
anche la terza maggiore, e ciò (come vedremo tra poco) è sufficiente per approssimare bene tutto
il temperamento naturale di ordine 5.
9.3. Approssimazioni multiple. Tutto questo solo per la quinta... che ne è delle altre consonanze?
Come abbiamo visto, gli intervalli considerati più consonanti sono:
2 : 1 (ottava), 3 : 2 (quinta giusta), 4 : 3 (quarta giusta), 5 : 4 (terza maggiore), 6 : 5 (terza
minore), 8 : 5 (sesta minore), 5 : 3 (sesta maggiore)
Tali rapporti formano la sequenza
1 6 5 4 3 8 5 2
< < < < < < <
1 5 4 3 2 5 3 1
51
e soddisfano
5 6 5 8 3 4 5 6 3
× = × = × =2 , × =
3 5 4 5 2 3 4 5 2
dunque i logaritmi (binari) di questi intervalli sono combinazioni lineari di 1, log2 (3/2) e log2 (5/4)
con coefficienti {0, 1, −1}, e l’errore nell’approssimazione con la scala uniforme non supera il
massimo tra gli errori per log2 (3/2) e log2 (5/4).
D’altra parte si ha
log2 (5/4) = 0, 3219280... = [0; 3, 9, 2, 2, 4, 6, 2, 1, 1, 3, 1, 18, . . . ]
e i suoi convergenti sono
1 9 19 47 207 1289 2785
, , , , , , , ···
3 28 59 146 643 4004 8651
Pertanto si possono approssimare simultaneamente log2 (3/2) e log2 (5/4) con lo stesso denomina-
tore:
7 4
log2 (3/2) ' e log2 (5/4) '
12 12
con un errore più piccolo di max{(3 · 28)−1 , (12 · 41)−1 } = (3 · 28)−1 = 1/84.
Ciò garantisce che il temperamento equabile di dodici semitoni uguali dà una buona approssi-
mazione razionale simultanea dei due intervalli fondamentali 3 : 2 e 5 : 4 e dunque dell’intera
serie dei sette intervalli consonanti. Il sistema equabile evidentemente ‘tempera’ tutti i possibili
microintervalli (comma) rendendo la spirale delle quinte un circolo delle quinte, esattamente dopo
dodici passi.
52
9.4. La scala con 31 toni. Un altro temperamento equabile di grande interesse è quello del ciclo
armonico descritto per la prima volta dal compositore Nicola Vicentino (1511-1572) ed in seguito
ripreso da Christiaan Huygens (1629-1695), che consiste nella divisione dell’ottava in 31 parti
uguali. Il clavicembalo di Vito Trasuntino del 1606, visibile al Museo internazionale e biblioteca
della musica di Bologna, ha 31 tasti per ottava ripartiti in questo modo: ogni ottava ha i sette tasti
bianchi usuali intervallati da cinque gruppi di quattro tasti neri, ciascun gruppo situato nel posto
usuale dei tasti neri della tastiera, più due tasti neri tra le due coppie di tasti bianchi usualmente
prive di separazione (7 + 4 × 5 + 2 × 2 = 31).
Ciascun tono (microintervallo) di questa scala corrisponde a circa 38, 7 centesimi. L’intervallo di
quinta, corrispondente al tono 18 vale circa 696, 774 centesimi. Questo intervallo pur discostandosi
un po’ da quello di quinta giusta, fornisce un’eccellente approssimazione della quinta mesotonica
(51/4 : 1) che vale circa 696, 579 centesimi. Anche gli intervalli di terza maggiore e di sesta minore
sono bene approssimati. Ad esempio la terza maggiore della scala naturale vale 386, 314 centesimi
mentre la terza corrispondente al tono 10 del ciclo armonico vale
10
× 1200 = 387, 097 centesimi
31
Per spiegare queste consonanze ricorriamo ancora una volta alle frazioni continue. Osserviamo
innanzitutto che l’ampiezza logaritmica dell’intervallo mesotonico di quinta 51/4 : 1 è
1
log2 (5) = 0, 580482024... = [0; 1, 1, 2, 1, 1, 1, 1, 5, 1, 3, 3, 1, 2, 1, 7, 78, 2, 13, 5, . . . ]
4
con convergenti veloci
1 1 3 7 11 18 101 119
, , , , , , , , ...
1 2 5 12 19 31 174 205
da cui risulta evidente che, oltre alla scala equabile con 12 note, anche quella con 31 note fornisce
una naturale, e ovviamente migliore, approssimazione della quinta mesotonica (osserviamo che il
denominatore 31 si trova subito prima del denominatore, molto più grande, 174). Se ora vediamo
cosa accade per il logaritmo della terza maggiore naturale 5 : 4, i cui convergenti veloci, come
53
abbiamo già visto, sono
1 9 19 47 207 1289 2785

, , , , , , , ···
3 28 59 146 643 4004 8651
non troviamo il denominatore 31. Ma questo non significa che nella scala di 31 toni non vi sono
note che approssimano la terza maggiore naturale. Al contrario, si può vedere che la terza maggiore
naturale è ben approssimata dalla decima nota della scala di 31 toni.
Per chiarire questo fatto occorre introdurre una nuova classe di convergenti.
9.5. I convergenti lenti. Se x ∈ R ha lo sviluppo x = [a0 ; a1 , a2 , . . . ], allora per ogni n ≥ 1 vi

sono an convergenti lenti della forma (cf. (16))
[a0 ; a1 , . . . , an−1 , 1], [a0 ; a1 , . . . , an−1 , 2], ··· , [a0 ; a1 , . . . , an−1 , an ]
In altri termini, per ogni n ≥ 1 e 1 ≤ r ≤ an il convergente lento di ordine
n−1
X
(19) m= ak + r
k=0
è il numero
rm rpn−1 + pn−2
(20) =
sm rqn−1 + qn−2
In particolare
n
X rm pn
se r = an e dunque m= ak allora = ·
k=0
sm qn
Dalla (17) si vede che rm /sm fornisce la migliore approssimazione razionale unilatera di x il cui
denominatore non superi sm , nel senso che se r < an ci può essere un convergente con denomina-
tore più piccolo e più vicino ad x, ma dall’altra parte di x.
E SEMPIO . Sia x = [0; 2, 3, 2, 4, 2, 5, 2, 6, . . . ] = 0, 436702.... I primi cinque convergenti veloci
sono
1 3 7 31 69
, , , ,
2 7 16 71 158
ma entro lo stesso grado di accuratezza vi sono 2 + 3 + 2 + 4 + 2 = 13 convergenti lenti:
1 1 1 2 3 4 7 10 17 24 31 38 69
, , , , , , , , , , , ,
1 2 3 5 7 9 16 23 39 55 71 87 158
54
E SEMPIO . Tornando alla scala di 31 toni, i primi cinque convergenti veloci di log2 (5/4) =
0, 321928 · · · = [0; 3, 9, 2, 2, 4, 6, 2, . . . ] = 0, 321928 . . . sono
1 9 19 47 207
, , , ,
3 28 59 146 643
ma entro lo stesso grado di accuratezza vi sono 3 + 9 + 2 + 2 + 4 = 20 convergenti lenti
1 1 1 1 2 3 4 5 6 7 8 9
, , , , , , , , , , , ,
1 2 3 4 7 10 13 16 19 22 25 28
10 19 28 47 66 113 160 207
, , , , , , ,
31 59 87 146 205 351 497 643
Dal valore 10/31 del tredicesimo convergente deduciamo appunto che la terza maggiore naturale
è ben approssimata dalla decima nota della scala di 31 toni.
Un problema importante da molti punti di vista è quello Si può mostrare che i denominatori qn dei
convergenti veloci crescono esponenzialmente quasi ovunque, ovvero l’insieme di numeri apparte-
nenti a un dato intervallo per i quali ciò accade ha probabilità uno. D’altra parte, dalle (19)-(20)
segue che qn−1 < m ≤ qn e dunque la crescita dei denominatori sm dipenderà dalla crescita delle
Psn−1
somme parziali k=0 ak . Un classico risultato di Khinchin afferma che ‘tipicamente’ tali somme
crescono come n log n/ log 2, nel senso che la probabilità che si mantengano vicine a tale quantità
tende ad uno quanto n cresce (si tratta di un risultato di convergenza in misura, più debole della
convergenza quasi ovunque). Da ciò si evince che i denominatori dei convergenti lenti crescono,
nel senso debole appena detto, in modo subesponenziale. Più precisamente si ha
Teorema 9.2.
log qn π2 log sm π2
→ quasi ovunque, e ∼ in misura.
n 12 log 2 m 12 log m
55
9.6. Alberi e cammini. La sequenza dei convergenti lenti può essere riguardata come un cam-
mino su un albero binario detto albero di Stern-Brocot31. Si tratta di un modo di ordinare, e
dunque di contare l’insieme dei numeri razionali (positivi) in modo che ogni numero compaia una
e una sola volta. L’operazione di base necessaria a costruire l’albero è la somma di Farey: dati pq
p0
e q0
in Q+ poniamo
p p0 p + p0
⊕ 0 =
q q q + q0
p p0 p
È facile verificare che il figlio q
⊕ q0
è sempre ridotto ai minimi termini se lo sono i genitori q
e
p0
q0
, ed inoltre si trova sempre in mezzo a loro:
p p0 p p + p0 p0
se < 0 allora < <
q q q q + q0 q0
Inoltre, l’operazione ⊕ conserva la relazione di unimodularità qp0 − pq 0 = 1.
Partendo dagli antenati 0 e ∞ (ridotti ‘ai minimi termini’) si costruisce l’albero una generazione
dopo l’altra per mezzo della operazione ⊕:
Ogni p/q ∈ Q+ compare esattamente una volta e corrisponde ad un unico cammino finito che
parte dalla radice 1/1 ed il cui numero d di vertici è la profondità di p/q, cioè la generazione a
cui appartiene (poniamo uguale a zero la profondità degli antenati 0/1 e 1/0). Evidentemente vi
sono 2d−1 elementi di profondità d ≥ 1. Inoltre, chiameremo semplicità di p/q ∈ Q+ il numero
1/pq.
31
Perchè scoperto indipendentemente dal matematico tedesco Moritz Stern (1858) e dal costruttore di orologi
francese Achille Brocot (1860).
56
Teorema 9.3. I 2d−1 elementi dell’albero di Stern-Brocot di profondità d ≥ 1 sono tutti e soli quei
numeri razionali p/q ∈ Q+ il cui sviluppo in frazione continua p/q = [a0 ; a1 , . . . , an ] soddisfa
n
X
ai = d
i=0
Inoltre si ha che X
1/pq = 1
dove, per ogni assegnato d ≥ 1, la somma è fatta su tutte le frazioni in p/q ∈ Q+ di profondità d.
Dimostrazione. È una semplice verifica diretta che se p/q = [a0 ; a1 , . . . , an ] allora per raggiungere
p/q partendo dalla radice 1/1 occorre muoversi di a0 passi verso destra, giungendo così al nodo
a0 + 11 , poi a1 passi verso sinistra, giungendo a a0 + a1 1+ 1 , e così via, fino a l’n-esima deviazione
1
(verso destra seP n è pari, sinistra se dispari) di an − 1 passi. D’altra parte, il numero di soluzioni
dell’equazione ni=0 ai = d con 0 ≤ n ≤ d − 1, a0 ≥ 0 e ai ≥ 1, 1 ≤ i < n e an > 1 è uguale al
numero
d−1
di soluzioni con ai ≥ 1, 0 ≤ i ≤ n. Ora, per ogni n ≥ 0 fissato, il numero di tali soluzioni
è n . Infatti, ogni scelta di a0 ≥ 1, . . . , an ≥ 1 con a0 + · · · + an = d è in corrispondenza
biunivoca con la sequenza di n numeri
1 1 1 1
a0 + , a0 + a1 + , · · · , a0 + · · · + an−1 + = d − an −
2 2 2 2
l’ultimo essendo uguale a a0 + · · · + an−1 − 12 . Tale sequenza può sua volta può essere riguardata
come un’estrazione di n elementi dalla sequenza di d − 1 numeri
1 3 1 1
, ,··· , + d − 1 = d −
2 2 2 2
E vi sono appunto d−1

n
possibili estrazioni di n elementi da un insieme di d − 1 elementi. Dunque
d−1 d−1
il numero cercato è n=0 n = 2d−1 . Ciò conclude la prova della prima tesi.
P
Riguardo alla seconda, iniziamo con la seguente definizione: dato p/q chiamiamo le frazioni
p/(p + q) e (p + q)/q i suoi discendenti. Ora, se p/q = [a0 ; a1 , . . . , an ] allora p/(p + q) =
[0; 1, a0 , a1 , . . . , an ] e (p + q)/q = [a0 + 1; , a1 , . . . , an ] e dunque se p/q ha profondità d, i suoi
discendenti hanno profondità d + 1. Dunque, per quanto visto, i discendenti degli elementi di
una generazione formano esattamente la generazione successiva. A questo punto si procede per
induzione in d. La proprietà cercata è vera per d = 1. D’altra parte la semplicità di p/q è uguale
alla somma di quelle dei suoi discendenti p/(p + q) e (p + q)/q.
Nota 9.1. Viceversa, se vogliamo risalire da una frazione p/q alla sua antecedente p0 /q 0 (ovvero la
frazione dalla quale discende) allora se p > q si avrà q 0 = q e p0 = p − q; se invece q > p allora
p0 = p e q 0 = q − p.
E SEMPIO : 58 = 1 + 1
1
1.
fa parte delle 16 frazioni con profondità 5 ed ha semplicità 40
1+
1
1+
2
Da quanto visto segue che un numero irrazionale positivo x ∈ R+ \ Q non può occupare un
posto sull’albero ma si può tuttavia associare ad esso un unico cammino discendente {xm }m≥1 di
57
elementi dell’albero che inizia in x1 = 1 e converge a x. Se x = [a0 ; a1 , a2 , . . . ] allora
n−1
1 X
xm = a0 ; a1 , . . . , an−1 + , m= ai + r , 1 ≤ r ≤ an
r i=0
Osserviamo che per m ≤ a0 + 1 si ha xm = m. In altre parole, dato un numero positivo ed
irrazionale x il cammino sull’albero che converge a x coincide con la successione dei convergenti
lenti descritta sopra.
Vediamo ora un modo semplice per ‘muoversi’ lungo i rami dell’albero. Notiamo innanzitutto che
ogni x ∈ Q+ può essere decomposto in modo unico come
m n
x= ⊕ con ns − mt = 1
s t
A questo punto costruiamo una rappresentazione dei razionali positivi come matrici ad elementi
interi positivi 2 × 2 e determinante unitario, ovvero gli elementi del gruppo SL(2, N), attraverso
l’identificazione
n m n+m
X= ⇐⇒ x =
t s t+s
Vediamo che le colonne della matrice X ∈ SL(2, N) che rappresenta x sono i genitori di x
sull’albero di Stern-Brocot in ordine invertito (sulla colonna sinistra c’è quello più grande e su
quella destra
il piùpiccolo). In particolare, la radice dell’albero è identificata con la matrice iden-
1 0
tità: I = , mentre le matrici
0 1

1 0 1 1
L= , R=
1 1 0 1
rappresentano le frazioni 1/2 e 2/1, rispettivamente. Ora, l’elemento x considerato sopra ha a sua
volta un’unica coppia di figli (sinistro e destro), dati rispettivamente da
m m+n m+n n
⊕ e ⊕
s s+t s+t t
Ma
n m 1 0 m+n m m m+n
= ⇐⇒ ⊕
t s 1 1 s+t s s s+t
e
n m 1 1 n m+n m+n n
= ⇐⇒ ⊕
t s 0 1 t s+t s+t t
Quindi le matrici L e R, fatte agire da destra, muovono verso i figli sinistro e destro, rispettiva-
mente.
Se invece, applichiamo L e R da sinistra si ottiene

1 0 n m n m n+m
= ⇐⇒
1 1 t s n+t m+s n+m+t+s
e
1 1 n m n+t m+s n+m+t+s
= ⇐⇒
0 1 t s t s s+t
Quindi in questo modo le matrici L e R muovono verso i discendenti sinistro e destro, rispettiva-
mente.
58
Per quanto visto, ogni numero razionale positivo x si può rappresentare come una matrice di X ∈
SL(2, N) la quale, a sua volta, si può scrivere come un prodotto di matrici L e R il cui numero dei
suoi fattori è pari alla profondità di x meno uno.
8/5, questa ha come genitori le frazioni 3/2 e 5/3 ed è

Riprendendo l’esempio della frazione
5 3
dunque rappresentata dalla matrice la quale, a sua volta, si scrive come RLRL.
3 2
Com’era da aspettarsi il prodotto riflette la frazione continua. Più precisamente, per ogni x ∈ Q+
si ha  a a a
 R 0 L 1 R 2 · · · Ran −1 , n pari
x = [a0 ; a1 , . . . , an ] ⇐⇒ X =
R L R · · · Lan −1 , n dispari
 a0 a1 a2
Questa rappresentazione consente poi di associare in modo naturale (codificando {L, R} con
{0, 1}) ad ogni x ∈ Q+ una sequenza binaria σ(x) ∈ {0, 1}∗ . Se invece x ∈ R+ \ Q allora al
cammino {xm }m≥1 che converge ad x ∈ R+ corrisponderà la sequenza binaria σ ∈ {0, 1}N data
da
x = [a0 ; a1 , a2 , . . . ] ⇐⇒ σ(x) = 1a0 0a1 1a2 . . .
x1
0 1
x2
0 1 0 1
x3
0 1 0 1 0 1 0 1
x4
Abbiamo detto che l’albero di Stern-Brocot determina un ordinamento dell’insieme dei numeri
razionali (positivi), ma quale? L’ordinamento più naturale è quello ottenuto ‘leggendo’ l’albero
come un testo, cioè riga per riga da sinistra a destra, partendo dalla radice. Se indichiamo con ek il
k-esimo numero razionale in questo ordinamento allora avremo
1 1 2 1 2 3 3 1
e1 = , e2 = , e3 = , e4 = , e5 = , e6 = , e7 = , e8 = , · · ·
1 2 1 3 3 2 1 4
59
e1
0 1
e2 e3
0 1 0 1
e4 e5 e6 e7
0 1 0 1 0 1 0 1
e8 e9 e 10 e 11 e 12 e 13 e 14 e 15
Dato un numero razionale x di profondità d, possiamo mettere in corrispondenza la sua rapp-

resentazione come elemento della successione ek e il suo codice binario σ(x). Innanzitutto os-
serviamo che la sequenza simbolica σ(x) di x ∈ Q+ può essere ottenuta rapidamente basandosi
sull’osservazione fatta in precedenza su come costruire la sequenza degli antecedenti di x. Illus-
triamolo con un esempio. Consideriamo la frazione 75/64. Il suo sviluppo in frazione continua
è [1; 5, 1, 4, 2] e dunque ha profondità 1 + 5 + 1 + 4 + 2 = 13. Costruiamo la sequenza dei suoi
antecedenti sostituendo ogni volta al più grande tra numeratore e denominatore la differenza con
l’altro termine. Otteniamo così le dieci frazioni
75 11 11 11 11 11 11 2 2 2 2 2 1
, , , , , , , , , , , ,
64 64 53 42 31 20 9 9 7 5 3 1 1
Costruiamo ora una sequenza binaria associando 1 ad ogni frazione > 1 e 0 ad ogni frazione ≤ 1.
La sequenza trovata è 1000001000011. Confrontando con lo sviluppo in frazione continua si vede
che coincide con σ(x)1, cioè è proprio la sequenza simbolica di x con l’aggiunta di un 1 finale. Non
si tratta di una coincidenza ma di un fatto facilmente dimostrabile utilizzando la rappresentazione
matriciale vista sopra.
Chiamiamo rango di x il numero intero k la cui rappresentazione binaria (con potenze decrescenti
di 2) è 1σ(x) (ottenuta cioè piazzando in testa l’uno finale della sequenza costruita con gli an-
tecedenti). Ebbene, si ha x = ek . Nel caso considerato si trova 1σ(x) = 1100000100001 e dunque
k = 212 + 211 + 25 + 20 = 6177, ovvero 75/64 è il seimilacentosettantasettesimo numero razionale
nell’ordinamento di Stern-Brocot32.
32
La validità di questa ‘regola’ segue facilmente per induzione osservando che se la rappresentazione binaria di k
è s ∈ {0, 1}∗ (dove {0, 1}∗ è il monoide libero formato dall’insieme di tutte le parole di lunghezza finita scritte in
60
9.7. I cerchi di Ford. Un modo curioso di vedere le cose ce lo forniscono i cerchi di Ford. Si
tratta di una famiglia numerabile di circonferenze, ciascuna delle quali, indicata con C pq , è tangente
a R in pq ed ha diametro q12 . I cerchi più grandi che si possono così ottenere hanno diametro unitario
e corrispondono a Cn , n ∈ Z. E la cosa più interessante è che essi formano un ‘impacchettamento’
della striscia unitaria {(x, y) ∈ R2 : 0 ≤ y ≤ 1}.
Vale infatti il seguente risultato.

p p0
Teorema 9.4. Due cerchi di Ford C pq e C p0 , con q
< q0
, o non si intersecano, oppure sono tra di
q0
p p00 p0
loro tangenti se p0 q − pq 0 = 1. Tre cerchi C pq , C p0 e C p00 con q
< q 00
< q0
sono tangenti tra di loro
q0 q 00
p00 p p0
se e solo se q 00
= q
⊕ q0
.
Dimostrazione. Il quadrato della distanza D tra i centri di C pq e C p0 è

q0
2 2
p p0

2 1 1
D = − + − 02
q q0 2q 2 2q
mentre il quadrato della somma dei loro raggi r e r0 è
2
0 2 1 1
(r + r ) = +
2q 2 2q 02
Da ciò si ricava
(pq 0 − qp0 )2 − 1
D2 − (r + r0 )2 = ≥0
q 2 q 02
con uguaglianza se e solo se pq 0 − qp0 = 1. In modo simile si provano le altre affermazioni.
Concentriamoci ora sui cerchi limitati tra le ascisse 1 e 2 (corrispondenti all’intervallo di ottava) e
numeriamoli come in figura (dove Ca e Cb, che rappresentano rispettivamente l’unisono e l’ottava,
servono da riferimento).
alfabeto binario munito dell’operazione di giustapposizione di parole) allora la rappresentazione binaria di k + 1 si

ottiene sommando 1 (modulo 2) ad s. Esempio: 1001 + 1 = 1010, oppure 1111 + 1 = 10000.
61
Se ad ogni cerchio C pq con 1 ≤ p/q < 2 associamo il corrispondente intervallo p/q di ampiezza
log(p/q) = log p − log q e consonanza log(pq) = log p + log q allora si ha
log(diametro) = ampiezza − consonanza
In altre parole, la dimensione dei cerchi di Ford rispecchia l’importanza decrescente dei toni disso-
nanti. Infine, la numerazione dei cerchi riportata in figura riflette evidentemente l’ordinamento dei
razionali di Stern-Brocot, con la differenza che il ‘primo’ termine è ora 3/2, il cui rango sull’albero
di Stern-Brocot è 6 che in binario è 110. Dunque, per ottenere il cerchio di Ford corrispondente ad
un dato intervallo p/q si potrà procedere come sopra sostituendo al blocco iniziale 110 di 1σ(x)
il solo simbolo 1. Ad esempio, il cerchio di Ford che corrisponde all’intervallo 75/64 per il
quale 1σ(x) = 1100000100001 è l’intero l la cui rappresentazione binaria è 10000100001 cioè
l = 210 + 25 + 20 = 1057. Dunque C1057 è tangente ad R in 75/64 ed ha diametro 1/4096.
9.8. Scale ben formate. Nel 1989 Norman Carey e David Clampitt hanno sviluppato una teoria
della ‘buona formazione’ delle scale musicali. Si possono dare diverse caratterizzazioni strut-
turali di questa proprietà. Innanzitutto in termini di simmetria. Consideriamo ad esempio le scale
diatoniche, cioè quelle formate da sette delle dodici note che compongono la scala cromatica,
ordinate secondo una particolare successione d’intervalli di due sole specie, toni e semitoni, ad
es. nella scala maggiore nell’ordine T − T − S − T − T − T − S. Sappiamo che tale scala si
può ottenere da una progressione di quinte partendo da una nota prefissata, ad esempio da F a.
Tale sequenza è dunque F a − Do − Sol − Re − La − M i − Si e ad essa corrisponde la scala
F a − Sol − La − Si − Do − Re − M i. L’intervallo di quinta funziona qui da generatore, nel
senso che le note vengono inizialmente ottenute come multipli di esso (per poi essere riordinate in
una scala).
62
La ragione per cui la scala diatonica comunemente usata è formata da sette note e non, diciamo,
da sei o otto, si può comprendere in termini del grado di simmetria rotazionale ottenuta quando i
toni vengano arrangiati in circolo. Sia la sequenza delle quinte che quella delle note lungo la scala
hanno lo stesso grado di simmetria rotazionale. Detto altrimenti, il numero di toni compresi tra
due multipli successivi del generatore (ivi incluso uno dei due) è costante (qui uguale a 4).
Se si prova a costruire una scala di sei note con lo stesso sistema si perviene alla situazione illustrata
nella figura seguente, dove si è persa la simmetria precedente (il numero di toni compresi tra due
successivi multipli del generatore può essere uguale a 1, 3 o 4).
63
Dall’ultima figura si vede che le sole scale di N note ottenute usando la quinta come genera-
tore che sono ben formate sono quelle con N = 1, 2, 3, 5, 7, 12, non lo sono quelle con N =
4, 6, 8, 9, 10, 11.
Ovviamente si possono costruire scale ben formate anche in altra maniera, ad esempio la scala a
toni interi di Debussy, come F a − Sol − La − Si − Do] − Re]. Scale di questo genere si dicono
64
regolari. Oppure le scale di otto toni con intervalli tra due note successive alternatamente di un
semitono e un tono, come ad esempio Do − Re − M i[ − F a − F a] − Sol] − La − Si − Do.
Questi diagrammi circolari suggeriscono l’uso dell’aritmetica modulare, che fa uso degli insiemi
ZN = {0, 1, . . . , N − 1}, ovvero le classi di equivalenza degli interi modulo N .
Se ad esempio consideriamo la progressione F a − Do − Sol − Re − La − M i − Si sul cerchio
e la mettiamo in corrispondenza biunivoca con l’insieme {0, 1, . . . , 6}, allora usando l’aritmetica
ordinaria la differenza tra gli elementi successivi vale 1 oppure -6 (da Si a F a), ma essendo −6 =
1 mod 7 la differenza è sempre uguale a 1 con l’aritmetica modulo 7. È facile rendersi conto poi
che l’ordinamento delle note nella scala diatonica F a − Sol − La − Si − Do − Re − M i può essere
ottenuto per mezzo della moltiplicazione per 2 modulo 7, che agisce come segue:
0 → 0, 1 → 2, 2 → 4, 3 → 6, 4 → 1, 5 → 3, 6→5
In altri termini l’automorfismo (permutazione) π : Z7 → Z7 che riordina le note per dare la scala
è π : k → 2 · k (mod 7). Il numero 2 è qui il numero costante di note che compaiono sul cerchio
delle quinte tra due note consecutive della scala (inclusa una delle due). Osserviamo che l’inverso
π −1 : Z7 → Z7 agisce moltiplicando per (2)−1 (mod 7) = 4, ovvero
0 → 0, 1 → 4, 2 → 1, 3 → 5, 4 → 2, 5 → 6, 6→3
Il numero 4 è qui il numero costante di note che compaiono lungo la scala tra due successivi
multipli del generatore (incluso uno dei due). Possiamo dunque dare la seguente
Definizione. Se ZN = {0, 1, . . . , N − 1} rappresenta una classe di equivalenza P di N toni
generati da quinte consecutive, allora gli elementi di tale classe corrispondono ai toni di una scala
ben formata se esiste un automorfismo33 π : ZN → ZN che permuta ZN in modo da arrangiare i
toni in ordine di scala34.
Procedendo come sopra si vede che al variare di N si ottengono scale ben formate solo quando
N = 1, 2, 3, 5, 7, 17, 29, 41, 53, .... Perchè questi numeri interi e non altri? Per comprendere questo
fatto osserviamo che generatore in questo caso è l’intervallo di quinta 3/2. Ora, i primi dieci
convergenti lenti di log2 (3/2) sono
1 1 2 3 4 7 10 17 24 31
, , , , , , , , , ...
1 2 3 5 7 12 17 29 41 53
Notiamo che i numeri interi che danno luogo a scale ben formate sono proprio i denominatori dei
convergenti lenti del generatore. Che sia proprio questa la regola generale, si può comprendere
sulla base di quanto visto in precedenza sulle rotazioni irrazionali (vedi più avanti).
Si può anche generalizzare questo esempio variando il generatore. Possiamo cioè scegliere un
qualunque numero g che soddisfi 21/2 ≤ g ≤ 2 e costruire il sistema pitagorico generalizzato
P (g) = {2p g q : p, q ∈ Z}
Il seguente risultato si deduce facilmente dagli argomenti illustrati fin qui.
Lemma 9.1. In un sistema pitagorico generalizzato P (g), una scala di N toni è una scala ben
formata se e solo se p/N è un convergente lento di log2 g. Inoltre, l’automorfismo π : ZN → ZN
che permuta ZN in modo da arrangiare i toni in ordine di scala è π : k → q · k (mod N ) dove
q = (p)−1 (mod N ).
33
Un automorfismo è un isomorfismo di un oggetto matematico con se stesso.
34
La sequenza (x0 , x1 , . . . , xN −1 ) si dice in ordine di scala se x0 < x1 < · · · < xN −1
65
Il moltiplicatore q = (p)−1 (mod N ) misura il numero di note che compaiono sul cerchio delle
quinte tra due note consecutive della scala, ed è dunque ‘duale’ a p, che misura il numero di note
che compaiono sulla scala tra due quinte successive.
Possiamo a questo punto mettere in corrispondenza le scale ben formate con particolari cammini
sull’albero di Stern-Brocot (o, in modo equivalente, con sequenze di cerchi di Ford). Se alla scala
ben formata di N toni associamo la frazione p/N dove p è la posizione della quinta lungo la scala,
allora ad ogni fissato generatore g corrisponde un unico cammino sull’albero di Stern-Brocot che
converge a log2 g e gli elementi di tale cammino, cioè i convergenti lenti di tale numero, rappresen-
tano ciascuno una scala ben formata. Ad esempio il cammino che corrisponde a log2 (3/2) inizia
con 01001100010000011 . . . come si evince dallo sviluppo log2 (3/2) = [0; 1, 1, 2, 2, 3, 1, 5, 2, . . . ].
Dunque le frazioni che lo compongono si possono rappresentare nella forma

1 1 0 2 1 1 3 2 1
⇐⇒ L = , ⇐⇒ LR = , ⇐⇒ LRL = ,
2 1 1 3 1 2 5 3 2

4 3 1 7 3 4
⇐⇒ LRLL = , ⇐⇒ LRLLR =
7 5 2 12 5 7
e così via. Si può notare che per tutti questi esempi vale la seguente regola (Vicinanza, 2005):

p a11 a12
se ⇐⇒ allora p · a22 = 1 (mod N )
N a21 a22
dunque a22 sarebbe il moltiplicatore q della teoria di Carey e Clampitt. Che sia in generale proprio
così lo si vede facilmente usando la proprietà di unimodularità a11 a22 − a21 a12 = 1:
p · a22 = (a11 + a12 )a22 = 1 + a12 (a21 + a22 ) = 1 + a12 · N
Infine, vale la pena di osservare che tutte le scale ben formate così costruite hanno la cosiddetta
proprietà di Myhill che consiste nel fatto che gli intervalli tra due note successive, o comunque tra
due note separate da un numero fissato di note, assumono solo due valori. La differenza tra questi
due valori viene detta comma generalizzato. Ad esempio per N = 2 si trovano i due intervalli di
quinta (3/2) e di quarta (4/3) e la loro differenza è il tono maggiore (9/8). Per N = 7 si trova il
tono maggiore (9/8) e il semitono diatonico (256/243) e la loro differenza è il semitono cromatico
(2187/2048). Ma un modo più suggestivo per illustrare questi risultati si ottiene passando alla scala
logaritmica (in cui i rapporti tra intervalli diventano differenze). Per l’esempio appena visto si ha
il seguente schema, dove abbiamo posto α = log2 (3/2).
N primo intervallo secondo intervallo comma generalizzato convergente

2 α (quinta) 1-α (quarta) 2α-1 (tono maggiore) 1/2
3 1-α (quarta) 2α-1 (tono maggiore) 2-3α (terza minore) 2/3
5 2-3α (terza minore) 2α-1 (tono maggiore) 3-5α (semit. diatonico) 3/5
7 2α-1 (tono maggiore) 3-5α (semit. diatonico) 7α-4 (semit. cromatico) 4/7
12 7α-4 (semit. cromatico) 3-5α (semit. diatonico) 12α-7 (comma pitagorico) 7/12
Si può mostrare facilmente che la proprietà di Myhill è una diretta conseguenza del Teorema delle
tre distanze per le rotazioni irrazionali visto in precedenza. Osserviamo che le distanze qui si
riducono a due essendo il numero di termini considerati uguale al denominatore di un convergente,
66
e passando al denominatore successivo il nuovo intervallo è proprio il comma generalizzato della
situazione precedente.
Nota 9.2. Una famiglia di scale duale a questa è la famiglia di scale in temperamento equabile ot-
tenuta usando i convergenti lenti direttamente come generatori. Ricordiamo che scegliere un deter-
minato convergente p/N come approssimazione razionale di un generatore irrazionale g equivale
a suddividere l’immagine logaritmica di un’ottava in N parti uguali, mentre l’intervallo corrispon-
dente a g stesso corrisponde ad un numero p di tali parti.
Nota 9.3. La teoria di Carey e Clampitt fornisce un nuovo ed interessante approccio allo studio
dei sistemi tonali, nel senso che le scale ben formate possono servire come scale di riferimento per
la musica tonale. Tuttavia tale teoria riesce a descrivere soltanto scale generate da g e 2, cioè scale
costruite con un temperamento pitagorico generalizzato. Non riesce, allo stato attuale, a descrivere
scale ben formate in un temperamento naturale di ordine 5 o superiore. Ricordiamo infatti che una
scala naturale di ordine 5 richiede due generatori (ad es. 3/2 e 5/4 oppure 5/4 e 6/5, cf. (13)-(15)).
67
10. B IBLIOGRAFIA
David J. Benson, Music. A Mathematical Offering, Cambridge University Press 2007
C. Bonanno, S. Isola, Orderings of the rationals and dynamical systems, Colloquium Mathe-
maticum 116 (2009), 165-189
N. Carey, Distribution modulo 1 and musical scales, PhD-Thesis, 1998.
N. Carey, D. Clampitt, Aspects of well-formed scales, Music Theory Spectrum 11 (1989), 187-
206. In Musical Analysis at the AMS Sectional Meeting in Baton Rouge, 2003.
R. Descartes, Compendium Musicae, 1618 (Stilo Editrice, Bari, 2008).
E. G. Donne, M. McConnell, Pianos and Continued Fractions, Mathematics Magazine, vol. 72,
no. 2 (1999), 104-115.
Euclide, Sectio Canonis, (in Euclide, Tutte le opere, a cura di F. Acerbi, Bompiani 2007)
L. Euler, Lettere a una principessa tedesca (1768), (Bollati Boringhieri, Torino, 2007, 2 vol.)
L. Euler, Tentamen novae theoriae musicae (1739). In E. Bernoulli et al. (Ed.), Opera Omnia,
Volume 1 di III, Stuttgart. Teubner (1926).
J. Fauvel, R. Flood, R. Wilson Eds., Music and Mathematics. From Pythagoras to Fractals,
Oxford University Press 2003
G. Galilei, Discorsi intorno a due nuove scienze (1638), (ristampato da UTET, Torino, 2005)
V. Galilei, Dialogo della musica antica e della moderna, Firenze, 1581.
P. Gozza, La musica come scienza matematica e la sua influenza teorica sull’immaginario artistico,
in Storia della Scienza, Vol. IV, Medievo, Rinascimento, cap. XX: La scienza e le arti, Roma,
Istituto della Enciclopedia Italiana, 2001, pp. 992-1003
P. Gozza (a cura di), La musica nella rivoluzione scientifica del Seicento, Il Mulino, Bologna,
1989.
R. L. Graham, D. E. Knuth, O. Patashnik, Concrete Mathematics, Addison-Wesley 1990
J. Kepler, Harmonices mundi, Linz 1619.
A. Koyré, La révolution astronomique, Hermann, Paris, 1961 (trad. it. La rivoluzione astronomica,
Feltrinelli, Milano, 1966).
H. Helmholtz, On the Sensations of Tone, Dover (1954).
A. Honingh, The origin and well.formedness of tonal pitch structures, ILLC Dissertation Series
DS-2006-05, Amsterdam, 2006.
A. Honingh, Group theoretic description of just intonation, Proceedings UCM 2003, Caserta.
C. Huygens, Lettre touchant le cycle harmonique, (ristampato in inglese e olandese da R. Rasch
ed., Diapason Press, 1986)
S. Isacoff, Temperamento, (trad. it. EDT, Torino 2005)
A Ya Khinchin, Continued Fractions, The University of Chicago Press, 1964
G. Loria, Le scienze esatte nell’antica Grecia, Cisalpino-Goliardica 1987
A. M. Lombardi, Keplero. Una biografia scientifica, Codice Edizioni, Torino, 2008
G. Loy, Musimathics. The mathematical foundations of music, 2 vol., The MIT Press, 2006
M. Mersenne, Harmonie universelle, Paris, 1636.
68
N. B. Slater, Gaps and steps for the sequence nθ mod 1, Proc. Camb. Phil. Soc. 63 (1967),
1115-1123
N. Vicentino, L’antica musica ridotta alla moderna pratica, Roma, 1555.
D. Vicinanza, Paths on Stern-Brocot tree and winding numbers of modes, Proceedings of the
ICMC, Barcellona, (2005).
G. Zarlino, Istituzioni harmoniche, Venezia, 1558.
69

Matematica Della Musica

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Matematica Della Musica

Caricato da

Copyright:

Formati disponibili

TEMPERAMENTI: MATEMATICA E TEORIA MUSICALE

Musica est exercitium arithmeticae occultum nescientis se numerare animi

La teoria musicale è un insieme di metodi per analizzare, organizzare e comporre il materiale

Al musico completo [...] si richiede più di una conoscenza superficiale di tutti i

Usando le relazioni trigonometriche

(2) cos(a + b) = cos a cos b − sin a sin b

(4) cos(a − b) = cos a cos b + sin a sin b

(6) cos(a + b) + cos(a − b) = 2 cos a cos b

Ciò dà conto di alcuni fenomeni percettivi fondamentali:

pianeta rapporto perielio/afelio intervallo corrispondente

3.4. Alcune teorie della consonanza.

440, 880, 1320, 1760, 2200, 2640 . . .

445, 890, 1335, 1780, 2225, 2670, . . .

825, 1650, 2475, 3300, 4125, 4950, . . .

Usando ancora il rapporto 3 : 2 partendo da Re arriviamo a La corrispondente all’intervallo 27 :

(9) nα = k + log2 rn con α = log2 (3/2)

con la scelta n = q si avrebbe che rq = 1 e dunque la spirale si richiuderebbe dopo esattamente q

in modo da costruire sistemi chiusi con 5, 12, 53, . . . intervalli.

log2 rn = Rαn (0) con α = log2 (3/2)

Sappiamo che ogni intero positivo a si può fattorizzare nel prodotto

6.2. Altri esempi di scale naturali.

1 256 16 10 9 32 6 5 81 4 27 45 729 3 128 8 5 27 16 9 15 243 2

6.3. Descrizione gruppale e geometrica dei temperamenti naturali.

J. S. Bach, Das Wohltemperirte Clavier (1722, 1744)

Tornando al temperamento equabile, lo sviluppo in frazione continua dell

1 9 19 47 207 1289 2785

9.5. I convergenti lenti. Se x ∈ R ha lo sviluppo x = [a0 ; a1 , a2 , . . . ], allora per ogni n ≥ 1 vi

[a0 ; a1 , . . . , an−1 , 1], [a0 ; a1 , . . . , an−1 , 2], ··· , [a0 ; a1 , . . . , an−1 , an ]

In altri termini, per ogni n ≥ 1 e 1 ≤ r ≤ an il convergente lento di ordine

 8/5, questa ha come genitori le frazioni 3/2 e 5/3 ed è

Dato un numero razionale x di profondità d, possiamo mettere in corrispondenza la sua rapp-

Vale infatti il seguente risultato.

Dimostrazione. Il quadrato della distanza D tra i centri di C pq e C p0 è

alfabeto binario munito dell’operazione di giustapposizione di parole) allora la rappresentazione binaria di k + 1 si

log(diametro) = ampiezza − consonanza

N primo intervallo secondo intervallo comma generalizzato convergente

Potrebbero piacerti anche

8/5, questa ha come genitori le frazioni 3/2 e 5/3 ed è