Sei sulla pagina 1di 102

Lezioni di Combinatoria

Antonio Maschietti

Dipartimento di Matematica “G. Castelnuovo”


Università degli Studi “La Sapienza”
Roma
maschiet@mat.uniroma1.it

A. A. 2006–2007
Indice

Notazioni 5

1 Prologo: Cosa è la combinatoria 7

2 Nozioni preliminari e notazioni 15


2.1 Applicazioni tra insiemi . . . . . . . . . . . . . . . . . . . . . 15
2.2 L’insieme delle parti . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Prodotto cartesiano . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4 Insieme quoziente . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 Cardinalità di un insieme . . . . . . . . . . . . . . . . . . . . 21
2.6 Proprietà elementari degli interi . . . . . . . . . . . . . . . . . 21
2.6.1 Il principio di induzione . . . . . . . . . . . . . . . . . 21
2.6.2 Divisibilità e primalità . . . . . . . . . . . . . . . . . . 22
2.7 Il linguaggio della teoria dei grafi . . . . . . . . . . . . . . . . 25

3 Combinatoria classica 33
3.1 Tecniche elementari per contare . . . . . . . . . . . . . . . . . 33
3.2 Il principio della media . . . . . . . . . . . . . . . . . . . . . . 36
3.3 Configurazioni combinatorie . . . . . . . . . . . . . . . . . . . 37
3.3.1 Disposizioni con ripetizione . . . . . . . . . . . . . . . 38
3.3.2 Disposizioni senza ripetizioni o k−permutazioni . . . . 38
3.3.3 Combinazioni e coefficienti binomiali . . . . . . . . . . 39
3.3.4 Il teorema del binomio . . . . . . . . . . . . . . . . . . 43
3.3.5 Combinazioni con ripetizioni . . . . . . . . . . . . . . 45
3.4 Una raccolta di esercizi . . . . . . . . . . . . . . . . . . . . . . 47
3.5 Il principio di inclusione/esclusione . . . . . . . . . . . . . . . 49
3.6 Partizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.7 Il principio dei cassetti . . . . . . . . . . . . . . . . . . . . . . 55
4 Analisi asintotica 61
4.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.2 Le notazioni O e o . . . . . . . . . . . . . . . . . . . . . . . . 62
4.3 Le notazioni di Vinogradov . . . . . . . . . . . . . . . . . . . 66
4.4 La notazione o e l’equivalenza asintotica . . . . . . . . . . . . 67
4.5 Manipolazione delle stime O e o . . . . . . . . . . . . . . . . . 68
4.6 La formula di Stirling . . . . . . . . . . . . . . . . . . . . . . 70
4.7 Le formule di sommazione di Eulero e di Abel . . . . . . . . . 73
4.8 La distribuzione dei numeri primi . . . . . . . . . . . . . . . . 76

5 Il metodo probabilistico 87
5.1 Distribuzioni di probabilità finite . . . . . . . . . . . . . . . . 87
5.2 Probabilità condizionata ed indipendenza . . . . . . . . . . . 89
5.3 Definizione assiomatica di probabilità . . . . . . . . . . . . . . 91

6 Funzioni generatrici 93
6.1 Serie di potenze: aspetto formale . . . . . . . . . . . . . . . . 94
6.2 Convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . 97
6.3 Funzioni generatrici . . . . . . . . . . . . . . . . . . . . . . . . 98

7 Trasformata di Fourier discreta 101


7.1 Lo spazio L2 (Z/nZ) . . . . . . . . . . . . . . . . . . . . . . . 101
7.2 Proprietà della trasformata di Fourier . . . . . . . . . . . . . 103

8 Teoria di Ramsey ed Applicazioni 105

Bibliografia 107
Notazioni

Simbolo Significato
N Insieme dei numeri naturali 1, 2, 3, . . . , n, . . .
N0 {0, 1, 2, . . . , n . . . }
[n] Sottoinsieme {1, 2, . . . , n} di N
Q Insieme dei numeri razionali
R Insieme dei numeri reali
R+ Insieme dei numeri reali positivi
C Insieme dei numeri complessi
|S| Cardinalità dell’insieme S
A\B Insieme degli elementi di A che non appartengono a B
Capitolo 1

Prologo: Cosa è la
combinatoria

Cosa è la “combinatoria”? . Può essere descritta come l’arte di disporre og-


getti secondo determinate regole. Già in base a questa definizione due tipi di
problematiche generali si pongono per la teoria:

1. dimostrare se esistono configurazioni verificanti determinate regole;

2. in caso di risposta affermativa alla questione (1), calcolare in quanti


modi diversi tali configurazioni possano realizzarsi.

È facile intuire che se le regole assegnate sono semplici, il problema del-


l’esistenza non presenta difficoltà alcuna e quindi ci si concentra sul numero
delle configurazioni realizzabili (combinatoria enumerativa). Se invece si asse-
gnano delle regole più complesse, potrebbe non essere chiaro se una soluzione
è possibile. Due esempi chiariranno questi concetti.
♣ Esempio 1.1. Derangements

Ci sono n spettatori ad un concerto, ciascuno dei quali ha lasciato


in deposito il suo cappello. In quanti modi la guardarobiera può
riconsegnare i cappelli in modo tale che nessun spettatore riceva
il proprio cappello?

Il numero totale dei modi di riconsegnare i cappelli agli spettatori è il


numero delle permutazioni di n oggetti, che vale n! (n fattoriale). Vedremo
che il numero cercato è la parte intera di n!/e, essendo e la base dei logaritmi
naturali. A prima vista un risultato sorprendente. Una variazione sullo stesso
tema: la probabilità che uno spettatore riceva il cappello sbagliato è 1/e. ♣
8 Capitolo 1: Cosa è la combinatoria

♣ Esempio 1.2. Il problema delle scolare di Kirkman

Quindici scolare passeggiano ogni giorno in cinque gruppi di tre.


Combinare le passeggiate delle ragazze per una settimana di modo
che ciascuna coppia di ragazze passeggi insieme esattamente una
volta per quella settimana.

Abbiamo sette giorni durante i quali ciascuna ragazza passeggia una sola
volta con ciascuna delle altre quattordici, ed ogni giorno passeggia con altre
due. Dimostrare che il problema ha soluzioni non è completamente banale.
Tale problema fu posto e dimostrato da Kirkman nel 1847. Il problema può
essere generalizzato nel numero delle scolare. Soltanto nel 1967 è stato dimo-
strato che soluzioni esistono per ogni numero di ragazze congruo a 3 modulo
6. ♣
♣ Esempio 1.3. In uno strano paese vi sono due quartieri, il quartiere dei
PARI e quello dei DISPARI, ciascun quartiere composto dello stesso numero
n di abitanti. Ciascun quartiere vuole fondare dei club in modo tale da averne
più dell’altro. Ma le regole per fondare i club riflettono il loro nome.

Il quartiere dei PARI:

(a) Ogni club deve consistere di un numero pari di componenti.


(b) Ogni due club devono avere in comune un numero pari di compo-
nenti.
(c) Due club non possono avere gli stessi componenti.

Il quartiere dei DISPARI:

(a) Ogni club deve consistere di un numero dispari di componenti.


(b) Ogni due club devono avere un numero pari di componenti.

Si domanda: chi vincerà la sfida? Il risultato sembra, almeno a prima vista


sorprendente.

Teorema 1.4. (1) Il quartiere dei PARI può costituire al più 2n/2 club.
(2) Il quartiere dei DISPARI può fondare al massimo n club.

I PARI vincono, e non di poco se n è grande! È una sfida con se stessi


provare a dimostrare questo teorema.
Questo esempio divertente illustra uno degli aspetti della combinatoria,
notevolmente ricca di applicazioni: la combinatoria estremale. La situazione
in generale è di questo tipo. Si ha una struttura combinatoria (S, F), ove
trato che soluzioni esistono per ogni numero di ragazze congruo a 3
o 6. ♣
combinatoria affonda le sue radici nella antichità ed ha un ragionevole
scientifico almeno a partire da Leonhard Euler 1 (Eulero) (1707–1783)
Prologo 9

S è un insieme finito ed F una famiglia di sottoinsiemi soggetta a certe


condizioni. L’obiettivo è di determinare quanto grande può essere |F| rispetto
alle assegnate condizioni. ♣
La combinatoria affonda le sue radici nella antichità ed ha un ragionevole
livello scientifico almeno a partire da Leonhard Euler 1 (Eulero) (1707–1783).

Figura 1.1: Leonhard Euler

Le tecniche combinatorie hanno trovato e trovano applicazioni in ogni


aspetto della matematica. In tempi più recenti il grandiosa sviluppo dell’in-
formatica ha dato nuovo e veemente sviluppo alla disciplina stessa.
In questo corso tratteremo delle tecniche più potenti della combinato-
ria che si sono dimostrate utili nell’affrontare i più svariati problemi. In
particolare tratteremo:
Figura 1.1: Leonhard Euler
1. Temi della combinatoria classica: permutazioni, combinazioni e dispo-
sizioni. Sono le configurazioni di base della disciplina. Accanto ad esse
presenteremo le tecniche elementari per contare oggetti di un insie-
da allora le tecniche combinatorie hanno trovato applicazioni in ogn
me: il doppio conteggio, il principio dei cassetti, il principio di inclu-
sione/esclusione, il principio della media. Tratteremo anche due altri
o della matematica. In tempi più recenti il grandiosa sviluppo dell’in-
aspetti classici della combinatoria: sistemi di rappresentanti distinti e
colorazioni.
tica ha dato nuovo
1 e veemente sviluppo alla disciplina stessa.
Informazioni bibliografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Euler.html

ormazioni bibliografiche:
www-history.mcs.st-andrews.ac.uk/Mathematicians/Euler.html
10 Capitolo 1: Cosa è la combinatoria

2. Il metodo probabilistico: questo metodo utilizza tecniche di calcolo del-


le probabilità per dimostrare l’esistenza di oggetti aventi determinate
proprietà.
3. Tecniche enumerative: intervengono nella determinazione del numero
degli elementi di un insieme verificanti certe proprietà. Questo numero
dipende dalla cardinalità n dell’insieme. Quindi, in generale, il numero
cercato è una funzione f (n) di n ∈ N0 . Queste tecniche sono deputate
a:
(a) esibire una formula esplicita per f (n); oppure
(b) esibire una relazione ricorsiva tra f (n) e i suoi predessori f (n−1),
f (n − 2), . . . , f (n − k) (relazione ricorsiva di ordine k); oppure
(c) cercare di determinare una stima per f (n), qualora non si riesca
a determinare una formula esatta (metodi asintotici).
4. Teoria di Ramsey: questa teoria tratta della ricerca di regolarità nelle
partizioni di strutture matematiche. Lo schema di base dei risultati del-
la teoria è generalmente di questo tipo: supponendo che la cardinalità
della struttura sia abbastanza grande, ogni partizione della struttura
in un certo numero finito di sottostrutture fornisce almeno una sotto-
struttura con una assegnata proprietà. talvolta ciò si esprime dicendo
che “il disordine completo è impossibile”. Illustreremo diversi esempi so-
prattutto nell’ambito della cosiddetta combinatoria additiva, un nuovo
settore della matematica in rapido sviluppo.
Concludiamo questa introduzione con alcuni esempi che chiariscono ta-
luni aspetti delle tecniche enumerative.
♣ Esempio 1.5. Determinare il numero dei sottoinsiemi di Sn , ove Sn è un
insieme di n elementi, n ∈ N.
Sia f (n) tale numero. Per i primi valori di n si trova facilmente:
n 0 1 2 3 ...
f (n) 1 2 4 8 ...
sicchè si congettura prontamente la formula
|Sn | = f (n) = 2n , (1.1)
la cui validità può essere dimostrata con il principio di induzione. Ma la (1.1)
è anche ottenibile dalla relazione ricorsiva
(
f (0) = 1
. (1.2)
f (n) = 2f (n − 1) , per n ≥ 1
Prologo 11

Figura 1.2: Fibonacci

Infatti se si toglie dall’insieme Sn un elemento x, ottenendo un insieme


di cardinalità n − 1, il numero dei sottoinsiemi di Sn \ {x} è f (n − 1),
e aggiungendo a ciascuno di questi sottoinsiemi l’elemento x si ottengono
f (n − 1) sottoinsiemi di Sn . Pertanto il numero totale dei sottoinsiemi è
f (n − 1) + f (n − 1) = 2f (n − 1). Quindi per ricorrenza

f (n) = 2f (n − 1) = 2 × 2f (n − 2) = · · · = 2 × 2 × × · · · × 2 = 2n .

Abbiamo determinato una formula esplicita. È una formula semplice, che


fornisce informazioni quantitative complete, ed è facile da calcolare. Una
tale situazione raramente si presenta. ♣
♣ Esempio 1.6. (Numeri di Fibonacci) Consideriamo il seguente problema,
formulato da Fibonacci 2 (figura 1.2) nel 1202.
Supponiamo di immettere in un habitat una coppia di conigli neonati di
sesso diverso, di sapere che essi raggiungono la maturità sessuale dopo un
mese dalla nascita, che il tempo di gestazione sia un mese e che ogni coppia
riproduca esattamente una coppia di conigli di sesso diverso. Quante coppie
di conigli saranno presenti nell’habitat dopo n mesi?
Cominciamo a fare qualche conto per valori bassi di n (figura 1.3):

# mesi # coppie
0 1
1 1
2 2
3 3
4 5
... ...

Sia Fn il numero delle coppie presenti al mese n. È chiaro che al mese 0 è


presente soltanto la coppia neonata e che anche al mese 1 è presente soltanto
la coppia iniziale. Al secondo mese (n = 2) abbiamo la coppia iniziale e la
coppia da essa generata. Al mese n, quando n ≥ 2, sono presenti le coppie
del mese precedente Fn−1 e le coppie generate dalle Fn−2 coppie presenti alla
2
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Fibonacci.html
12 Capitolo 1: Cosa è la combinatoria

Figura 1.3: Il problema di Fibonacci

fine del mese n − 2. Quindi



F0 = 1

F1 = 1 . (1.3)

Fn = Fn−1 + Fn−2 , per n ≥ 2

Abbiamo dunque fornito una risposta al problema, espressa in termini di


una relazione ricorsiva. Ma ci chiediamo:

1. C’è una formula esatta che fornisca Fn ?

2. Si può avere un’idea dell’andamento di Fn allorquando n → ∞?

La risposta a questioni di questo tipo ci viene offerta dalla teoria delle fun-
zioni generatrici. A seconda del problema in questione le funzioni generatrici
sono o elementi dell’anello delle serie formali di potenze oppure funzioni
analitiche. Questa teoria getta un ponte tra i due tradizionali aspetti della
Matematica: la matematica del discreto e la matematica del continuo. Di que-
sta teoria tratteremo soltanto gli aspetti introduttivi, con qualche escursione
nella teoria delle funzioni analitiche. ♣
Capitolo 2

Nozioni preliminari e
notazioni

Riportiamo qui di seguito alcune delle notazioni che saranno adottate, alcuni
elementi di teoria degli insiemi, le proprietà di base dei numeri interi e la
terminologia dei grafi.
Di norma gli insiemi saranno indicati con lettere latine maiuscole, A,...,
S,..., X, Y , Z, mentre gli elementi di un insieme con lettere latine minuscole.
A particolari insiemi riserveremo altre notazioni, che saranno di volta in
volta specificate. Ad esempio, N, Z, Q, R, C denoteranno, rispettivamente,
gli insiemi dei numeri interi positivi (numeri naturali), dei numeri interi
relativi, dei numeri razionali, dei numeri reali, dei numeri complessi.
La relazione di appartenenza viene indicata con il simbolo ∈ e la scrittura
x ∈ X si legge “x appartiene ad X ” oppure “x è un elemento di X”, mentre
x∈ / X si legge “x non appartiene ad X ”. Se S è un insieme tale che x ∈ X
per ogni x ∈ S, si dice che S è un sottoinsieme di X e si scrive S ⊆ X. Si ha
che S = X se, e soltanto se, S ⊆ X e X ⊆ S.

2.1 Applicazioni tra insiemi


Una applicazione dell’insieme X nell’insieme Y è una legge, di natura qual-
siasi, che ad ogni elemento x ∈ X associa esattamente un elemento y ∈ Y .
Le applicazioni saranno indicate con lettere latine o greche. Se F è un’appli-
cazione di X in Y , scriveremo F : X → Y . Il corrispondente y ∈ Y di x ∈ X,
che si chiama la immagine di x (tramite F ), sarà denotato con F (x). Nel
caso che Y ⊆ C diremo anche che F è una funzione .
14 Capitolo 2: Nozioni preliminari e notazioni

Se F : X → Y è una applicazione, per ogni sottoinsieme S ⊆ X, la


scrittura F (S) denoterà il sottoinsieme di Y

F (S) = {y ∈ Y | ∃ x ∈ X : y = F (x)} .

F (S) si chiama la immagine di S (tramite F ). L’immagine di X tramite F ,


viene anche denotata con Im(F ) (immagine dell’applicazione).
Per ogni y ∈ Y , il sottoinsieme di X

F −1 (y) = {x ∈ X | F (x) = y}

si chiama la controimmagine o fibra di y. Se T ⊆ Y , il sottoinsieme di X

F −1 (T ) = {x ∈ X | F (x) ∈ T }

è la controimmagine di T .
Una applicazione F : X → Y si dice iniettiva se per ogni coppia di
elementi distinti x, x0 ∈ X risulta F (x) 6= F (x0 ). F si dice suriettiva se
F (X) = Im(F ) = Y , cioè se la controimmagine di ogni elemento di Y è
non vuota. Quando F è iniettiva e suriettiva, si dice che F è un’applicazione
biunivoca.
Le seguenti inclusioni sono facili da verificare:
(1) F −1 (F (S)) ⊆ S, per ogni S ⊆ X;
(2) F (F −1 (T )) ⊆ T , per ogni T ⊆ Y ;
(3) se T1 ⊆ T2 ⊆ Y , allora F −1 (T1 ) ⊆ F −1 (T2 ).
Nella (1) (risp., (2)) vale il segno di uguaglianza se, e soltanto se, F è
iniettiva (risp., suriettiva).
Se F : X → Y è un’applicazione biunivoca, è possibile definire l’applica-
zione G : Y → X, ponendo, per ogni y ∈ Y

G(y) = x ⇐⇒ F (x) = y .

G è unica, è biunivoca, si chiama la applicazione inversa di F e viene denotata


con la scrittura F −1 .
Proposizione 2.1. Per un insieme finito S sono fatti equivalenti:
(1) F : S → S è biunivoca;

(2) F : S → S è iniettiva;

(3) F : S → S è suriettiva.
La facile dimostrazione è lasciata per esercizio.
2.2. L’insieme delle parti 15

2.2 L’insieme delle parti


Sia X un insieme. L’insieme i cui elementi sono i sottoinsiemi di X si denota
con P(X) e si chiama l’insieme delle parti di X. In questo insieme sono
definite le operazioni di unione e intersezione. Se S, T ∈ P(X), l’unione di S
con T è il sottoinsieme di X

S ∪ T := {x ∈ X | x ∈ S oppure x ∈ T } ;

l’intersezione di S con T è il sottoinsieme

S ∩ T := {x ∈ X | x ∈ S e x ∈ T } .

L’intersezione di due sottoinsiemi può essere priva di elementi; può essere


cioè l’insieme vuoto, cui è riservato il simbolo ∅.
Le operazioni di unione e intersezione possono estendersi a famiglie qual-
siasi di insiemi. Diamo un significato alla parola famiglia.
Sia X un insieme. Si dice che un insieme I è un insieme di indici per X
se esiste una applicazione
x: I → X .
Ciò significa che per ogni i ∈ I l’elemento x(i) ∈ X è perfettamente indivi-
duato da i. L’immagine x(i) viene usualmente denotata con xi e il sottoin-
sieme di X
x(I) = Im(x) = {x(i), ∀ i ∈ I} = {xi }i∈I
si chiama una famiglia di elementi di X indicizzata da I.
Nel caso I = N, la famiglia {xn }n∈N si chiama una successione (di
elementi) di X.
Sia {Si }i∈I una famiglia di parti di X. Si definisce unione della famiglia
il sottoinsieme di X
[
Si := {x ∈ X | ∃ i ∈ I : x ∈ Si } ,
i∈I

mentre l’intersezione della famiglia è il sottoinsieme di X


\
Si := {x ∈ X | x ∈ Si ∀ i ∈ I} .
i∈I

Se F : X → Y è una applicazione, allora per ogni famiglia {Ti }i∈I di


sottoinsiemi di Y si ha
[ [
F −1 ( Ti ) = F −1 (Ti )
i∈I i∈I
16 Capitolo 2: Nozioni preliminari e notazioni

\ \
F −1 ( Ti ) = F −1 (Ti ) .
i∈I i∈I

Un’altra operazione che interviene spesso è il passaggio al complementare.


Sia S ⊆ X. Il complementare di S in X è il sottoinsieme

X \ S = {(S) = {x ∈ X | x ∈
/ S} .

Talvolta scriveremo anche X −S, od anche S. Sussistono le seguenti identità,


note come regole di de Morgan: per ogni famiglia {Si }i∈I ,
\ [ [ \
{( Si ) = {(Si ), {( Si ) = {(Si ) .
i∈I i∈I i∈I i∈I

Se F : X → Y è un’applicazione e T ⊆ Y , allora

F −1 ({(T )) = {(F −1 (T )) .

Vogliamo ora considerare due operazioni che permettono di costruire


nuovi insiemi a partire da insiemi dati.

2.3 Prodotto cartesiano


Sia {Xi }i∈I una famiglia di insiemi. Si definisce prodotto cartesiano della
famigia data l’insieme che ha per elementi tutte le applicazioni
[
x: I → Xi
i∈I
Q
tali che x(i) ∈ Xi , per ogni i ∈ I. Si denoterà con i∈I Xi . Converremo,
in generale, di identificare ciascun elemento del prodotto cartesiano con la
sua immagine x(I) = {xi }i∈I , dato che ogni applicazione è perfettamente
individuata dalle sue immagini.
♣ Esempio 2.2. Siano Q I = {1, 2, . . . , n} e {Xi }i∈I una famiglia di n insiemi.
Il prodotto cartesiano i∈I Xi = X1 × · · · × Xn è l’insieme delle applicazioni
x : {1, 2, . . . , n} → X1 ∪ X2 ∪ · · · ∪ Xn tali che x(i) ∈ Xi . L’immagine di
{1, 2, . . . , n} tramite x è una n−pla ordinata di elementi, di cui il primo è
in X1 , l’n−esimo in Xn . In tal caso, il prodotto cartesiano X1 × · · · × Xn
si identifica con l’insieme delle n−ple ordinate (x1 , . . . , xn ) tali che xi ∈ Xi ,
per ogni i = 1, . . . , n. ♣
2.4. Insieme quoziente 17

♣ Esempio 2.3. Siano I = N e Xn = X per ogni n ∈ N. Ogni applicazione


[
x: N → Xn = X
n∈N
Q
è una successione di X. Pertanto n∈N X è l’insieme di tutte le successioni
di X. ♣
♣ Esempio 2.4. Siano I ed X insiemi. Se {Xi }i∈I è una famiglia
Q indicizzata
da I e Xi = X per ogni i ∈ I, allora il prodotto cartesiano i∈I X coincide
con l’insieme delle applicazioni di I in X. Questo insieme si denota con X I .

Q
Se i∈I Xi è il prodotto cartesiano della famiglia {Xi }iI , si definisce per
ogni i ∈ I i−esima proiezione l’applicazione
Y
pi : Xi → Xi
i∈I

Q
tale che pi (x) = x(i) = xi , per ogni x ∈ i∈I Xi . È facile verificare che pi è
un’applicazione suriettiva per ogni i ∈ I. Se pensiamo ciascun elemento x del
prodotto cartesiano identificato con la sua immagine e chiamiamo l’elemento
xi ∈ Xi la i−esima componente di x, allora pi associa ad x la sua i−esima
componente.

2.4 Insieme quoziente


Sia X un insieme. Una relazione su X è un sottoinsieme R del prodotto
cartesiano X × X. Se (x, y) ∈ R, diremo che x ed y sono in relazione. In
modo equivalente, una relazione su X è una applicazione ρ che permette di
associare ad ogni elemento di X esattamente un elemento di X. Se y è il
corrispondente di x nella relazione ρ, scriveremo x ρ y. Diremo che ρ è una
relazione di equivalenza su X se per ogni x, y, z ∈ X si ha
(1) x ρ x (proprietà riflessiva);
(2) se x ρ y, allora y ρ x (proprietà simmetrica);
(3) se x ρ y e y ρ z, allora x ρ z (proprietà transitiva).
Se ρ è una relazione di equivalenza su X, si definisce classe di equivalenza
ciascuno dei sottoinsiemi di X costituito da tutti gli elementi che sono in
relazione fra loro. Se x ∈ X, con

[x]ρ = {y ∈ X | x ρ y}
18 Capitolo 2: Nozioni preliminari e notazioni

si indica la classe di equivalenza individuata da x; x si chiama anche un


rappresentante della classe di equivalenza. È facile dimostrare che [x]ρ = [y]ρ
se, e soltanto se, x ρ y. Di conseguenza, due classi di equivalenza o coincidono
oppure sono disgiunte (hanno cioè intersezione vuota). Pertanto X è unione
delle sue classi di equivalenza, cioè, come si suol dire, le classi di equivalenza
di X formano un ricoprimento di X. Poichè le classi di equivalenza sono a
due a due disgiunte, tale ricoprimento è una partizione . Viceversa, se {Si }iI
è una partizione di X, allora la relazione su X

x ρ y ⇐⇒ ∃ i ∈ I : x, y ∈ Si

è una relazione di equivalenza, le cui classi di equivalenza sono esattamente


i sottoinsiemi Si .
Definizione 2.5. Sia ρ una relazione di equivalenza su X. L’insieme i cui
elementi sono le classi di equivalenza di ρ si chiama insieme quoziente e si
denota con X/ρ. L’applicazione q : X → X/ρ, tale che per ogni x ∈ X,
q(x) = [x]ρ , si chiama proiezione canonica o naturale.
Sia F : X → Y un’applicazione tra insiemi e sia i : Im(F ) → Y l’inclu-
sione di Im(F ) in Y . L’applicazione F determina su X la seguente relazione
di equivalenza ρF :
x ρF y ⇐⇒ F (x) = F (y) .
Teorema 2.6. Esiste una ed una sola applicazione biunivoca F : X/ρF →
F (X) tale che i ◦ F ◦ q = F .
Dimostrazione. Facciamo riferimento alla figura seguente:

X
F /Y
O
q i

X/ρF / Im(F )
F

Definiamo F : X/ρF → F (X) ponendo, per ogni x ∈ X, F ([x]ρF ) = F (x).


Proviamo che F è ben posta, cioè non dipende dalla scelta del rappresentante
della classe di equivalenza. Infatti

[x]ρF = [y] ⇐⇒ x ρF y ⇐⇒ F (x) = F (y) ⇐⇒ F ([x]ρF ) = F ([y]ρF ) .

Questa catena di equivalenze dimostra anche che F è iniettiva. Inoltre F è


chiaramente suriettiva e, per costruzione, i ◦ F ◦ q = F . L’unicità di F è
evidente.
2.5. Cardinalità di un insieme 19

2.5 Cardinalità di un insieme


La teoria degli insiemi da noi utilizzata è la cosiddetta teoria ingenua. Per
evitare i paradossi che si presentano nell’ambito di questa teoria, si ipotizzerà
che tutti gli insiemi che prenderemo in considerazione siano sottoinsiemi di
un insieme fissato U, detto insieme universo. Eviteremo così locuzioni del
tipo “insieme di tutti gli insiemi” e simili.
Si dice che due insiemi X ed Y sono equipotenti se esiste una biiezione
(corrispondenza biunivoca) di X con Y . Si tratta di una relazione di equiva-
lenza su U. Gli elementi dell’insieme quozienti si chiamano numeri cardinali.
Il numero cardinale associato all’insieme X si chiama anche la cardinalità
di X. I numeri cardinali definiti dagli insiemi finiti sono i numeri naturali.
La cardinalità di N si chiama potenza del numerabile. Noi tratteremo quasi
sempre di insiemi finiti e se S è finito la sua cardinalità viene denotata con
|S|.

2.6 Proprietà elementari degli interi


Ci limitiamo soltanto ad alcune nozioni di base, in particolare il principio di
induzione e divisibilità tra interi.

2.6.1 Il principio di induzione


I numeri naturali N costituiscono un insieme totalmente ordinato, rispetto
all’ordinamento che viene appunto chiamato ordinamento naturale. Rispetto
a questo ordinamento c’è un primo elemento, che è il numero 1.
Il principio di induzione stabilisce che se S ⊆ N verifica le condizioni

1. 1 ∈ S; e

2. n ∈ S =⇒ n + 1 ∈ S

allora S = N.
Logicamente equivale al principio del buon ordinamento:

ogni s.i. non vuoto di N ha un minimo.

Il principio di induzione permette la cosiddetta dimostrazione per indu-


zione .

Sia P (n) una proposizione che dipende dal numero naturale n.


Supponiamo che P (1) sia vera. Supponiamo inoltre che, se P (n)
20 Capitolo 2: Nozioni preliminari e notazioni

è vera, anche P (n + 1) è vera. Allora P (n) è vera per tutti i


numeri naturali n.

Vi sono alcune formulazioni alternative al principio di induzione, di cui


ricordiamo quella versione che permette la tecnica di dimostrazione per mezzo
del minimo controesempio:

Supponiamo che P (n) sia una proposizione tale che non è vero
che P (n) sia verificata per ogni numero naturale. Allora esiste un
numero naturale minimo n0 per il quale P (n0 ) è falsa; in altre
parole, P (m) è vera per ogni m < n0 , ma P (n0 ) è falsa.

2.6.2 Divisibilità e primalità


Sia a, b ∈ Z. Si dice che b divide a, oppure, equivalentemente, che a è divisibile
per b, se esiste c ∈ Z tale che a = bc. Se b divide a si dice che b è un divisore
di a e si scrive b | a. Se b non divide a si scrive b - a.
Elenchiamo in un teorema, la cui dimostrazione viene lasciata per eser-
cizio del lettore, alcuni semplici fatti sulla divisibilità.

Teorema 2.7. Per ogni a, b, c ∈ Z si ha:

1. a | a , 1 | a , a | 0;

2. 0 | a se e solo se a = 0;

3. a | b e a | c implica a | (b + c);

4. a | b implica a | −b;

5. a | b e b | c implica a | c;

6. a | b e b | a se e solo se a = ±b.

Ogni intero n è sempre divisibile per ±1 e ±n, che si dicono i divisori


banali di n. Diremo allora che un intero p > 1 è primo se gli unici divisori
di p sono quelli banali. Al contrario, un intero n > 1 si dice composto se
non è primo: esistono dunque interi a e b tali che 1 < a < n, 1 < b < n e
ab = n. Si osservi che il numero 1 non è considerato né primo né composto.
Lo studio dell’insieme P dei numeri primi appartiene alla teoria dei numeri.
la loro importanza risiede nel teorema fondamentale dell’aritmetica:
2.6.2. Divisibilità e primalità 21

Teorema 2.8 (Teorema fondamentale dell’aritmetica). Ogni intero n diver-


so da zero può essere scritto come

n = ±ph1 1 · · · phr r

dove i pi sono primi distinti e gli hi interi positivi. Inoltre, questa espressione
è unica, a meno dell’ordine dei fattori.

La dimostrazione si compone di due parti: una parte esistenziale ed una


parte riguardante l’unicità. La parte esistenziale è facile. Si tratta di provare
che ogni intero positivo è prodotto di primi. Se n = 1, basta prendere hi = 0
per ogni i ( il prodotto di una famiglia vuota di primi vale 1). Possiamo
allora procedere per induzione. Supponiamo n > 1 e supponiamo che ogni
intero minore di n sia il prodotto di primi. Se n è primo, l’affermazione che
stiamo dimostrando è certamente vera, essendo n il prodotto di un primo.
Sia n composto. Esistono a e b in N tali che n = ab con a < n e b < n. Allora
a e b sono prodotto di primi e quindi n è prodotto di primi.
La dimostrazione della unicità della fattorizzazione non è per niente ovvia
e richiede ulteriori concetti, molto probabilmente ben noti al lettore, ma che
riportiamo per completezza.
Il primo concetto che occorre è la divisione con resto .

Teorema 2.9 (Divisione con il resto). Se a, b ∈ Z e b > 0 esistono e sono


unici q, r ∈ Z tali che a = bq + r e 0 ≤ r < b.

Dimostrazione. Sia S l’insieme dei numeri interi non negativi della forma
a − zb con z ∈ Z. Questo insieme è non vuoto (contiene a) e quindi possiede
un minimo. Sia r questo minimo. Dunque r = a − qb con q ∈ Z e r ≥ 0 per
definizione. Inoltre è r < b, perché altrimenti si avrebbe 0 ≤ r − b e r − b =
a − (q + 1)b ∈ S, contraddicendo la minimalità di r. Ciò prova l’esistenza di
r e q. Per quanto riguarda l’unicità, supponiamo che a = qb + r = q 0 b + r0 .
Si ricava
r0 − r = b(q − q 0 ) . (2.1)
Per ipotesi il primo membro della (2.1) è minore di b in valore assoluto.
D’altra parte, se è q 6= q 0 allora il secondo membro della (2.1) dovrebbe valere
almeno b in valore assoluto. Deve essere perciò q = q 0 e quindi r = r0 ,

Siano a, b ∈ Z. Diciamo che d ∈ Z è un divisore comune di a e b se d | a


e d | b. Un divisore comune di a e b è un massimo comun divisore (M.C.D.)
se d ≥ 0 e ogni altro divisore comune di a e b divide d.
22 Capitolo 2: Nozioni preliminari e notazioni

Teorema 2.10 (Esistenza ed unicità del M.C.D.). Per ogni a, b ∈ Z esiste


un solo massimo comun divisore di a e b.

Dimostrazione. Sia ha, bi = {ma + nb | m, n ∈ Z} (ideale generato da a e b)


e sia d il più piccolo intero positivo contenuto in ha, bi (certamente esistente
per il principio del buon ordinamento). Esistono allora m0 e n0 in Z tali che
d = m0 a + n0 b. Proviamo che

ha, bi = hdi = {hd | h ∈ Z} .

Ovviamente hdi ⊆ ha, bi. Dimostriamo allora che hdi ⊇ ha, bi. Infatti, sia
c ∈ ha, bi. Basta provare che d | c. Eseguiamo la divisione con resto:

c = qd + r , con 0 ≤ r < d .

Poiché qd ∈ ha, bi, si ha c − qd = r ∈ ha, bi. Dalla r ≥ 0 segue r = 0, essendo


d il minimo intero positivo in ha, bi.
Proviamo che d è M.C.D. di a e b. certamente d | a e d | b. Sia d0 | a e
0
d | b. Scritto
a = a0 d0 e b = b0 d0
dalla d = m0 a + n0 b si ottiene d = m0 a0 d0 + n0 b0 d0 = (m0 a0 + n0 b0 )d0 , e quindi
d0 | d. L’unicità è ovvia per l’ipotesi di positività.

Se a, b ∈ Z, il loro M.C.D. si denota con (a, b). Se (a, b) = 1, i due interi


a e b si dicono relativamente primi (od anche primi fra loro). Dal teorem
2.10 si ha che a, b ∈ Z sono relativamente primi se e solo se ha, bi = Z. Si ha
anche

Corollario 2.11. L’equazione ax+by = 1, con a, b ∈ Z, ha soluzioni intere


s e solo se (a, b) = 1.

Teorema 2.12. Per a, b, c ∈ Z tali che c | ab e (a, c) = 1, si ha c | b.

Dimostrazione. Dalla (a, c) = 1 e dal Teorema 2.10 segue as + ct = 1, per


qualche s, t ∈ Z. Moltiplicando questa equazione per b si ottiene

abs + cbt = b . (2.2)

Poiché c | ab e c | cbt, segue che c divide il primo membro della (2.2) e quindi
c | b.

Corollario 2.13. Sia p un primo e siano a, b ∈ Z. Allora se p | ab si ha


che p | a oppure p | b.
2.7. Il linguaggio della teoria dei grafi 23

Dimostrazione. Per ipotesi p | ab. Gli unici divisori di p sono ±1 e ±p. Quindi
(p, a) vale 1 oppure p. Se p | a, non vi è più nulla da dimostrare. Sia allora
p -. Deve essere (p, a) = 1. Dal teorema precedente segue p | b.

Siamo ora in grado di concludere la dimostrazione del teorema fonda-


mentale dell’aritmetica. Dimostriamo cioè che se p1 , . . . , pr e p01 , . . . , p0s sono
primi (sono permesse ripetizioni) tali che

p1 · · · pr = p01 · · · p0s (2.3)

allora (p1 , . . . , pr ) è un riordinamento di (p01 , . . . , p0s ). Procediamo per indu-


zione su r. Se r = 0 deve essere s = 0 e il teorema è dimostrato. Sia allora
r > 1 e supponiamo il teorema dimostrato per r −1. Poiché r > 0 certamente
è s > 0. Inoltre, poiché p1 divide il primo membro della (2.3), deve dividere
anche il secondo membro, cioè p1 | p01 · · · p0s . Dal Corollario 2.13 si ha p1 | p0j
per qualche j = 1, . . . , s. Poiché p1 e p0j sono entrambi primi, necessariamente
p1 = p0 j. Possiamo allora cancellare p1 dal primo membro e p0j dal secondo
membro della (2.3); quindi la conclusione della dimostrazione per l’ipotesi
induttiva.
Indubbiamente la più importante conseguenza della fattorizzazione degli
interi è il seguente teorema dovuto ad Euclide:
Teorema 2.14. Esistono infiniti numeri primi.
Dimostrazione. Se p1 , p2 , . . . pk sono primi, con k ≥ 1, si consideri il numero
intero n = 1 + p1 p2 · · · pk . Per il teorema di fattorizzazione esiste un primo
p che divide n. Questo primo p deve essere diverso dai primi p1 , p2 , . . . pk ,
altrimenti se fosse p = pi , dal fatto che p | n e p | (p1 p2 · · · pk ) si avrebbe
che p divide 1, il che è assurdo. Dunque abbiamo determinato un primo p
diverso da p1 , p2 , . . . pk . Questa procedura si itera, provando così che i primi
sono infiniti.

2.7 Il linguaggio della teoria dei grafi


I grafi sono oggetti costruiti con insiemi finiti e permettono di schematizzare
in modo abbastanza semplice svariate situazioni. Molti problemi di combi-
natoria vengono spesso formulati in termini di grafi, e di ciò vedremo molti
esempi. Qui introduciamo soltanto le prime nozioni, ripromettondoci, quando
sarà necessario, di introdurre i concetti più avanzati di cui avremo bisogno.
La definizione di grafo comprende i seguenti dati:
• un insieme finito di vertici od anche nodi;
24 Capitolo 2: Nozioni preliminari e notazioni

• un insieme di collegamenti tra i nodi, detti lati oppure spigoli.


In modo formale:
Definizione 2.15. Un grafo è una terna G = (V, E, I), ove V è l’insieme dei
vertici, E è l’insieme dei lati ed I è un sottoinsieme di V ×E (è la relazione di
incidenza), con la condizione che ciascun lato sia incidente esattamente con
due vertici. Due vertici si dicono adiacenti se sono incidenti lo stesso lato.
Alcune osservazioni sono di obbligo.
♥ Osservazione 2.16. (1) La definizione impone che ciascun lato sia incidente
con due vertici (distinti). I nostri grafi sono privi di cappi.
(2) La definizione non esclude che vi possano essere lati ripetuti, nel senso
che lati distinti possano essere incidenti con gli stessi vertici. Se si impone
che due vertici possano essere incidenti con al più un lato, si parla di grafo
semplice. In tal caso l’insieme E dei lati può identificarsi con una famiglia
di sottoinsiemi di cardinalità 2 di V . Nel seguito consideremo sempre grafi
semplici. Le rare eccezioni saranno segnalate. In un grafo semplice il lato che
incide i vertici x e y si denota talvolta con xy e i due vertici si dicono gli
estremi del lato.
(3) I lati sono incidenti una coppia di vertici. Se si impone che questa
coppia sia ordinata, allora il lato si dice orientato. Se tutti i lati sono orientati
si parla di grafo orientato. ♥
I grafi vengono abitualmente rappresentati disegnando punti del piano,
che corrispondono ai vertici del grafo, e segmenti od archi di curva per cia-
scuna coppia di vertici adiacenti (figura 2.1). Con questo tipo di rappresenta-
zione vengono immediatamente visualizzati vertici adiacenti. Questa stessa
informazione può anche essere realizzata algebricamente con la matrice di
adiacenza del grafo. Se V = {v1 , . . . , vn } è l’insieme dei vertici del grafo G,
la sua matrice di adiacenza A è la matrice n × n il cui elemento di posto
(i, j) vale 1, se vi e vj sono adiacenti, oppure 0 nel caso contrario. La sim-
metria della relazione di adiacenza si traduce nella simmetria della matrice
di adiacenza. Inoltre, gli elementi della diagonale principale sono tutti nulli,
giacché nessun vertice è adiacente con se stesso.
Un altro concetto importante è quello di isomorfismo.
Definizione 2.17. I grafi G = (V, E, I) e G0 = (V 0 , E 0 , I 0 ) sono isomorfi se
esistono corrispondenze biunivoche f : V → V 0 e g : E → E 0 che conservino
le incidenze: se v, w ∈ V sono incidenti il lato e ∈ E allora f (v), f (w) ∈ E 0
sono incidenti il lato g(e) ∈ E 0 .
Essere isomorfi è una relazione di equivalenza nell’insieme di tutti i grafi.
Un tratto della teoria dei grafi, come accade per ogni aspetto della mate-
2.7. Il linguaggio della teoria dei grafi 25

• / •O •


• / • • •

Figura 2.1: Un grafo orientato ed uno non orientato

matica, è la ricerca di proprietà invarianti per isomorfismo. Tali proprietà


permettono di dimostrare se grafi diversi sono o non sono isomorfi.
♣ Esempio 2.18. I due grafi

1 a

5 2 e b

4 3 d c
non sono isomorfi: i vertici 2 e 5 sono incidenti tre lati, mentre nel secondo
grafo vi sono tre vertici b, e, d incidenti tre lati. ♣
Storicamente il primo testo dove si possono trovare grafi è la pubbli-
cazione di Eulero “Solutio problematis ad geometriam situs pertinentis”,
Comment. Acad. Sc. Petrog. 8 (1736), 128–140. È in effetti un problema
di topologia.
La cittadina tedesca di Königsberg (figura 2.2) si trova alla confluenza di
due fiumi, comprende un isolotto ed è divisa in quattro parti, corrispondenti
alle quattro regioni di terra che si venivano a formare (figura 2.3): le due
sponde A e B , l’isolotto C e la parte di terra D che si trova tra i due fiumi
prima della confluenza. In città c’erano i sette ponti indicati in figura. I
cittadini di Königsberg sottoposero a Leonhard Euler (Eulero) un problema
che non erano riusciti a risolvere: tracciare un percorso che, partendo da una
qualsiasi delle quattro zone della città, attraversasse tutti e sette i ponti una
ed una sola volta ritornando alla fine al punto di partenza.

Figura 2.2: La città di Könisberg al tempo di Eulero

Eulero pensò ad una generalizzazione del problema e ad una sua astrazio-


ne, ciò che è tipico dei matematici. Riportiamo un passo della citata memoria
di Eulero:
26 Capitolo 2: Nozioni preliminari e notazioni

Figura 2.3: La città di Könisberg schematizzata

“E mi fu detto che alcuni negavano ed altri dubitavano che ciò si


potesse fare, ma nessuno lo dava per certo. Da ciò io ho tratto
questo problema generale: quale che siano la configurazione e la
distribuzione in rami del fiume e qualunque sia il numero dei
ponti, si può scoprire se è possibile passare per ogni ponte una
ed una sola volta?”

Vediamo come il problema si possa tradurre in un problema inerente la teoria


dei grafi. Schematizziamo il ragionamento da fare. Il fiume ed i suoi rami
dividono la città in quattro zone A, B, C, D, collegate fra loro dai sette
ponti, così disposti:
a e b collegano A con C (ed anche C con A);
c e d collegano C con B (e B con C);
e collega C con D (e D con C);
f collega A con D (e D con A); infine
g collega D con B (e B con D).
Il problema dei ponti di Könisberg si schematizza allora con il grafo di
vertici V = {A, B, C, D}, di lati E = {a, . . . , g}, ed i collegamenti sopra
descritti (figura 2.4).

f
A D

e g
b a

c
C B
d

Figura 2.4: Grafo del problema di Könisberg 1.

Si osservi che in tal modo si è ottenuto un grafo con lati ripetuti. Si


può passare ad un grafo senza lati ripetuti aggiungendo un vertice C1 e
ridefinendo i collegamenti di modo che b colleghi A con C1 e non più con
C e d colleghi C1 con B. In questo modo si ottiene un grafo semplice non
orientato, che chiameremo il grafo del problema dei ponti di Könisberg e che
indicheremo con K (figura 2.5).
2.7. Il linguaggio della teoria dei grafi 27

f
A D
e g
a
b c
C B

d
C1

Figura 2.5: Il grafo K del problema di Könisberg.

Ora che abbiamo schematizzato il problema, ne forniremo una soluzione,


approfittandone per introdurre alcune nozioni generali.
Iniziamo dalla nozione di sottografo . Sia G = (V, E, I) un grafo. Se
V ⊆ V e E 0 ⊆ E, allora il grafo G0 = (V 0 , E 0 , I 0 ) è un sottografo di G se
0

I 0 = I ∩ (V 0 × E 0 ). Ogni sottografo G0 = (V 0 , E 0 ) tale che V 0 = V è detto


sottografo ricoprente (inglese spanning subgraph).
Se U ⊆ V è un sottoinsieme di vertici, la notazione G[U ] denota il sot-
tografo su U , i cui lati sono esattamente i lati di G con estremi in U . Si dice
anche che G[U ] è il sottografo indotto su U .
Definizione 2.19. Sia G = (V, E, I) un grafo. Il grado d(v) del vertice v è il
numero dei lati ad esso adiacenti. Un grafo G è detto regolare se d(v) non
dipende da v e se è d(v) = k il grafo si dice k−regolare, od anche regolare di
grado k. Il numero
δ(G) := min{d(v) | v ∈ V }
è il grado minimo del grafo G; il numero

∆(G) = max{d(v) | v ∈ V }

è il grado massimo; infine, Il numero


1 X
d(G) := d(v)
|V |
v∈V

è il grado medio del grafo G.


♣ Esempio 2.20. per il grafo K si ha

d(A) = 3 , d(B) = 3 , d(C1 ) = 2 , d(C) = 3 , d(D) = 3 .


28 Capitolo 2: Nozioni preliminari e notazioni

I gradi dei vertici contano le adiacenze. Pertanto d(v) ≥ 0 per ogni ver-
tice v. Inoltre se un grafo G ha n vertici, allora ciascun vertice può essere
adiacente al più con n − 1 vertici. Quindi d(v) ≤ n − 1.

Teorema 2.21 (Eulero 1736). Per ogni grafo semplice G = (V, E) si ha


X
d(v) = 2|E| .
v∈V

Dimostrazione. Ciascun lato vw contribuisce due volte alla somma dei gradi:
una volta come d(v), l’altra come d(w).

Corollario 2.22. La somma dei gradi dei vertici è pari.

Corollario 2.23. Il numero dei vertici di grado dispari è pari.

Si noti che il grado di un vertice e che il grado minimo sono invarianti:


grafi isomorfi hanno stesso grado per ogni vertice e stesso grado minimo.
Il problema dei ponti di Könisberg ha suggerito le seguenti definizioni.
Definizione 2.24. Sia G = (V, E, I) un grafo non necessariamente semplice.
Una passeggiata in G (inglese walk) è una successione di vertici (non neces-
sariamente distinti) v0 , v1 , . . . , vk ∈ V tali che {vi−1 , vi } siano incidenti un
lato per ogni i = 1, . . . , k. I due vertici v0 e vk sono l’inizio e la fine della
passeggiata. Se tutti i vertici sono distinti si parla più propriamente di cam-
mino (inglese path). Se invece v0 = vk , ma gli altri vertici sono distinti, si
parla di ciclo. Una pista (inglese trail) è una passeggiata nella quale nessun
lato è ripetuto. Se il primo ed ultimo vertice coincidono si parla di circuito.
Un grafo si dice connesso se per ogni coppia di vertici distinti v, w esiste un
cammino che inizia in v e termina in w.
Una passeggiata può visitare un dato vertice più di una volta od anche
percorrere un lato più di una volta. Una pista euleriana, rispettivamente un
circuito euleriano, è un cammino, rispettivamente un circuito, che percorre
tutti i lati del grafo esattamente una volta. Un grafo è euleriano se possiede
almeno un circuito euleriano.
Con queste definizioni Il problema dei ponti di Könisberg rientra nel
seguente problema di teoria dei grafi:

determinare condizioni necessarie e sufficienti affinchè un grafo


sia euleriano.

Teorema 2.25. Un grafo connesso G è euleriano se e solo se ogni vertice


ha grado pari.
2.7. Il linguaggio della teoria dei grafi 29

Dimostrazione. Supponiamo che G sia euleriano. Ogni vertice che compaia


k volte in un circuito euleriano deve avere grado 2k (a ciascuna entrata nel
vertice deve corrispondere una uscita). Quindi la necessità della condizione.
Viceversa, supponiamo che G sia connesso e che abbia tutti i vertici di
grado pari. Sia P = v0 v1 . . . vk una passeggiata massimale (cioè non conte-
nuta propriamente in un’altra passeggiata) che attraversi ciascun lato al più
una volta. Poiché P non può essere estesa, essa già contiene tutti i lati inci-
denti vk . Per ipotesi il numero di questi lati è pari. Quindi necessariamente
v0 = vk , e dunque P è un circuito. Supponiamo che non sia euleriano. Allora
c’è un lato ` che non appartiene a P , ma che per l’ipotesi di connessione
deve essere incidente con un vertice di P ; poniamo ` = vvi . Allora il cammi-
no vvi vi+1 . . . vk v1 . . . vi contiene propiamente P , contraddicendo l’ipotesi di
massimalità.

Corollario 2.26. Il problema dei ponti di Könisberg non ha soluzione.

Infatti il grafo sempliceK, che descrive il problema, possiede 4 vertici di


grado 3.
30 Capitolo 2: Nozioni preliminari e notazioni
Capitolo 3

Combinatoria classica

Molti problemi della matematica, ma anche, e soprattutto, dell’informatica


e dell’ingegneria, richiedono di calcolare quanti siano (contare) gli oggetti
aventi certe proprietà. Ciò richiede che si scelgano elementi dell’insieme e il
concetto di scelta è fondamentale in combinatoria. Una scelta di k elementi di
un insieme di n elementi si chiama una configurazione combinatoria. Prima
di introdurre e studiare queste configurazioni combinatorie, vediamo alcune
tecniche elementari per contare.

3.1 Tecniche elementari per contare


Queste tecniche si basano su alcuni fatti di teoria elementare degli insiemi e
sul concetto di applicazione.
Proposizione 3.1 (Regola dell’addizione). Se un insieme T può ripar-
tirsi in k s.i.P
disgiunti Ci , i = 1, . . . , k e la classe Ci consiste di ni elementi,
allora |T | = ki=1 ni .
Questo principio è la traduzione del fatto che se su un insieme finito
T si definisce una relazione di equivalenza,Pk se k è il numero delle classi di
equivalenza Ci e |Ci | = ni , allora |S| = i=1 ni . In altro modo: Se C1 , C2 ,
. . . , Ck sono sottoinsiemi di uno stesso insieme a due a due disgiunti, allora

|C1 ∪ C2 ∪ · · · ∪ Ck | = |C1 | + |C2 | + · · · + |Ck | . (3.1)

Proposizione 3.2 (Regola della moltiplicazione). Se per determinare


|T | si trova un procedimento che si spezza in m passi ordinati, tali che per
il passo i si abbiano ni opzioni indipendenti dalle precedenti, allora |T | =
n1 n2 . . . nm .
32 Capitolo 3: Combinatoria classica

Questa regola corrisponde alla proprietà:

|S1 × S2 × · · · × Sm | = |S1 ||S2 | . . . |Sm | .

Proposizione 3.3 (Doppio conteggio). Se lo stesso insieme può essere


contato in due modi diversi, allora i risultati sono uguali.
Si tratta di un principio “ovvio”. Nondimeno è ampiamente usato.
In termini di matrici il principio si esprime così. Sia M una matrice n×m
i cui elementi siano 0 ed 1. Sia ri il numero di 1 della riga i−esima e cj il
numero di 1 della colonna j−esima. Allora se t è il numero totale di 1 presenti
in M , risulta
Xn Xm
t= ri = cj . (3.2)
i=1 j=1

Questo principio si applica per lo più per contare coppie ordinate. Lo si


può formalizzare al modo seguente.
Proposizione 3.4. Siano A = {a1 , . . . , am } e B = {b1 , . . . , bn } due insiemi
e sia S un sottoinsieme di A × B. Supponiamo che per i = 1, . . . , m, l’ele-
mento ai sia il primo componente di xi coppie di S, mentre, per j = 1, . . . , n,
l’elemento bj sia il secondo componente di yj coppie di S. Allora
m
X n
X
|S| = xi = yj .
i=1 j=1

Vedremo diverse applicazioni di questa formulazione del principio del


doppio conteggio. Partiamo con un esempio molto semplice.
Lemma 3.5 (Il lemma delle strette di mano). Il numero degli invitati ad un
ricevimento che stringono la mano un numero dispari di volte è pari.
Dimostrazione. Si suppone che ciascun invitato non stringa la mano a se
stesso e che due invitati non si stringano la mano più di una volta.
Siano a1 , a2 , . . . , an gli invitati. Sia S l’insieme delle coppie (ai , aj ) di
invitati che si stringono la mano e siano xi il numero di volte che ai stringe
la mano e y ilPnumero totale di strette di mano. Da una parte il numero
delle coppie è ni=1 xi , dato che per ciascun ai il numero di scelte è xi . D’al-
tra parte ciascuna stretta di mano determina due coppie: (ai , aj ) e (aj , ai );
pertanto il totale è 2y. Dunque
n
X
xi = 2y .
i=1
3.1. Tecniche elementari per contare 33

Siano a1 , . . . , ak gli invitati che stringono la mano un numero dispari di volte.


Allora x1 , . . . , xk sono numeri dispari, mentre xk+1 , . . . , xn sono pari. Quindi

n
X k
X n
X
xi = xj + xs = 2y .
i=1 j=1 s=k+1

Poiché ns=k+1 xs è pari, allora kj=1 xj deve essere pari e dunque k è pari
P P
(se sommiamo un numero dispari di numeri dispari, la somma è sempre
dispari).

Questo lemma è anche conseguenza di una più generale identità. Sia F


una famiglia di s.i. di un insieme X. Se x ∈ X, definiamo grado di x (rispetto
ad F) il numero degli elementi di F che contengono x. Lo denoteremo con
d(x). Definiamo anche la matrice d’incidenza di F come la matrice M =
(mx,A )x∈X ,A∈F tale che
(
1 se x ∈ A
mx,A =
0 se x ∈
/A

Si tratta di una matrice le cui entrate sono 0 oppure 1 e si compone di |X|


righe e |F| colonne.
Si ha la seguente identità:

Proposizione 3.6. Sia F una famiglia di s.i. di X. Allora


X X
d(x) = |A| . (3.3)
x∈X A∈F

Dimostrazione. Sia M la mtrice di incidenza di F. Allora d(x) è precisamente


il numero di 1 che compaiono nella riga x−sima e |A| è il numero di 1 presenti
nella colonna A−esima.

Si ha una immediata applicazione ai grafi. Un grafo infatti individua una


famiglia di s.i. ciascuno di cardinalità 2 (i suoi lati) e d(x) è il grado del
vertice x. Quindi ritroviamo il Teorema di Eulero (Teorema 2.21)

Teorema 3.7 (Eulero 1736). In ogni grafo la somma dei gradi dei suoi
vertici è due volte il numero dei suoi lati e, quindi, è pari.
34 Capitolo 3: Combinatoria classica

3.2 Il principio della media


In molte situazioni si ha una famiglia di n oggetti, l’i−esimo dei quali ha
“misura” mi , con mi numero reale non negativo, e si vuole conoscere se
almeno uno degli oggetti ha misura abbastanza grande, cioè se la sua misura
è mi ≥ t, per qualche assegnato numero reale t. Un modo per affrontare
P questione è quello di calcolare la media aritmetica delle misure m =
tale
( ni=1 mi )/n e cercare di dimostrare che m ≥ t. Infatti ciò è conseguenza del
seguente principio:

Proposizione 3.8 (Il principio della media). Se R = {m1 , m2 , . . . , mn }


è un insieme di numeri reali e m è la loro media aritmetica, allora esistono
mi , mj ∈ R tali che mi ≥ m e mj ≤ m.

La dimostrazione è estremamente facile. Ciò nonostante vi sono appli-


cazioni del metodo che producono risultati per nulla banali. Ne forniamo
un esempio. Molti altri saranno incontrati in seguito quando tratteremo del
metodo probabilistico di cui il principio della media è un prototipo.

Proposizione 3.9. Sia G = (V, E) un grafo con n vertici. Se G è connesso,


allora |E| ≥ n − 1, cioè G ha almeno n − 1 lati.

Dimostrazione. La dimostrazione è per contrapposizione; dimostreremo cioè


che un grafo su n vertici con meno di n − 1 lati è sconnesso.
Procediamo per induzione. Nei casi n = 1 e n = 2 l’affermazione è banale.
Supponiamo allora n ≥ 3 e di aver dimostrato l’affermazione per i grafi su
n − 1 vertici. Sia G = (V, E) un grafo avente |V | = n e |E| ≤ n − 2. Per il
teorema di Eulero (Teorema 3.7) il grado medio dei suoi vertici è

1 X 2|E| 2(n − 2)
d(x) = ≤ < 2.
|V | |V | n
x∈V

Per il principio della media qualche vertice ha grado 0 oppure 1. Se d(x) = 0,


allora {x} è una componente disgiunta da G \ {x} e dunque G è sconnesso.
Sia allora d(x) = 1 e sia y l’unico vertice congiunto con x. Il grafo H ottenuto
da G togliendo x e l’unico lato xy ha |V | − 1 = n − 1 vertici e |E| − 1 ≤
(n − 2) − 1 = n − 3 lati. Per l’ipotesi induttiva H è sconnesso. Sia C la
componente connessa di H contenente y; si noti che C è un sottoinsieme
proprio di vertici. Allora C ∪ {x} è una componente connessa di G, che non
può coindere con l’insieme dei vertici di G. Pertanto anche G è sconnesso.
3.3. Configurazioni combinatorie 35

3.3 Configurazioni combinatorie


Sia S un insieme finito di cardinalità n. Abbiamo definito configurazione
combinatoria ogni scelta di k elementi di S soggetti a certe regole. A seconda
delle regole, ovviamente, si avranno tipi diversi di configurazioni. Un modello
(schema mentale) può essere quello di pensare ad S come ad un’urna conte-
nente n palline. Una scelta di k elementi corrisponde ad una estrazione di k
elementi. Si intuiscono che tipo di regole sono da prendere in considerazione.
Innanzitutto tratteremo il caso in cui gli elementi di S sono distinguibili
(si dice anche che gli elementi di S sono etichettati). Una etichettatura di S è
una corrispondenza biunivoca di [n] con S. Se x : [n] → S è una etichettatura
allora
S = {x(1), x(2), . . . , x(n)}
oppure
S = {x1 , x2 , . . . , xn }
sono due possibili modi per distinguere gli elementi di S. Si passa da una
etichettatura ad un’altra tramite biiezioni di S con se stesso (figura 3.1).

[n]
x /S

f
f ◦x
 
S

Figura 3.1: Etichettature

Se S è stato etichettato, i suoi n elementi possono identificarsi con una


n−pla ordinata. Una scelta di k elementi di S è una k−pla, che potremo
considerare ordinata oppure non ordinata. Inoltre possono essere, oppure non
essere, permesse ripetizioni. Si hanno in tal modo due tipi di configurazioni,
ciascuna delle quali può essere con ripetizioni oppure senza ripetizioni:
(
con ripetizioni: disposizione con ripetizione
k−pla ordinata
senza ripetizioni: k−permutazione
(
con ripetizioni: combinazione con ripetizione
k−pla non ordinata
senza ripetizioni: combinazione
Conteremo il numero delle configurazioni di ciascun tipo usando ra-
gionamenti di tipo combinatorio, cioè argomenti che utilizzano nozioni di
appartenenza e usano corrispondenze biunivoche.
36 Capitolo 3: Combinatoria classica

3.3.1 Disposizioni con ripetizione


Una disposizione con ripetizione di classe k di n elementi è una configu-
razione consistente di una k−pla ordinata di elementi di S con ripetizioni.
Vogliamo contare quante siano. Cominciamo con la seguente osservazione.

Proposizione 3.10. Le disposizioni di classe k di n elementi sono in corri-


spondenza biunivoca con l’insieme delle applicazioni di [k] con S.

Dimostrazione. Se (xi1 , . . . , xik ) è una disposizione di classe k, allora essa


è l’immagine dell’applicazione f : [k] → S tale che f (s) = xis , per ogni
s ∈ [k]. Viceversa ogni applicazione determina, tramite la sua immagine,
una disposizione di classe k.

Siamo ricondotti allora a contare il numero delle applicazioni tra due


insiemi finiti.

Proposizione 3.11. Il numero delle applicazioni dall’insieme


A all’insieme B = è |B||A| .

Dimostrazione. Sia |A| = k e |B| = n. Per determinare il numero N delle


applicazioni tra essi, si osservi che ciascuna applicazione f : A → B viene
costruita tramite un procedimento formato da k passi, dove il passo i consiste
nel fissare il valore f (ai ), ove ai ∈ A ed i = 1, . . . , k. Potendosi scegliere
f (ai ) ∈ B in n modi, si ottiene N = n · n · · · · · n = nk (il prodotto k volte
di n).

Corollario 3.12. Il numero delle disposizioni con ripetizione di classe k


di n elementi è nk .

3.3.2 Disposizioni senza ripetizioni o k−permutazioni


Una disposizione senza ripetizioni di classe k di n elementi è una k−pla
ordinata di elementi distinti. Per semplicità parleremo anche di k−permu-
tazione. Una n−permutazione viene più semplicemente detta permutazione.
Con ragionamento analogo a quello svolto nel paragrafo precedente, queste
configurazioni sono in corrispondenza biunivoca con le applicazioni iniettive
di [k] in S.

Proposizione 3.13. Il numero N delle applicazioni iniettive da A = {a1 , . . . , ak }


in B = {b1 , . . . , bn }, ove k ≤ n è

N = n(n − 1)(n − 2) . . . (n − k + 1) .
3.3.3. Combinazioni e coefficienti binomiali 37

Dimostrazione. Ragionando come nella Proposizione (3.11), se f : A → B è


iniettiva, allora f (a1 ) può essere scelto in n modi, f (a2 ) può essere scelto
in n − 1 modi (deve essere f (a1 ) 6= f (a2 )), f (a3 ) può essere scelto in n − 2
modi diversi, in generale f (ai ) può scegliersi in n − i + 1 modi, essendo i − 1
elementi di B già impegnati. Pertanto N = n(n−1)(n−2) . . . (n−k +1) .

Denoteremo il numero delle k−permutazioni di n elementi con D(n, k).


Come immediata applicazione si ha
Corollario 3.14. Il numero delle permutazioni di n elementi è
n(n − 1)(n − 2) . . . 2 · 1 .
Si definisce
n! := n(n − 1)(n − 2) . . . 2 · 1 ,
che si legge fattoriale di n. Per convenzione si pone 0! = 1.
Servendosi del fattoriale
n!
D(n, k) = .
(n − k)!

3.3.3 Combinazioni e coefficienti binomiali


Studiamo ora le combinazioni, cioè le k−ple non ordinate di elementi di
S. Cominciamo dal caso delle combinazioni senza ripetizioni. Scegliere k
elementi di S senza ripetizioni e senza tener conto dell’ordinamento significa
prendere un sottoinsieme di S di cardinalità k. Dunque ogni combinazione
di questo tipo corrisponde ad un sottoinsieme di cardinalità k. Denotiamo
con C(n, k) il numero di queste configurazioni. Questo numero viene anche
indicato con il simbolo  
n
k
detto coefficiente binomiale, per il motivo che vedremo frapoco.
Cominciamo con il determinare formule esplicite per nk . Ricordiamo che
C(n, k) conta il numero dei s.i. di cardinalità k di un insieme di cardinalità
n.
Proposizione 3.15.    
n n
= = 1. (3.4)
0 n
Dimostrazione. Infatti, ogni insieme ha esattamente un sottoinsieme di car-
dinalità 0 (l’insieme vuoto ∅) ed un sottoinsieme coincidente con se stes-
so.
38 Capitolo 3: Combinatoria classica

Proposizione 3.16.    
n n
= . (3.5)
k n−k
Dimostrazione. C’è una corrispondenza biunivoca tra la famiglia dei sottoin-
siemi di cardinalità k e la famiglia di quelli di cardinalià n−k (al sottoinsieme
X ⊆ S si associ il sottoinsieme S \ X).

Proposizione 3.17.
     
n+1 n n
= + . (3.6)
k k k−1

Dimostrazione. Possiamo ragionare su [n + 1]. I sottoinsiemi di cardinalità


k di [n + 1] si suddividono in quelli che contengono n + 1 e quelli che non lo
contengono. Il numero dei sottoinsiemi del primo gruppo uguaglia il numero
dei sottoinsiemi di [n] di cardinalità k − 1, mentre il numero di quelli del
secondo gruppo uguaglia il numero dei sottoinsiemi di [n] di cardinalità k.
Trattandosi di una partizione, si può usare la regola dell’addizione ed ottenere
la formula.

La formula (3.6), che è una formula ricorsiva, permette di costruire il


cosiddetto triangolo di Pascal1 .

Figura 3.2: Blaise Pascal

Viene costruito ipotizzando di voler disegnare un triangolo isoscele al-


l’interno del quale vengono scritti dei numeri, egualmente spaziati su righe.
La riga n + 1−esima si compone di una (n + 1)−pla ordinata di numeri, il
k−esimo dei quali, per 2 ≤ k ≤ n, si ottiene sommando il (k − 1)−esimo con
il k−esimo della riga precedente, mentre il primo e l’ultimo valgono 1.

Proposizione 3.18. Per ogni k, n ∈ N:


   
n n−1
k =n . (3.7)
k k−1

Dimostrazione. Sia A un insieme con |A| = n. Dimostriamo la (3.7) contando


il numero degli elementi dell’insieme

S = {(x, X) | x ∈ X ⊆ A , |X| = k}
1
Informazioni biografiche su Blaise Pascal:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Pascal.html
3.3.3. Combinazioni e coefficienti binomiali 39

1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1

Figura 3.3: Il triangolo di Pascal

in due modi diversi: un modo ci darà il primo membro della (3.7), l’altro
modo il secondo membro. Se fissiamo l’elemento x, ci sono k−1 altri elementi
di X da scegliere tra n − 1 elementi. In altre parole, ci sono n−1
k−1 coppie
(x, X) ∈ S che hanno x fissato. Poiché |A| = n, si ha
 
n−1
|S| = n .
k−1

Questo è il secondo membro. D’altra parte, se fissiamo un sottoinsieme di A


avente k elementi, allora ci sono k coppie (x, X) ∈ S che hanno X fissato.
Poiché il numero dei sottoinsiemi con k elementi è nk , si ha
 
n
|S| = k ,
k

che è il primo membro. Uguagliando le due espressioni si trova l’uguaglianza


voluta.

n

La formula (3.7) ci permette di avere una formula esatta per k . Si ha
cioè:

Proposizione 3.19.
 
n n(n − 1)(n − 2) . . . (n − k + 1)
= . (3.8)
k k!

Dimostrazione. Infatti la (3.7) scritta come


   
n n−1
=n /k
k k−1
40 Capitolo 3: Combinatoria classica

è una formula ricorsiva che produce


   
n n−1
=n /k
k k−1
 
n−2
= n(n − 1) /k(k − 1)
k−2
 
n−3
= n(n − 1)(n − 2) /k(k − 1)(k − 2)
k−3
= n(n − 1)(n − 2) . . . (n − k + 1)/k(k − 1)(k − 2) . . . 1
n(n − 1)(n − 2) . . . (n − k + 1)
=
k!

Si osservi che la formula precedente può anche scriversi


 
n n!
= . (3.9)
k k!(n − k)!

La formula (3.8) può ottenersi anche ragionando in questo modo. Un


s.i. di cardinalità k di A determina k! disposizioni. Il numero complessivo
delle applicazioni iniettive di [k] in A è D(n, k). Quindi il numero dei s.i. di
cardinalità k di A è D(n, k)/k!.

3.3.4 Il teorema del binomio


Si tratta di un risultato molto antico. Di esso forniremo una dimostrazione
puramente combinatoria.

Teorema 3.20. Siano a, b ∈ C e sia n ∈ N. Allora vale l’identità:


n  
n
X n n−k k
(a + b) = a b . (3.10)
k
k=0

Dimostrazione. Sviluppiamo (a + b)n = (a + b)(a + b) . . . (a + b). Si hanno


in tutto n fattori. Se il termine b è scelto da alcuni dei fattori, allora a viene
scelto dagli altri. Quindi moltiplicando tra loro gli a e i b scelti, facendo ciò
in tutti i modi possibili e quindi sommando i termini che si ottengono si
perviene allo sviluppo desiderato. Il termine an−k bk si ottiene scegliendo b
da k dei fattori e a dai rimenenti n − k. Perciò an−k bk compare nk volte,


donde la formula.
3.3.4. Il teorema del binomio 41

Questa che abbiamo dato è una tipica dimostrazione combinatoria. Per


esercizio si dia una dimostrazione per induzione.
Una formulazione significativa del Teorema del binomio si ha ponendo
a = 1 e b = x, variabile o indeterminata:
n  
n
X n k
(1 + x) = x . (3.11)
k
k=0

Questa si può leggere così: nk è il coefficiente di xk del polinomio (1 + x)n ,




per k = 0, 1, . . . , n. Vedremo come si potrà sviluppare questa osservazione


nel capitolo dedicato alle funzioni generatrici.
Il coefficiente binomiale può definirsi anche se n è un numero reale (o
complesso) qualunque. Sia α ∈ R e k ∈ N Si definisce
 
α α(α − 1)(α − 2) . . . (α − k + 1)
:= . (3.12)
k k!
Ci chiediamo allora se vale una formula analoga a quella del Teorema del
binomio nella sua versione espressa dalla (3.11). Ci chiediamo cioè se ha un
qualche significato l’identità
X α
α
(1 + x) = xk . (3.13)
k
k∈N

/ N, allora αk 6= 0, sicchè il secondo membro



Osserviamo subito che se α ∈
della (3.13) è una serie infinita. Quindi per prima cosa dobbiamo chiederci
se essa converge. Se si applica il criterio del rapporto, la serie converge se
la successione dei rapporti tra termini consecutivi converge ad un numero
minore di 1. Ora α 

k+1 α − k
α |x| = |x| → |x|
k k +1
(per k → ∞). Quindi la serie converge se |x| < 1. In effetti converge as-
solutamente. Possiamo allora dimostrare il cosiddetto Teorema del binomio
generalizzato:
Teorema 3.21. Per |x| < 1 la serie
∞  
X α k
x
k
k=0
converge assolutamente e risulta
∞  
X α k
(1 + x)α = x .
k
k=0
42 Capitolo 3: Combinatoria classica

Dimostrazione. Abbiamo già visto che la serie converge assolutamente. Sia


f (x) la sua somma e poniamo

f (x)
g(x) = .
(1 + x)α

La serie converge assolutamente per |x| < 1; quindi possiamo derivarla


termine a termine, trovando:
X α 
0
f (x) = k xk−1 .
k
k∈N0

α α α
  
Poiché (esercizio) (k + 1) k+1 +k k =α k , allora

(1 + x)f 0 (x) = αf (x) .

Derivando g(x) si trova g 0 (x) ≡ 0. Quindi g(x) è costante e poiché g(0) =


f (0) = 1, si ha g(x) = 1 per ogni x, cioè f (x) = (1 + x)α .

3.3.5 Combinazioni con ripetizioni


Calcoliamo il numero delle combinazioni con ripetizioni di classe k di n
elementi.
Proposizione 3.22. Il numero delle combinazioni con ripetizione di classe
k di n elementi è
   
n+k−1 n+k−1
V (n, k) = = (3.14)
k n−1
Dimostrazione. Prima dimostrazione. Riportiamo una dimostrazione resa
popolare da xxxx. Si basa sulla seguente situazione. Si hanno a disposizione k
caramelle tutte uguali fra loro (indistinguibili) che vogliamo distribuire ad n
bambini (etichettati come b1 , b2 , . . . , bn ). L’idea è la seguente: dispongo una
riga di n+k −1 quadratini  e ne contrassegno n−1 di essi (), di modo che
le x1 caramelle che precedono il primo  vanno al bambino b1 , le xi caramelle
comprese tra l’(i − 1)−esimo e i−esimo segno  sono assegnate al bambino
bi , per 2 ≤ i ≤ n − 1, infine le xn caramelle che seguono l’ultimo  vanno
all’n−esimo bambino bn . È chiaro che xi ≥ 0. Inoltre è altrettanto chiaro
che il numero delle possibili distribuzioni di caramelle uguaglia il numero
di quadrati che posso contrassegnare e questo numero è il numero dei s.i.
di cardinalità k di un insieme con n + k − 1 elementi. Quindi la formula
cercata.
3.3.5. Combinazioni con ripetizioni 43

Questa dimostrazione è anche costruttiva.


♣ Esempio 3.23.
 La formula delle combinazioni con ripetizioni nel caso n = 3
e k = 4 dà 62 = 15. Le scriviamo esplicitamente, seguendo la dimostrazione.

 ,  ,  ,  , 

 ,  ,  ,  ,


 ,  ,  ,
 ,  ,


Questa dimostrazione ha anche un’altra notevole applicazione.
Teorema 3.24. Il numero delle soluzioni in N0 dell’equazione lineare

x1 + x2 + · · · + xn = k

con k intero positivo uguaglia il numero delle combinazioni con ripetizioni di


classe k di n oggetti.
Dimostrazione. Indichiamo con 1, 2, . . . , n gli elementi di cui vogliamo cal-
colare le combinazioni. Sia N (i) il numero di volte che l’elemento i compare
nell’insieme di tutte le combinazioni. Si ha

N (i) = N per ogni i ∈ [n] ,

cioè questo numero non dipende da i (infatti se in una combinazione l’elemen-


to i compare nei posti i1 , i2 , . . . , is negli stessi posti di un’altra combinazione
deve comparire l’elemento j).
Ora il numero dei simboli è n e ciascuno di essi compare N volte. Per-
tanto nN è il numero di volte che gli n simboli compaiono nelle V (n, k)
combinazioni. Poiché ogni combinazione si compone di k simboli, si ha

nN = kV (n, k) . (3.15)

Questa equazione può anche essere scritta come


kV (n, k)
N= . (3.16)
n
Determiniamo ora N in un altro modo. Fissiamo il simbolo n e contiamo le
combinazioni in cui n compare almeno una volta. Se da ciascuna di queste
44 Capitolo 3: Combinatoria classica

combinazioni cancelliamo l’elemento n, si ottengono le combinazioni con ri-


petizione di classe k −1 di n elementi, che sono V (n, k −1) in numero. Quindi
le combinazioni dove n compare sono V (n, k − 1) e in esse l’elemento vi com-
pare (k − 1)V (n, k − 1)/n volte (cfr. la (3.16)). Osserviamo che l’elemento n
è stato cancellato V (n, k − 1) volte. Pertanto
(k − 1)V (n, k − 1)
N = V (n, k − 1) + . (3.17)
n
Uguagliando alla (3.16), dopo un facile passaggio algebrico si ottiene la
formula ricorsiva:
kV (n, k) = (n + k − 1)V (n, k − 1) , (3.18)
per ogni k ≥ 2; ovviamente V (n, 1) = n. Scriviamo questa formula come
V (n, k) = (n + k − 1)V (n, k − 1)/n ed iteriamola:

(n + k − 1)V (n, k − 1) (n + k − 1) (n + k − 2)V (n, k − 2)


= = ...
k k k−1
(n + k − 1)(n + k − 2) . . . (n + 1)V (n, 1)
··· = =
k(k − 1) . . . 1
(n + k − 1)(n + k − 2) . . . (n + 1)n
k!
donde la formula cercata.

Se si impone l’ulteriore condizione di essere suriettiva allora il loro numero


è  
0 n−1
V (n, k) = . (3.19)
m−1

3.4 Una raccolta di esercizi


Si chiede di risolvere gli esercizi utilizzando argomenti combinatori. I simboli
n, m, k, r denotano interi non negativi.
F Esercizio 3.25. 1. Dimostrare che vale l’identità (identità di Vander-
monde)
  Xr   
m+n m n
= .
r k r−k
k=0

2. Dimostrare l’identità
  n  
n+1 X k
= .
r+1 r
k=r
3.4. Una raccolta di esercizi 45

3. Dimostrare che
n−1
X
n
2 −1= 2k .
k=0

4. Dimostrare che sussiste l’identità


   
n n−1
k =n .
k k−1

5. Verificare che      
n k n n−t
= .
k t t k−t

6. Dimostrare che
n     
X n n−k n m
=2 .
k m−k m
k=0

7. Dimostrare che vale l’identità


n  
X n
k = n2n−1 .
k
k=0

8. Dimostrare che vale l’identità


n  
2 n
X
k = n(n − 1)2n−2 + n2n−1 .
k
k=0

9. In quanti modi si possono scegliere k degli interi 1, 2, . . . , n in modo


che mai due interi scelti siano consecutivi?
Soluzione: Sia x1 < x2 < · · · < xk una scelta. Allora x1 ≥ 1, x2 − x1 ≥
2, . . . , xk − xk−1 ≥ 2. Si definisca

y1 = x1 , yi = xi − x − i − 1 , 2 ≤ i ≤ k , yk+1 = n − xk + 1 .

Allora gli yi sono interi positivi e k+1


P
i=1 yi = n−r +2. Tenendo in conto
del numero delle
 soluzioni in interi positivi di una equazione lineare, si
hanno n−k+1k soluzioni.

10. In quanti modi si possono disporre k1 palline di colore 1, k2 palline di


colore 2, . . . , km palline di colore m in una successione di lunghezza
n = k1 + k2 + · · · + km ?
46 Capitolo 3: Combinatoria classica

Soluzione: Ci sono n! successioni che posso formare e ogni permutazione


delle ki palline di colore i, con 1 ≤ i ≤ m, produce la stessa successione
(le ki palline hanno tutte lo stesso colore e quindi sono indistinguibili).
Pertanto il numero richiesto è
n!
.
k1 !k2 ! · · · km !

11. Sia S un insieme di n elementi. Calcolare


X
N= |A| .
A∈P(S)

n

Soluzione: Vi sono k s.i. di cardinalità k. Pertanto dobbiamo calcolare
n  
X n
k .
k
k=0

Si pensi ad x come a duna variabile reale, allora dall’identità espressa


dal teorema del binomio, derivando (1 + x)n si trova
n  
X n k−1
k x = n(1 + x)n−1 .
k
k=1

La sostituzione x = 1 dà il risultato

N = n2n−1 .

Una più rapida, e apparentemente più elementare, soluzione è la se-


guente. Un s.i. A e il suo complementare insieme contengono n elementi
(ovvio!) e ci sono esattamente 2n−1 tali coppie.
F

3.5 Il principio di inclusione/esclusione


Il principio di inclusione/esclusione si applica per contare il numero degli
elementi di un insieme unione di insiemi finiti. Precisamente, se A1 ,. . . , An
sono insiemi finiti, si voglia calcolare |A1 ∪ · · · ∪ An |.
Teorema 3.26 (Principio di inclusione/esclusione).
n
X X
|A1 ∪ A2 ∪ · · · ∪ An | = (−1)k+1 |Ai1 ∩ · · · ∩ Aik | .
k=1 1≤i1 <···<ik ≤n
3.5. Il principio di inclusione/esclusione 47

C’è anche una formulazione equivalente, nota come metodo del crivello:

Teorema 3.27 (Metodo del crivello). Siano A1 , A2 ,. . . , An s.i. dell’insieme


finito A. Allora
 
[n Xn X
A \ Ai = |A| −  (−1)j+1 |Ai1 ∩ · · · ∩ Aij | , (3.20)


i=1 j=1 1≤i1 <···<ij ≤n

ove la sommatoria interna è eseguita su tutte le j−ple di numeri naturali


(i1 , i2 , . . . , ij ) tali che 1 ≤ i1 < · · · < ij ≤ n , con j = 1, . . . , n.

Dimostrazione. Sia x ∈ A. Supponiamo che x appartenga esattamente a k


dei sottoinsiemi A1 , . . . , An (con 0 ≤ k ≤ n). Non è restrittivo supporre
che x appartenga ai primi k s.i., cioè x Sn∈ A1 , . . . , Ak , ma x ∈ / Ak+1 , . . . , An .
Supponiamo che k = 0. Allora x ∈ A\ r=1 Ar e quindi contribuisce una sola
volta al primo membro della (3.20) e, chiaramente, una sola volta al secondo
/ A \ nr=1 Ar . Quindi x contribuisce 0
S
membro. Sia allora k ≥ 1. Si ha x ∈
volte al primo membro della (3.20). Mostriamo che 0 è anche il contributo
al secondo membro.
Il numero delle s−ple (1 ≤ s ≤ k) di interi (i1 , . . . , is ) tali che 1 ≤ i1 ≤
· · · ≤ is ≤ k sono ks e se x appartiene ai s.i. A1 , . . . , Ak allora è anche


x ∈ Ai1 ∩ · · · ∩ Ais

ove 1 ≤ i1 ≤ · · · ≤ is ≤ k. Quindi nel membro di destra della (3.20) il


contributo di x vale:

k k
"  # "  #
X k X k
1− (−1)s+1 =1− 1− (−1)s =
s s
s=1 s=0
1 − [1 − (1 − 1)k ] = 1 − 1 = 0

(nel penultimo passaggio si utilizza il teorema del binomio).

♥ Osservazione 3.28. (1) Si dimostri per esercizio l’equivalenza dei due


enunciati.
(2) Il Teorema 3.27 è noto come metodo del crivello per il seguente mo-
tivo. Dato un insieme A si vogliono eliminare da A gli elementi verificanti
la proprietà P1 , quelli che verificano la proprietà P2 , e così via, quelli che
verificano la proprietà Pn . Vengono in tal modo a formarsiS i s.i. A1 , A2 , . . . ,
An . Si “setacciano” questi elementi e rimane l’insieme A \ ni=1 Ai .
48 Capitolo 3: Combinatoria classica

♣ Esempio 3.29. Il crivello di Eratostene. Si vuole determinate l’insieme di


tutti i numeri primi minori od uguali ad un prefissato intero n. Il numero di
questi elementi si denota con π(n). La funzione aritmetica π è una delle più
studiate in teoria dei numeri. Il crivello di Eratostene funziona così:
Scritti tutti i numeri naturali da 2 ad n compresi
Passo 1: si cancellino tutti i multipli di 2 a partire da 2 × 2;
Passo 2: si determini il primo intero p che non è stato cancellato
Passo 3: si cancellano quindi tutti i multipli di p a partire da p × 2;
Passo 4: si torni al passo 2.
I numeri che restano dopo questa procedura sono tutti e soli i numeri
primi minori od uguali ad n. Con il passo 3 “si passa al setaccio”.
Ad esempio se vogliamo determinare i numeri primi minori od uguali a
30, eliminiamo successivamente i multipli di 2, di 3 e di 5 e resta

{2, 3, 5, 7, 11, 13, 17, 19, 23, 29} .

Dunque π(30) = 10. Con il principio di inclusione/esclusione π(n) viene


calcolata nel modo seguente. Prima alcune premesse ed un’osservazione.
Se x ∈ R, definiamo parte intera di x, da denotare con bxc, il massimo
intero minore od uguale ad x. È facile verificare che, per ogni x reale e
positivo, x < bxc + 1
Proposizione 3.30. Il numero naturale n è primo se e solo non è divisibile

per alcun primo minore od uguale a b nc.

Dimostrazione. Siano p1 , . . . , pk i primi minori di b nc e supponiamo che
nessuno di essi divida n. Se n non fosse primo, allora ci sarebbero almeno
√ √
due primi p e q maggiori di b nc che dividono n. Allora p, q ≥ b nc + 1, e
quindi √
n ≥ pq ≥ ( n + 1)2 > ( n)2 = n
√ 

che è una contraddizione. Quindi n dev’essere primo. Il viceversa è banale


per definizione di primo.

Denotiamo con pi l’i−esimo numero primo, i = 1, 2, . . . . Sia A = {2, 3, . . . , n}


(si noti che |A| = n − 1) e sia

Ai = {x ∈ N | 2 ≤ x ≤ n , pi |x} .

Si osservi che |Ai | = bn/pi c. Sia m = b nc. L’insieme dei numeri primi
minori od uguali ad n è allora, in base alla Proposizione 3.30,

A \ (A1 ∪ A2 ∪ · · · ∪ Am ) .
3.5. Il principio di inclusione/esclusione 49

Pertanto per il principio di inclusione/esclusione si ha


 
Xm X
π(n) = (n − 1) −  (−1)j+1 |Ai1 ∩ · · · ∩ Aij | .
j=1 1≤i1 <···<ij ≤m

Si osservi che Ai1 ∩ · · · ∩ Aij è l’insieme dei numeri divisibili per pi1 , . . . pij e
che  
|Ai1 ∩ · · · ∩ Aij | = n/pi1 pi2 . . . pij .
Pertanto possiamo scrivere
 
Xm X
(−1)j+1
 
π(n) = (n − 1) −  n/pi1 pi2 . . . pij  . (3.21)
j=1 1≤i1 <···<ij ≤m

A titolo esemplificativo si verifichi che π(100) = 21.


Vale la pena di osservare che la formula (3.21) è difficile da trattare e
richiede comunque che si scrivano esplicitamente i numeri primi minori od

uguali a b nc. Ciò fa intuire che uno studio approfondito della funzione
aritmetica π sia estremamente difficile.
♣ Esempio 3.31. Il numero delle applicazioni suriettive tra insiemi finiti.
Siano A e B insiemi di cardinalità |A| = n e |B| = k, con n ≥ k.
Proposizione 3.32. Il numero delle applicazioni suriettive di S su T è
k  
X
j k
(−1) (k − j)n . (3.22)
j
j=0

Dimostrazione. Il numero che cerchiamo uguaglia il numero dei modi con


cui n palline etichettate con i numeri 1, 2, . . . , n possono essere distribuite
in k urne etichettate con i numeri 1, 2, . . . , k, senza che nessuna urna resti
vuota. Calcoliamo allora questo numero.
Sia A l’insieme di tutte le possibili distribuzioni di n palline in k urne.
Si osservi che A corrisponde biunivocamente con l’insieme di tutte le appli-
cazioni di S in T e pertanto |A| = k n (vedi Esempio 3.11). Sia Ai il s.i. delle
distribuzioni che lasciano vuota la i−esima urna, ove i = 1, 2, . . . , k. Si ha
 
n k
|Ai | = (k − 1) , con scelte per i
1
 
k
|Ai ∩ Aj | = (k − 2)n , con scelte per i < j
2
50 Capitolo 3: Combinatoria classica

in generale
 
k
|Ai1 ∩ · · · ∩ Aij | = (k − j)n , con scelte per 1 ≤ i1 < · · · < ij ≤ k .
j
Allora il numero delle applicazioni suriettive è

[k
A \ Ai .


i=1

Con il metodo del crivello


 
[k X k X
A \ Ai = |A| −  (−1)j+1 |Ai1 ∩ · · · ∩ Aij | =


i=1 j=1 1≤i1 <···<ij ≤k
 
k   k  
j+1 k j k
X X
n n
k −  (−1) (k − j) = (−1) (k − j)n .
j j
j=1 j=0

Osserviamo che il numero delle applicazioni suriettive è 0 se k > n,


mentre vale n! se k = n. Quindi dalla (3.22) si ha la formula
k   (
X k n! se k = n ,
(−1)j (k − j)n = (3.23)
j 0 se k > n .
j=0

Ci sono molte formule simili alla (3.23), spesso difficili da dimostrare


direttamente. In generale la presenza del termine (−1)j nella formula si-
gnifica che si stanno contando oggetti per mezzo del principio di inclusio-
ne/esclusione. Della precedente formula si può peraltro fornire anche una
diversa dimostrazione.
Sia P (x) un polinomio di grado n con coefficiente direttore an (è il
coefficiente diverso da zero di xn ). Costruiamo la successione

P = {P (k) | k ∈ N0 }

e quindi la successione delle differenze:

P1 = {P (i + 1) − P (i) | i ∈ N0 } .

Questa successione proviene dal polinomio P1 (x) = P (x + 1) − P (x), cha


ha grado n − 1 e coefficiente direttore nan . Iteriamo questa procedura e
otteniamo una successione di successioni Pk
3.5. Il principio di inclusione/esclusione 51

♣ Esempio 3.33. Permutazioni complete. Una permutazione di [n] è com-


pleta se non fissa alcun elemento. Vogliamo calcolare il loro numero. Sia A
l’insieme di tutte le permutazioni e sia Ai il s.i. delle permutazioni che fissano
l’elemento i, ove i ∈ [n]. Si ha |A| = n! e
 
n
|Ai | = (n − 1)! , con scelte per i
1
 
n
|Ai ∩ Aj | = (n − 2)! , con scelte per 1 ≤ i < j ≤ n
2
in generale
 
n
|Ai1 ∩ . . . Aij | = (n − j)! , con scelte per 1 ≤ i1 < · · · < ij ≤ n .
j

Con il metodo del crivello


   
n n n  
[ X X X n
A \ Ai = |A|− (−1)j+1 |Ai1 ∩ . . . Aij | = n!− (−1)j+1 (n − j)! =

j
i=1 j=1 1≤i1 <···<ij ≤n j=1
n n n
X X n! X 1
(−1)j (n − j)! = (−1)j = n! (−1)j .
j! j!
j=0 j=0 j=0

Si pone
n
X 1
Dn := n! (−1)k .
k!
k=0

Il numero Dn /n! ha interessanti applicazioni.


Il problema delle coincidenze (le problème des rencontres. Un’urna con-
tiene n palline etichettate da 1 ad n e vengono estratte una alla volta. Si
ha una coincidenza quando la pallina i è la i−esima estratta. Se Dn è il
numero delle permutazioni complete, allora Dn /n! può interpretarsi come la
frequenza relativa che non si abbia alcuna coincidenza. Per la legge forte dei
grandi numeri
n
Dn X 1
lim = lim (−1)k = e−1 .
n→∞ n! n→∞ k!
k=0

Quindi la probabilità che non si abbia alcuna coincidenza è e−1 .


52 Capitolo 3: Combinatoria classica

3.6 Partizioni
Sia S un insieme. Una partizione di S è una famiglia P di s.i. non vuoti di
S, a due a due disgiunti la cui unione è S. Gli elementi di P si chiamano le
parti della partizione. Sia |S| = n. Il numero di Bell B(n) è il numero delle
partizioni di S. Se P = {P1 , P2 , . . . , Pk } è una partizione di S, allora

|S| = n = |P1 | + |P2 | + · · · + |Pk | .

Dunque una partizione determina una partizione dell’intero n: cioè una suc-
cessione non crescente di interi positivi la cui somma è n. Il termine partizio-
ne viene dunque usato in due accezioni diverse. Il numero di partizioni p(n)
è il numero delle partizioni dell’intero n. Dunque p : N → N è una funzione
aritmetica. Il suo studio rientra nella cosiddetta teoria additiva dei numeri.
Ad esempio p(4) = 5, infatti

4 = 3 + 1 = 2 + 2 = 2 + 1 + 1 = 1 + 1 + 1 + 1;

p(5) = 6, infatti

5 = 4 + 1 = 3 + 2 = 3 + 1 + 1 = 2 + 1 + 1 + 1 = 1 + 1 + 1 + 1 + 1.

Torneremo più avanti su questa funzione.


Altri numeri rilevanti allo studio delle partizioni sono i numeri di Stirling
di 2a specie, denotati con S(n, k), che contano il numero delle partizioni di
[n] in k parti, con 1 ≤ k ≤ n. Se è k > n si pone per definizione S(n, k) = 0.
Vale la ovvia uguaglianza
n
X
B(n) = S(n, k) . (3.24)
k=1

È poco più di una osservazione il fatto che S(n, k) con 1 ≤ k ≤ n ugua-


glia il numero delle distribuzioni di n palline etichettate con 1, . . . , n in k
urne identiche, senza che nessuna urna resti vuota. Denotiamo con F (n, k)
il numero delle distribuzioni di n palline etichettate con 1, . . . , n in k urne
etichettate con 1, . . . , k, e ricordiamo che questo numero uguaglia il numero
delle applicazioni suriettive di [n] su [k]. Si ha dunque k!S(n, k) = F (n, k).
Tenendo conto della formula (3.22), si ottiene
k  
1 X k
S(n, k) = (k − i)n . (3.25)
k! i
i=0
3.7. Il principio dei cassetti 53

3.7 Il principio dei cassetti


Questo principio si basa sull’osservazione che se f : [n + 1] → [n] è un’ap-
plicazione, allora f non è iniettiva. Pertanto due elementi devono avere la
stessa immagine. Il principio dei cassetti (in inglese è pigeonhole principle)
nella sua versione più semplice si enuncia:

Teorema 3.34. Se n + 1 o più oggetti vengono posti in n cassetti, allora c’è


almeno un cassetto che contiene due o più oggetti.

La formulazione più generale possibile è la seguente:

Teorema 3.35 (Il principio dei cassetti). Se un insieme contenente più di


kn elementi è ripartito in n classi, allora almeno una classe possiede più di
k elementi.

La dimostrazione è banale: se ogni classe contenesse al più k elementi,


allora l’insieme avrebbe al più kn elementi.
Per quanto banale possa sembrare, questo principio ha numerose e non
banali applicazioni. Vedremo anche che quando si usa questo principio biso-
gna specificare bene chi sono gli oggetti e chi sono i cassetti.
Vediamo qualche esempio anche alla luce delle precedenti osservazioni.
♣ Esempio 3.36. Se sette distinti numeri vengono estratti da I =
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11}, allora ve ne sono due la cui somma
è 12.
Gli oggetti sono i numeri sorteggiati. I cassetti sono le coppie non or-
dinate di elementi di I, la cui somma è 12, e il sottoinsieme {6}. Scritti
esplicitamente: {1, 11}, {2, 10}, {3, 9}, {4, 8}, {5, 7}, {6}. Questi sottoinsie-
mi di I sono la partizione associata alla relazione di equivalenza su I che
afferma x equivalente ad y se e solo se x = y oppure x + y = 12. Ora estraia-
mo un numero e collochiamolo nella sua classe di equivalenza. Abbiamo sei
classi di equivalenza (i cassetti) e sette numeri estratti (gli oggetti). Per il
principio dei cassetti qualche cassetto contiene due oggetti. Per il modo con
cui i cassetti sono stati definiti, questi due numeri hanno per somma 12.
Veniamo ora ad applicazioni significative del principio. Cominciamo da
quella utilizzata da Dirichlet, da cui il principio prende il nome, concernente
l’esistenza di buone approssimazioni di numeri irrazionali per mezzo di nu-
meri razionali. Si tratta di un risultato che appartiene alla teoria dei numeri,
la cui dimostrazione è tipicamente combinatoria.
54 Capitolo 3: Combinatoria classica

Teorema 3.37 (Dirichlet 1879). Sia x un numero reale. Per ogni naturale
n, esiste un numero razionale p/q tale che 1 ≤ q ≤ n e

x − p < 1 ≤ 1 .

q nq q2

Dimostrazione. Denotiamo con {x} la parte frazionaria di x, cioè {x} =


x − bxc.
Se x è razionale non vi è nulla da dimostrare. Sia allora x irrazionale e
consideriamo gli n + 1 numeri {ax}, per a = 1, 2, . . . , n + 1. Poniamo questi
numeri negli n + 1 cassetti (intervalli aperti):
   
1 2
0, , f rac1n, , . . . , (f racn − 1n, 1) .
n n

Si noti che nessuno dei numeri {ax} cade in un estremo di questi intervalli,
poiché x è irrazionale. Per il principio dei cassetti qualche intervallo contiene
più di uno di questi numeri, e siano {ax} e {bx}, con a > b. La loro differenza
è allora minore di 1/n. Posto q = a − b, esiste un intero p tale che |qx − p| <
1/n, che implica |x − p/q| < 1/(nq). Inoltre, q è la differenza di due interi
dell’intervallo [1, n + 1], per cui q ≤ n.

Riportiamo ora due applicazioni ai grafi: una è elementare, l’altra, il


teorema di Mantel, abbastanza profonda.

Proposizione 3.38. In ogni grafo ci sono almeno due vertici con lo stesso
grado.

Dimostrazione. Dato un grafo G avente n vertici, consideriamo n cassetti


numerati da 0 a n − 1 e poniamo un vertice x nel cassetto k−esimo se
d(x) = k. Se qualche cassetto contiene più di un vertice, non vi è più nulla
da dimostrare. Supponiamo allora che nessun cassetto contenga più di un
vertice. Poiché vi sono n cassetti e n vertici, allora ogni cassetto contiene
esattamente un vertive. Siano x e y i vertici contenuti nel cassetto 0 e 1,
rispettivamente. Il vertice x ha grado 0 e quindi non è connesso con nessun
vertice, y incluso. D’altra parte y ha grado n − 1 e dunque è connesso con
ogni altro vertice, x incluso, e questa è una contraddizione.

Veniamo ora al teorema di Mantel, che tratta una tipica proprietà estre-
male dei grafi: quale è il massimo numero di lati di un grafo su n vertici privo
di triangoli? Un triangolo in un grafo è un insieme di tre vertici a due a due
adiacenti.
3.7. Il principio dei cassetti 55

♣ Esempio 3.39. Un grafo completo bipartito in due sottoinsiemi di vertici,


ciascuno di n vertici, possiede n2 lati ed è privo di triangoli.
Teorema
j 2k 3.40 (Mantel 1907). Se un grafo avente n vertici contiene più di
n
4 lati, allora G contiene un triangolo.

Dimostrazione. Procediamo per induzione.  2 Se è n = 3, un grafo G su 3


vertici ha al più 3 lati; se ne ha 3 = 3 /4 + 1, allora G è un triangolo.
Supponiamo allora che il teorema valga per tutti i grafi su n ≥ 3 vertici e
proviamolo vero per i grafi su n +1 vertici. Quindi, sia G un grafo su n + 1
vertici, avente almeno (n + 1)2 /4 +1 lati. Siano x ed y due vertici adiacenti
 indotto sui restanti vertici. H contiene n − 1 vertici
di G. Sia H il sottografo
e se possiede almeno (n − 1)2 /4 + 1 lati,
 non 2vi è più nulla da dimostrare.
Supponiamo allora che H abbia al più (n − 1) /4 lati. La differenza tra il
numero dei lati di G e quello di H è
(n + 1)2 (n − 1)2
   
+1− = n + 1.
4 4
Un lato è xy. Pertanto n lati di G sono ottenuti congiungendo x e y con i
vertici di H, che sono n − 1. Per il principio dei cassetti c’è un vertice z di
H adiacente sia ad x sia ad y. Pertanto {x, y, z} è un triangolo di G.

♣ Esempio 3.41. In una città di n abitanti, quanti conoscenti possono esserci


se sappiamo che tra k abitanti qualsiasi almeno due di essi non si conosco-
no? La risposta è data dal teorema di Mantel: al più n2 /4 . Basta infatti
considerare il grafo che ha per vertici gli abitanti e i lati sono le coppie di
conoscenti.
Il teorema di Mantel può generalizzarsi.
Un grafo completo è anche detto una clique.2 Se G è un grafo una
k−clique di G è un sottografo completo su k vertici. Ad esempio un triangolo
in un grafo è una 3−clique. Il teorema di Mantel afferma che se un grafo su n
vertici non ha 3−clique allora esso ha al più n2 /4 lati. Cosa possiamo dire se
k > 3. La risposta è il teorema di Turán, che ha originato la teoria estremale
dei grafi.
Teorema 3.42 (Turán 1941). Se un grafo G = (V, E) su n vertici non ha
k + 1−clique, con k ≥ 2, allora
1 n2
 
|E| ≤ 1 − . (3.26)
k 2
2
Potrebbe tradursi in italiano clicca, che più che altro è onomatopeico
56 Capitolo 3: Combinatoria classica

Dimostrazione. Procediamo per induzione su n. I casi n = 1 e n = 2 sono


banali. Il caso n = 3 e k = 2 è il teorema di Mantel. Supponiamo allora che la
diseguaglianza (3.26) sia vera per tutti i grafi su n − 1 vertici. Sia G = (V, E)
un grafo su n vertici privo di k + 1−clique e avente un numero massimale di
lati. Questo grafo contiene certamente k−clique, perché altrimenti potremmo
aggiungere un lato. Sia A una k−clique e poniamo B = V \ A.
Osserviamo che A contiene eA = k2 lati, trattandosi di un grafo com-
pleto. Sia eB il numero dei lati che congiungono vertici di B e sia eA,B il
numero di lati tra A e B. Per ipotesi induttiva

1 (n − k)2
 
eB ≤ 1 − .
k 2

Poiché G non ha k + 1−clique, ogni x ∈ B è adiacente ad al più k − 1 vertici


in A. Si ottiene allora
eA,B ≤ (k − 1)(n − k) .
Sommando membro a membro e usando l’identità
1 n2
    
k n 2
1− =
k 2 2 k

otteniamo

n−k 2
    
k k
|E| ≤ eA + eB + eA,B ≤+ + (k − 1)(n − k)
2 2 k
n−k 2 1 n2
    
k
= 1− = 1− .
2 k k 2
Capitolo 4

Analisi asintotica

4.1 Introduzione
La matematica è ricca di formule esatte ed identità. Abbiamo già visto la
semplicissima formula che dà il numero dei sottoinsiemi di un insieme finito
ed altre formule combinatorie nelle quali intervengono coefficienti binomia-
li. Tuttavia in molti problemi concreti le situazioni dove una soluzione o
formula esatta esiste sono l’eccezione piuttosto che la regola. Si incontrano
nei vari campi della matematica (analisi, combinatoria, teoria dei numeri,
ed altri) talune funzioni che devono essere studiate, per la loro importanza,
ma per le quali non è nota alcuna formula esatta, e talvolta si ritiene che
queste non possano proprio esserci. In tali casi si cercano stime asintotiche
per queste funzioni, cioè approssimazioni per mezzo di funzioni semplici, che
ci permettano di dedurre come le funzioni oggetto di studio si comporti-
no asintoticamente, cioè quando l’argomento della funzione va ad infinito.
Nelle applicazioni, molto spesso, queste approssimazioni sono utili quanto le
formule esatte, e talvolta, anzi, anche di più.
D’altra parte anche se si ha a disposizione una formula esatta per una
funzione enumerativa combinatoria, non è detto che questa formula indichi
con immediatezza la velocità di crescita della funzione. Come esempio, si
pensi alla funzione fattoriale : n! = n(n − 1) · · · 2 · 1. È una funzione scritta in
modo compatto e semplice. Tuttavia per la maggior parte degli usi quantitivi
è inadeguata. Per questo motivo si sono cercate delle stime asintotiche, cioè
approssimazioni per n → ∞. Stime grossolane, che nondimeno ci danno
un’idea della velocità di crescita della funzione fattoriale, possono ottenersi
abbastanza facilmente. Infatti

n! = n(n − 1) · · · 2 · 1 ≥ 2 · 2 · · · 2 = 2n−1
58 Capitolo 4: Analisi asintotica

od anche
n! = n(n − 1) · · · 2 · 1 ≥ 3 · 3 · · · 3 = 3n−1 .
Queste sono stime dal basso (limitazioni inferiori). Una stima dall’alto (limi-
tazione superiore) è

n! = n(n − 1) · · · 2 · 1 ≤ n · n · · · n = nn−2 .

Come detto, si tratta di stime grossolane. Ci si chiede allora se sia possibile


ottenere stime per n! facili da capire, calcolare e manipolare. Una rispo-
sta è forse una delle più famose stime asintotiche: la formula di Stirling1 .
Riferendosi ai successivi paragrafi per le notazioni, tale formula, nella sua
espressione più semplice, è

n! ∼ 2πn(n/e)n .

Questa formula riveste grande importanza in combinatoria, e non solo, giac-


ché molte quantità combinatorie possono esprimersi per mezzo dei coefficienti
binomiali, e dunque in ultima analisi con i fattoriali.
Un’altra questione di interesse in combinatoria enumerativa è la stima di
somme. Infatti diverse quantità combinatorie vengono espresse come somme
di coefficienti binomiali. Somme di questo tipo raramente possono calcolarsi
esattamente, per cui, al contrario, si cercano buone approssimazioni con le
tecniche dell’analisi combinatoria.
In questo capitolo introdurremo le notazioni pertinenti all’analisi asin-
totica, daremo una dimostrazione della formula di Stirling e due formule
notevoli, dovute a Eulero e Abel, utili per la stima di somme. Illustreremo
infine l’uso dell’analisi asintotica nello studio della distribuzione dei numeri
primi.

4.2 Le notazioni O e o
Nell’analisi asintotica vengono usate due notazioni speciali, ed alcune varia-
zioni di esse, note come O grande ed o piccolo. Daremo la loro definizione e
mostreremo come manipolare le espressioni che le contengano.
Consideriamo dapprima il più semplice, e più frequente, caso che si incon-
tra nell’analisi asintotica: il comportamento di una funzione della variabile
reale x quando x → ∞.
1
Informazioni bibliografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Stirling.html
4.2. Le notazioni O e o 59

Definizione 4.1. Siano f e g funzioni della variabile reale x definite nell’in-


tervallo (a, +∞). Si dice che f è O grande di g, e si scrive

f (x) = O(g(x)) ,

esistono costanti (reali) c ed x0 tali che

|f (x)| ≤ c|g(x)| , per ogni x ≥ x0 . (4.1)

Si dice che f è di ordine O(g) e che la disuguaglianza (4.1) è la stima O


grande per f . La costante c è la costante della stima e l’intervallo [x0 , ∞) è
l’intervallo di validità della stima.
Si osservi che la costante c della stima non è univocamente determinata
(ogni numero reale c0 > c può essere assunto come costante della stima).
Analogo discorso vale per la costante x0 .
In effetti il valore della costante c non è poi importante; ciò che importa
è che tale costante esista. Anzi, in molte situazioni può essere abbastanza
noioso, sebbene in linea di principio possibile, determinare esplicitamente
tale costante della stima, anche se non siamo interessati ad ottenere il miglior
valore. Ciò che importa veramente è che la notazione O grande ci permette
di affernare in modo succinto ed espressivo l’esistenza di questa costante,
senza essere costretti a scriverla esplicitamente.
♣ Esempio 4.2. Si ha
x = O(ex ) .

Per definizione dobbiamo determinare costanti c ed x0 tali che |x| ≤ cex per
ogni x ≥ x0 . Possiamo limitarci a x > 0. Basta dimostrare che la funzione
h(x) = x/ex è limitata in [x0 , +∞). A tal fine, la funzione h(x) è non
negativa e continua in [0, +∞), vale 0 per x = 0 e limx→+∞ h(x) = 0 (si usi
il teorema di de l’Hopital). Ne segue che la funzione è limitata in [0, +∞).
Quindi la stima O vale con x0 = 0 ed ogni valore di c che maggiori h(x) in
questo intervallo.
Si osservi che in questo semplice esempio è possibile determinare il miglior
valore possibile per la costante c. Infatti la funzione h(x) ha massimo assoluto
in [0, +∞), che vale 1/e. Pertanto si può assumere c = 1/e. ♣
♣ Esempio 4.3. Le argomentazioni dell’esempio precedente vanno bene anche
in situazioni più generali. Ad esempio, consideriamo le funzioni f (x) = (x +
1)A e g(x) = exp((log x)1+ ), ove A ed  sono costanti positive, ma arbitrarie.
La funzione h(x) = f (x)/g(x) è non negativa e continua in [1, +∞), e tende
60 Capitolo 4: Analisi asintotica

a 0 per x → ∞. Quindi è limitata in questo intervallo. Abbiamo dunque la


stima
(x + 1)A = O(exp((log x)1+ )
nell’intevallo x ≥ 1. Tuttavia in questo esempio, a differemza del precedente,
non è proprio semplice esibire un valore esplicito per la costante della stima.
Tuttavia ciò non ci importa: ci basta sapere che tale costante esiste.
♣ Esempio 4.4. Se P (x) = ni=0 xi è un polinomio di grado n, allora
P

P (x) = O(xn ) .

Per x ≥ 1 si ha
n n
!
X X
i
|P (x)| ≤ |ai |x ≤ |ai | xn .
i=0 i=0
Pn
Pertanto la stima cercata vale per x0 = 1 e c = i=0 |ai |. ♣
In molti casi le funzioni che intervengono nella notazione O dipendono da
uno o più parametri. Può allora essere importante conoscere se la costante
della stima dipenda da questi parametri. Se la costante vi dipende è consue-
tudine indicare questa dipendenza ponendo i parametri stessi come indici al
simbolo O, scrivendo, ad esempio, Ok , Ok, , e simili.
Quando è possibile scegliere la costante della stima in modo indipendente
dai parametri coinvolti si dice che la stima è uniforme o che vale uniforme-
mente rispetto al parametro o parametri. Certamente le stime uniformi danno
informazioni più significative ed utili di quelle non uniformi, ed è spesso uno
degli scopi principali quello di ottenere stime che valgano uniformemente.
La notazione O vale in un contesto più generale. Siano f e g funzioni
di una variabile reale o complessa x ed S un sottoinsieme di numeri reali o
complessi contenuto nell’ intersezione degli insiemi di definizione di f e di g.
Definizione 4.5. Si dice che f è O grande di g per x ∈ S, e si scrive

f (x) = O(g(x)) (x ∈ S) ,

se esiste una costante c ∈ R tale che

|f (x)| ≤ c|g(x)| , per ogni x ∈ S .

Nella precedente definizione di O grande l’insieme S corrisponde all’inter-


vallo [x0 , +∞). Si osservi anche che questa definizione si estende facilmente
al caso di funzioni di più variabili.
4.2. Le notazioni O e o 61

♣ Esempio 4.6. Per ogni reale positivo r < 1 si ha

log(1 + z) = Or (|z|) (|z| < r) .

Qui z è una variabile complessa e |z| < r è un modo succinto per denotare
il disco aperto di centro 0 e raggio r: D(0; r) = {z ∈ C | |z| < r}.
La funzione log(1 + z) è analitica nel disco D(0; 1) e il suo sviluppo in
serie di potenze è

X (−1)n+1 n
log(1 + z) = z .
n
n=1

Pertanto in D(0; 1) si ha
∞ ∞
X 1 n X 1
| log(1 + z)| ≤ |z | ≤ |z n | = |z| .
n 1 − |z|
n=1 n=1

( ∞ n
P
n=1 |z | è una serie geometrica di ragione |z| < 1 meno il primo termine
1)
Se restringiamo z al disco D(0; r) con r < 1, allora la maggiorazione
precedente ci dà
1
|z| ≤ (1 − r)−1 |z| .
1 − |z|
Pertanto la stima cercata vale con la costante c = c(r) = (1 − r)−1 .
In questo esempio la costante della stima dipende da un parametro che
interviene nella definizione dell’insieme S. ♣
♣ Esempio 4.7. Per ogni numero reale positivo r si ha

(x + y)r = Or (xr + y r ) (x, y ≥ 0) .

Più in generale per ogni numero naturale n ed ogni numero reale positivo r

(x1 + x2 + · · · + xn )r = On,r (xr1 + xr2 + · · · + xrn ) (x1 , . . . , xn ≥ 0) .

La dimostrazione segue dalla semplice osservazione


n
!r  r n
X X
r r r
xi ≤ n max{xi } = n (max{xi }) ≤ n xri .
i i
i=1 i=1


62 Capitolo 4: Analisi asintotica

4.3 Le notazioni di Vinogradov


Un notazione alternativa alla notazione O è la notazione  introdotta da Vi-
nogradov, che è ormai standard in teoria dei numeri. Vinogradov introdusse
anche altre notazioni che riportiamo.
1. f (x)  g(x) è equivalente a f (x) = O(g(x));

2. f (x)  g(x) è equivalente a g(x)  f (x);

3. f (x)  g(x) significa che entrambe f (x)  g(x) e f (x)  g(x) sono
verificate.
Nel caso f (x)  g(x) si dice che f (x) e g(x) hanno lo stesso ordine di
grandezza. È facile verificare:
Proposizione 4.8. La relazione f (x)  g(x) vale se e solo se esistono
costanti positive c1 e c2 ed una costante c0 tali che

c1 |g(x)| ≤ |f (x)| ≤ c2 |g(x)| (x ≥ x0 ) .

Il vantaggio principale della notazione di Vinogradov rispetto alla nota-


zione O è tipografica. Infatti, specialmente se la funzione g(x) è abbastanza
complicata, allora la scrittura f (x)  g(x) appare molto più chiara e pulita
invece della f (x) = O(g(x)). Inoltre, la notazione di Vinogradov ci mette
a disposizione una modo facile per esprimere limitazioni inferiori per mezzo
del simbolo ; infine il simbolo  permette di scrivere due stime O in una
stessa espressione.
Come nel caso della stima O, la eventuale dipendenza da parametri viene
indicato a pedice del simbolo.
♣ Esempio 4.9. Per ogni intero positivo n ed ogni numero reale positivo r
si ha !r
Xn n
X
ai r,n ari (a1 , . . . , an ≥ 0) .
i=1 i=1
La limitazione superiore, cioè quella relativa alla , è l’esempio 4.7. Provia-
mo la limitazione inferiore. Segue dalle disuguaglianze:
n n
!r
X X
ari ≤ n(max{a1 , . . . , an })r ≤ n ai .
i=1 i=1

Si noti come la notazione  abbia consentito di scrivere in un modo


conciso e chiaro le due scritture relative alla notazione O. ♣
4.4. La notazione o e l’equivalenza asintotica 63

Riportiamo anche altre notazioni, che sono direttamente o indirettamente


collegate alla notazione O. Si tratta di notazioni non–standard e come tali
non sono sempre accettate.
1. Specialmente in Analisi armonica il simbolo . viene usato con lo stesso
significato di .
2. Il simbolo ≈ viene usato talvolta con lo stesso significato di . Si noti
però che molto spesso è utilizzato in modo informale per indicare che
una quantità è “approssimativamente” uguale ad un’altra.

4.4 La notazione o e l’equivalenza asintotica


Siano f e g funzioni della variabile reale x, definite in (a, +∞).
Definizione 4.10. Si dice che f è o piccolo di g, e si scrive
f (x) = o(g(x)) (x → ∞) ,
se definitivamente (cioè per x ≥ x0 ) è g(x) 6= 0 e limx→∞ f (x)/g(x) = 0 .
Questa definizione può anche interpretarsi in termini di O, nel senso
che f (x) = o(g(x)) se e solo se f (x) = O(g(x)) con una costante c che
può scegliersi arbitrariamente piccola (ma positiva) e intervallo di validità
[xo (c), +∞) dipendente da c. In tal senso quindi la stima o è più forte della
corrispondente stima O.
Strettamente correlata è la notazione che esprime la equivalenza asinto-
tica:
Definizione 4.11. Si dice che f è asintotica a g, e si scrive
f (x) ∼ g(x) (x → ∞) ,
se definitivamente è g(x) 6= 0 e limx→∞ f (x)/g(x) = 1.
Una formula asintotica per f è una relazione del tipo f (x) ∼ g(x), ove
g(x) è una funzione semplice.
Si osservi che l’espressione funzione semplice viene lasciata nel vago:
si tratterà in generale di funzioni ben conosciute (esponenziale, logaritmo,
polinomi, ecc.).
Come abbiamo visto per la notazione O, anche la notazione o può esten-
dersi a funzioni di variabili complesse e a insiemi di definizione qualsiasi. Se
f e g sono funzioni della variabile reale o complessa x ed a è un numero reale
o complesso oppure ∞, si scrive
f (x) = o(g(x)) (x → a)
64 Capitolo 4: Analisi asintotica

se limx→a f (x)/g(x) esiste ed è uguale a 0. In modo analogo si definiscono


formule asintotiche rispetto al limite x → a.
La notazione o è sempre riferita ad un processo di limite. Se questo non
è esplicitamente scritto (spesso nella forma x → a), allora il limite deve
intendersi riferito ad x → ∞.
Una stima o è un’affermazione qualitativa, piuttosto che quantitativa. In-
fatti f (x) = o(g(x)) significa semplicemente che il quoziente f (x)/g(x) tende
a 0 per x → ∞, ma non dice nulla a riguardo della velocità di convergenza.
Di più, si può affermare che quasi sempre stime o, od anche stime asintoti-
che, vengono derivate come conseguenza di più precise stime O. Ad esempio,
una stima O del tipo f (x) = O(g(x)/h(x)), ove h(x) è una funzione nota
(ad esempio h(x) = log x) che tende ad infinito per x → ∞, implica la stima
f (x) = o(g(x)). Si comprende allora che la stima O dia più informazioni.
Il maggior vantaggio delle stime o e di quelle asintotiche è che sono facili
da enunciare e rendono chiari e semplici enunciati di teoremi relativi, che
quindi più facilmente si ricordano. È buona regola tuttavia che quando si
dimostrano stime o produrre dimostrazioni che fanno uso di stime O. Come
vedremo infatti termini che coinvolgono espressioni O possono essere mani-
polate abbastanza agevolmente e abbastanza in sicurezza, a differenza dei
termini o.

4.5 Manipolazione delle stime O e o


Espressioni nelle quali compaiano stime O oppure o hanno un ben preciso
significato. Tuttavia quando si manipolano questi termini bisogna ricorda-
re che non si stanno trattando ordinarie espressioni aritmetiche, e dunque
bisogna essere molto cauti. Per definizione l’espressione f (x) = O(g(x)) va
letta da sinistra verso destra e sta più propriamente a significare che O(g(x))
è una famiglia di funzioni e che f (x) ne è un membro. Si sarebbe potuto
allora usare una notazione come f (x) ∈ O(g(x)), ma ormai per tradizione è
invalso l’uso della scrittura che abbiamo introdotto. In conclusione, quando
in una espressione compare un simbolo come O(g(x)) noi dobbiame pensare
che possiamo sostituirvi una qualsiasi funzione f (x) tale che f (x) = O(g(x)).
Elenchiamo qui di seguito alcune regole per la manipolazione di espres-
sioni contenenti stime O.
Innanzitutto definiamo stima asintotica per la funzione f (x) una espres-
sione del tipo
f (x) = h(x) + O(g(x)) (4.2)
4.5. Manipolazione delle stime O e o 65

cui si attribuisce significato dichiarandola equivalente alla


f (x) − h(x) = O(g(x)) .
Nella stima asintotica (4.2) il termine O(g(x)) è detto errore assoluto: Se
una stima asintotica può scriversi come
f (x) = h(x)(1 + O(g(x)))
allora O(g(x)) è detto errore relativo.
Passiamo ora alle regole di manipolazione delle stime asintotiche, enun-
ciate soltanto per funzioni della variabile reale x e nel caso x → ∞. Queste
regole sono valide nel caso più generale di funzioni di variabile complessa.
1. Costanti nelle stime O: Se C è una costante positiva, allora la stima
f (x) = O(Cg(x)) equivale alla f (x) = O(g(x)). In particolare la stima
f (x) = O(C) equivale alla f (x) = O(1).
2. Transitività: Le stime O sono transitive, nel senso che f (x) = O(g(x)
e g(x) = O(h(x)) implicano f (x) = O(h(x)).
3. Prodotto di termini O: Se fi (x) = O(gi (x)), allora f1 (x)f2 (x) =
O(g1 (x)g2 (x)).
4. Evidenziazione di fattori: Se f (x) = O(g(x)h(x)), allora f (x) =
g(x)O(h(x)). Questa proprietà è particolarmente importante poiché
permette di “mettere in evidenza” i termini principali di una stima O.
Ad esempio la relazione f (x) = x + O(x/ log x) può scriversi
f (x) = x + x O(1/ log x) = x(1 + O(1/ log x)) ,
che evidenzia l’errore relativo della stima.
5. Somme di termini O: Se fi (x) = O(gi (x)) per i = 1, . . . , n, e le
costanti delle stime sono indipendenti da i, allora
n n
!
X X
fi (x) = O |gi (x)| .
i=1 i=1

Si osservi che nella sommatoria le funzioni gi (x) vanno prese in modulo.


6. Integrazione di termini O: Se f (x) e g(x) sono funzioni integrabili
e verificano f (x) = O(g(x)), allora
Z x Z x 
f (t)dt = O |g(t)|dt (x ≥ x0 ) .
x0 x0
66 Capitolo 4: Analisi asintotica

Tutte queste regole sono diretta conseguenza delle definizioni e la loro


verifica è lasciata per esercizio.
Le prime quattro regole valgono anche per le stime o. Non valgono le
ultime due.
♣ Esempio 4.12. Sia f (x) = e−x e g(x) = 1/x2 . Allora f (x) = o(g(x)) per
x → ∞. D’altra parte
Z x
F (x) = f (t)dt = e−1 − e−x
1
Z x
G(x) = g(x) = 1 − 1/x
1
e si ha dunque
lim F (x)/G(x) = e−1 .
x→∞

Pertanto la relazione F (x) = o(G(x)) non vale.


Questo esempio illustra le difficoltà che si possono incontrare nella mani-
polazione di stime o. pertanto è consigliabile usare, quando è possibile, stime
O. ♣

4.6 La formula di Stirling


Si tratta forse della più importante formula della matematica, che fornisce
la migliore stima di n!.

Teorema 4.13 (Formula di Stirling).


√  n n
n! ∼ 2πn .
e
Dimostrazione. Stimiamo dapprima log(n!) = log 2 + log 3 + · · · + log n.
Poniamo f (x) = log x per x ∈ [1, n], essendo n ∈ N. Definiamo poi la
funzione a gradini
g(x) = log bxc , x ∈ [1, n] .
Il suo grafico, combinato con quello della f (x), è mostrato nella figura 4.1.

Figura 4.1: Grafici di log x e log bxc

Sia poi  
1
h(x) = log(1 + ) (x − m) + log m
m
4.6. La formula di Stirling 67

Figura 4.2: Grafico della poligonale combinato con quello logaritmico

definita per x ∈ [m, m + 1], per ogni intero 1 ≤ m ≤ n. È la funzione che ha


per grafico la poligonale di vertici (m, log m), con 1 ≤ m ≤ n (figura 4.2).
Con facili calcoli si trova
Z n
g(x)dx = log 2 + · · · + log n = log(n!) ; (4.3)
1
Z n Z n
1
g(x)dx − h(x)dx = log n ; (4.4)
1 1 2
Z n
log xdx = n log n − n + 1 . (4.5)
1

(L’ultimo integrale si calcola con una integrazione per parti.)


Proviamo ora che
Z n
lim (f (x) − h(x))dx (4.6)
n→∞ 1

esiste ed è finito. A tal fine si utilizzano due approssimazioni, entrambe


conseguenza del teorema di Taylor:

1 1
log x ≤ log m + (x − m) ≤ log m + , x ∈ [m, m + 1] (4.7)
m m
1
log(1 + t) ≥ t − t2 , t ∈ [0, 1] . (4.8)
2
In particolare dalla (4.8) per ogni naturale m si ha
 
1 1 1
log 1 + ≥ − . (4.9)
m m 2m2

Possiamo ora stimare la funzione F (x) = f (x) − g(x) per x ∈ [m, m + 1]


ove m è un intero compreso tra 1 e n; si tenga conto delle (4.7), (4.9) e di
0 ≤ x − m ≤ 1. Si ha
 
1
F (x) = log x − log m − log 1 + (x − m)
m
 
1 1 1
≤ − log 1 + ≤ .
m m 2m2
68 Capitolo 4: Analisi asintotica

Poiché la serie m≥1 1/(2m2 ) converge, il limite (4.6) esiste ed è finito. Sia
P
c questo limite.
A conclusione di tutti questi calcoli troviamo
Z n Z n
f (x)dx = h(x) + c + o(1)
1
Z1 n Z n
= (h(x) − g(x))dx + g(x)dx + c + o(1) .
1 1

Pertanto
Z n Z n Z n
g(x)dx = f (x)dx + (g(x) − h(x))dx − c + o(1) ,
1 1 1
ovvero
1
log(n!) =n log n − n + log n + (1 − c) + o(1)
2
= log nn + log n1/2 − n + (1 − c) + o(1)
= log(nn+1/2 ) − log en + log e1−c + o(1)
!
n1+1/2
= log C + o(1) ,
en

dove si è posto C = e1−c . Dunque


n1+1/2
n! ∼ C .
en
Resta da determinare la costante C. A tal fine si consideri l’integrale, dipen-
dente dal parametro n ∈ N0
Z π/2
In := sinn xdx . (4.10)
0

Per n = 0 ed n = 1 si ha rispettivamente
I0 = π/2 , I1 = 1 .
Integrando per parti si perviene alla formula ricorsiva
n−1
In = In−2 , n ≥ 2, I0 = π/2 , I1 = 1 . (4.11)
n
Distinguendo i due casi, indice pari oppure dispari, si trova
(2n)!π
I2n =
22n+1 (n!)2
4.7. Le formule di sommazione di Eulero e di Abel 69

22n (n!)2
I2n+1 = .
(2m + 1)!
Poiché I2n+2 ≤ I2n+1 ≤ I2n , si ottiene

(2n + 1)π 24n (n!)4 π


≤ ≤ ,
4(n + 1) (2n)!(2n + 1)! 2

da cui si trae
24n (n!)4 π
lim = . (4.12)
n→∞ (2n)!(2n + 1)! 2

Ponendo n! ∼ Cnn+1/2 /en nella (4.12) si trova (lasciando al lettore alcuni


passaggi algebrici)

C2 1 −(2n+3/2) π
 
lim 1 + = ,
4 n→∞ 2n 2

da cui C = 2π.

4.7 Le formule di sommazione di Eulero e di Abel


In combinatoria sovente ci si riconduce a calcolare somme. Vi sono due for-
mule, dovute ad Eulero ed Abel, che permettono di confrontare somme con
integrali e di fornire una espressione per l’errore fatto nell’approssimazione.

Teorema 4.14 (Formula di sommazione di Eulero). Se f ha derivata f 0


continua in [a, b], con 0 < a < b, allora

X Z b Z b
f (n) = f (t)dt + {t}f 0 (t)dt + f (a){a} − f (b){b} , (4.13)
a<n≤b a a

ove la sommatoria è sugli interi n compresi tra a e b.

Dimostrazione. Poniamo m = bac e k = bbc. Se n − 1 ed n sono interi


nell’intervallo [a, b], si ha
Z n Z n
0
btc f (t)dt = (n − 1)f 0 (t)dt = (n − 1)(f (n) − f (n − 1))
n−1 n−1
=(nf (n) − (n − 1)f (n − 1)) − f (n) .
70 Capitolo 4: Analisi asintotica

Sommando da m + 1 a k si ottiene
Z k k
X X
0
btc f (t)dt = (nf (n) − (n − 1)f (n − 1)) − f (n)
m n=m+1 a<n≤b
X
=kf (k) − mf (m) − f (n) ,
a<n≤b

da cui si trae
X Z k
f (n) = − btc f 0 (t)dt + kf (k) − mf (m)
a<n≤b m
Z b
=− btc f 0 (t)dt + kf (b) − mf (a) .
a

Con una integrazione per parti si ottiene


Z b Z b
f (t)dt = bf (b) − af (a) − tf 0 (t)dt ,
a a

che unitamente alla precedente danno la eqrefformula di Eulero.

Dalla formula di Eulero si possono dedurre talune stime asintotiche.

Teorema 4.15. Per ogni reale x ≥ 1 si ha


X 1
= log x + γ + O(1/x) , (4.14)
n
1≤n≤x

ove γ è la costante di Eulero–Mascheroni;


X xa + 1
na = , per ogni a ∈ R, con a ≥ 0 . (4.15)
a+1
1≤n≤x

Dimostrazione. ..........

Passiamo ora alla formula di sommazione di Abel2 .

Figura 4.3: Niels Abel

2
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Abel.html
4.8. La distribuzione dei numeri primi 71

Teorema 4.16 (Formula di sommazione di Abel). Sia a : N → R una


successione. Posto X
A(x) := a(n) ,
1≤n≤x

ove A(x) = 0 se x < 1, se f è una funzione reale con derivata f 0 continua


in [a, b], con 0 < a < b, si ha
X Z b
a(n)f (n) = A(x)f (x) − A(y)f (y) − A(t)f 0 (t)dt . (4.16)
a<n≤b a

Dimostrazione. ...........

Si osservi che la formula di sommazione di Eulero può ottenersi da quella


di Abel. Basta prendere a(n) = 1 per ogni n, sicché A(x) = bxc. Quindi
dalla (4.16) si ha
X Z b
f (n) = f (b) bbc − f (a) bac − btc f 0 (t)dt .
a<n≤b a

Basta allora combinare questa formula con la formula di integrazione per


parti
Z b Z b
0
tf (t) = bf (b) − af (a) − f (t)dt
a a
per ottenere la formula di Eulero.

4.8 La distribuzione dei numeri primi


Come esemplificazione delle notazioni e tecniche della analisi asintotica, ri-
portiamo alcune stime elementari della funzione π(x), che conta il numero
dei nimeri primi minori od uguali ad x, reale positivo. Lo studio di questa
funzione appartiene alla cosiddetta teoria analitica dei numeri.
Sappiamo che esistono infiniti numeri primi. Siamo interessati allora a
conoscere la loro “densità” nell’insieme dei naturali. In altre parole, nell’inter-
vallo [2, n] quanti numeri primi ci sono? Ciò porta naturalmente a considerare
la funzione
π : R+ → N
che, come già detto, conta il numero dei numeri primi minori od uguali ad
x. In modo perfettamente equivalente, per ogni x > 0
X
π(x) = 1,
p≤x
72 Capitolo 4: Analisi asintotica

ove la sommatoria è estesa a tutti i primi minori od uguali ad x. Se introdu-


ciamo la funzione caratteristica dei primi
(
1 se n è primo
a(n) =
0 altrimenti
si ha X
π(x) = a(n) ,
1≤n≤x

ove la sommatoria è estesa a tutti i naturali compresi tra 1 e x. Vale la ovvia


limitazione
π(x) ≤ x , per ogni x > 0 .
La funzione π è una tipica funzione a salti, che incrementa di 1 il suo valore
sui numeri primi (figure 4.4 e 4.5).

Figura 4.4: La funzione π con 1 ≤ x ≤ 50 e con 1 ≤ x ≤ 100

Figura 4.5: La funzione π con 1 ≤ x ≤ 1000

Nella tavola 4.1 sono riportati valori di π per x = 103i , con i = 1, . . . , 6.


Sono anche riportati i valori del rapporto x/π(x).

x π(x) x/π(x)
103 168 5.95238
106 78498 12.73918
109 50847534 19.66664
1012 37607912018 26.59015
1015 29844570422669 33.50693
1018 24739954287740860 40.42045

Tabella 4.1: Alcuni valori di π


Si osservi che la differenza tra i valori di una riga della terza colonna e
la riga precedente è all’incirca costante e vale log 103 = 6, 9 . . . . Ragione-
volmente ciò condusse alla congettura che x/π(x) ∼ log x, ovvero, in modo
equivalente
π(x) ∼ x/ log x . (4.17)
Si confrontino a tal proposito i grafici di π(x) (figura 4.5) con quello della
funzione x/ log x (figura 4.6).
4.8. Distribuzione dei numeri primi 73

Figura 4.6: La funzione x/ log x con 2 ≤ x ≤ 1000

La relazione asintotica (4.17) è nota come Teorema dei numeri primi. Fu


congetturata da Gauss3 nel 1791.

Figura 4.7: Karl F. Gauss

Il teorema dei numeri primi fu poi dimostratato, indipendentemente, da


Hadamard4 e de la Vallée– Poussin5 . Non daremo la dimostrazione di questo
teorema, che abbisognerebbe di un intero corso. Per la dimostrazione rin-
viamo ad esempio al libro di Hardy e Wright [2] oppure al libro di Apostol
[1].
Il primo importante passo verso la dimostrazione del teorema dei numeri
primi fu il seguente teorema, dovuto a Chebychev6 .

Teorema 4.17 (Teorema di Chebyshev). Si ha

π(x)  x/ log x .

La sua dimostrazione non è particolarmente difficile e procede attraverso


vari passi, che ora illustreremo. Dobbiamo determinare una limitazione in-
feriore ed una superiore. Poiché
P interveranno sommatorie su numeri primi,
conveniamo che la notazione p indichi sommatoria su tutti i primi p.
Per ogni intero positivo n ed ogni primo p, definiamo νp (n) come il
massimo esponente tale che pνp (n) divide n.

Teorema 4.18. Sia n un intero positivo. Per ogni primo p si ha


Xj k
νp (n!) = n/pk . (4.18)
k≥1

Dimostrazione. Segue dall’osservazione che


 nell’intervallo discreto [1, n] vi
sono esattamente bn/pc multipli di p, n/p2 multipli di p2 e così via.


3
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/history/ Mathematicians/Gauss.html
4
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Hadamard.html
5
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Vallee_Poussin.html
6
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Mathematicians/Chebyshev.html
74 Capitolo 4: Analisi asintotica

Pertanto, per ogni primo p, n! è divisibile per

pbn/pc · pbn/p c · · · pbn/p c · · · = p


2 k
bn/pk c .
P
k≥1

Il prossimo teorema fornisce una limitazione inferiore per π(x).


Teorema 4.19. Per ogni intero n ≥ 2 si ha
1 n
π(n) ≥ (log 2) . (4.19)
2 log n
Dimostrazione. Consideriamo il coefficiente binomiale
 
2m (2m)!
N= = ,
m (m!)(m!)
con m intero positivo. Poiché
m+1m+2 m+m
N= ···
1 2 m
m
è chiaro che N ≥ 2 e che N è divisibile soltanto per i primi minori di 2m.
Applicando il Teorema 4.18 all’identità N = (2m)!/(m!)2 si ottiene
X j k j k
k k
νp (N ) = 2m/p − 2 m/p .
k≥1

Ciascun addendo di questa sommatoria vale 0 oppure 1 e per k > log(2m)/ log p
ciascun addendo è 0. Quindi νp (N ) ≤ log(2m)/ log p. Si ottiene allora
X log(2m)
π(2m) log(2m) = log p
log p
p≤2m
X 1
≥ νp (N ) log p = log N ≥ m log 2 = (log 2)(2m) .
2
p≤2m

In definitiva
1 2m
π(2m) ≥ (log 2) ,
2 log(2m)
che dimostra il teorema per gli interi pari. Consideriamo ora un intero dispari
n ≥ 3. Poniamo n = 2m−1 con m ≥ 2. Poiché la funzione x/ log x è crescente
per x ≥ 3 > e e poiché π(2m − 1) = π(2m) per m ≥ 2, si ha
1 2m 1 2m − 1
π(2m − 1) = π(2m) ≥ (log 2) ≥ (log 2) .
2 log(2m) 2 log(2m − 1)
Ciò prova il teorema anche per gli interi dispari.
4.8. Distribuzione dei numeri primi 75

Corollario 4.20. π(x)  x/ log x.


La costante della stima è c = 12 log 2.
Abbiamo ora bisogno di determinare una limitazione superiore. A tal fine
introduciamo la funzione ϑ di Chebyshev:
X
ϑ(x) := log p con x ∈ R+ ,
p≤x

ove la sommatoria è estesa a tutti i primi p ≤ x.


Il teorema che segue collega π(x) con ϑ(x).
Teorema 4.21.
ϑ(x)
π(x) ∼ .
log x
Dimostrazione. Dalla definizione di ϑ(x) si ha
X X
ϑ(x) = log x ≤ log x 1 = (log x)(π(x)) .
p≤x p≤x

Segue allora
ϑ(x)
π(x) ≥ .
log x
D’altra parte per ogni x > 1 e 0 < δ < 1 si ha
X X
ϑ(x) ≥ log p ≥ δ log x 1
xδ <p≤x xδ <p≤x

=δ log x(π(x) − π(x ) ≥ δ log x(π(x) − xδ ) .


δ

Si ottiene allora
ϑ(x)
π(x) ≤ xδ + .
δ log x
Per il teorema precedente il termine xδ è o(π(x)). Pertanto per x sufficien-
temente grande (ciò dipendendo da δ) si ha xδ ≤ (1 − δ)π(x) e quindi
ϑ(x)
π(x) ≤ .
δ 2 log x
Per ogni  > 0 si può scegliere δ vicino ad 1 di modo che 1/δ 2 < 1 + , sicché
in corrispondenza di questo δ e per x sufficientemente grande si abbia

π(x) < (1 + )ϑ(x)/ log x ,

da cui segue il teorema.


76 Capitolo 4: Analisi asintotica

L’ultimo passo per arrivare alla dimostrazione del teorema di Chebishev


è il seguente

Teorema 4.22. ϑ(x) < 2x log 2 per ogni numero reale x > 1.

Dimostrazione. Basta dimostrare che ϑ(n) < 2n log 2 per ogni intero n ≥ 1,
poiché allora
ϑ(x) = ϑ(bxc) < 2 bxc log 2 ≤ 2x log 2 .
Per ogni intero positivo m consideriamo il coefficiente binomiale
 
2m + 1 (2m + 1)!
M= = .
m m!(m + 1)!

Si verifica facilmente che M è divisibile per tutti i primi p tali che m + 1 <
p ≤ 2m+1. Poiché M figura due volte nello sviluppo del binomio (1+1)2m+1 ,
si prova con facili passaggi che M < 22m+1 /2 = 22m . Ne segue:
X
ϑ(2m + 1) − ϑ(m + 1) = log p ≤ log M < 2m log 2 .
m+1<p≤2m+1

Proviamo allora il teorema per induzione su n. per n = 1 oppure n = 2, il


teorema è banale. Sia n > 2. se n è pari, si ha

ϑ(n) = ϑ(n − 1) < 2(n − 1) log 2 < 2n log 2 .

Se n = 2m + 1 è dispari, si ha

ϑ(n) =ϑ(2m + 1) − ϑ(m + 1) + ϑ(m + 1)


< 2m log 2 + 2(m + 1) log 2 = 2n log 2 .

Il teorema di Chebishev segue ora immediatamente dai Teoremi 4.19,


4.21 e 4.22. Si osservi che abbiamo anche dimostrato il seguente

Teorema 4.23. ϑ(x)  x.

Illustriamo ora un altro teorema che ha un gran numero di applicazioni.

Teorema 4.24. X1
= log log x + O(1) .
p
p≤x

Per la dimostrazione procediamo in vari passi.


4.8. Distribuzione dei numeri primi 77

Teorema 4.25.
X log p
= log p + O(1) .
p
p≤x

Dimostrazione. Poniamo n := bxc. Dal Teorema 4.18 si ha


XXj k X XXj k
log(n!) = n/pk log p = bn/pc log p + n/pk log p .
p≤n k≥1 p≤n k≥2 p≤n

Proviamo che l’ultima sommatoria è O(n). Infatti


X Xj k X X
log p n/pk ≥n log p p−k
p≤n k≥2 p≤n k≥2
X log p 1 X log p
=n =n p≤n
p2 1 − 1/p p(p − 1)
p≤n
X log k
≤n = O(n) .
k(k − 1)
k≥2

Finora abbiamo dimostrato che


X
log(n!) = −p ≤ n bn/pc log p + O(n) . (4.20)

Inoltra, poiché bn/pc = n/p + O(1), dal Teorema 4.22 si ottiene


 
X X X log p
log(n!) = (n/p) log p + O  log p + O(n) = n + O(n) .
p
p≤n p≤n p≤n
(4.21)
Combinando ora la stima elementare di log(n!) con la (4.21) e osservando
che log x − log n = o(1), si ottiene
X log p
= log n + O(1) = log x + O(1) ,
p
p≤x

che dimostra il teorema.

Possiamo ora dimostrare il Teorema 4.24.

Teorema4.24. Per i ≥ 2 definiamo


(
(log i)/i se i è primo
ci :=
0 altrimenti .
78 Capitolo 4: Analisi asintotica

Dal Teorema 4.25


X X log p
C(t) := ci = = log t + O(1) .
p
2≤i≤t p≤t

Applichiamo la formula di sommazione di Abel con f (t) = 1/ log t. Si ottiene


X 1 C(x) Z x C(t)
= + 2
dt
p log x 2 t(log t)
p≤x
Z x Z x 
dt dt
= (1 + O(1/ log x)) + + O( 2
2 t log t 2 t(log t) )
=1 + O(1/ log x) + (log log x − log log 2) + O(1/ log 2 − 1/ log x)
= log log x + O(1) .

Una delle conseguenze più importanti del Teorema 4.24 è il Teorema di


Mertens7 :

Teorema 4.26 (Teorema di Mertens).


Y
(1 − 1/p)  1/ log x .
p≤x

Dimostrazione. Dalla diseguaglianza valida per ogni 0 ≤ x ≤ 1/2


2
1 − x ≥ e−x−x

passando ai logaritmi si ottiene

−x − x2 ≤ log(1 − x) per ogni 0 ≤ x ≤ 1/2 . (4.22)

Per ogni primo p si ha 0 < 1/p ≤ 1/2. pertanto dalla (4.22)


1 1
− 2
≤ + log(1 − 1/p) ≤ 0 . (4.23)
p p
Inoltre poiché
X 1 X 1
≤ < ∞,
p2 n2
p≤x n≥2

7
Informazioni biografiche:
http://www-history.mcs.st-andrews.ac.uk/Biographies/Mertens.html
4.8. Distribuzione dei numeri primi 79

sommando la disuguaglianza (4.23) su tutti i primi p si ottiene


X1
−C ≤ + log P (x) ≤ 0 ,
p
p≤x
Q
dove C è una costante positiva e P (x) := p≤x (1 − 1/p). Da ciò e dal
Teorema 4.24 segue

log log x + log P (x) = O(1) .

Ciò significa che


−D ≤ log log x + log P (x) ≤ D ,
per una costante positiva D e per x sufficientemente grande. Esponenziando

e−D ≤ (log x)P (x) ≤ eD .

Quindi P (x)  1/ log x.


80 Capitolo 4: Analisi asintotica
Capitolo 5

Il metodo probabilistico

Molto spesso in combinatoria ci si imbatte nel problema di provare che un


insieme A contenga un sottoinsieme B soddisfacente una certa proprietà P .
Uno strumento potente per trattare problemi siffatti è il metodo probabilistico
di Erdös. Per dimostrare che un tale sottoinsieme esiste, si assegna una op-
portuna distribuzione di probabilità sulla famiglia dei sottoinsiemi di A e si
prova che la probabilità dell’evento “B verifica P ”è positiva. Noi limiteremo
la nostra esposizione a spazi di probabilità discreti, ove discreto significa fini-
to oppure numerabile. Ricorderemo le nozioni di base, dimostreremo alcune
classiche diseguaglianze e quindi daremo alcune applicazioni del metodo.

5.1 Distribuzioni di probabilità finite


Una distribuzione di probabilità finita D = (U, P) è il dato di un insieme
finito U e di una funzione P : U → [0, 1] tale che
X
P(u) = 1 . (5.1)
u∈U

L’insieme U è lo spazio dei campioni e la funzione P è la funzione di proba-


bilità.
In modo intuitivo, gli elementi di U sono i risultati di un esperimento
casuale e la probabilità che si verifichi il risultato u ∈ U è il numero reale
P(u).
♣ Esempio 5.1. Sia U un qualsiasi insieme finito di cardinalità n. Si definisca
P(u) = 1/n. La coppia D = (U, P) è la distribuzione uniforme su U.
82 Capitolo 5: Il metodo probabilistico

♣ Esempio 5.2. Un esperimento di Bernoulli è un esperimento nel quale sono


possibili due soli risultati: successo con probabilità p ed insuccesso con pro-
babilità q = 1−p. Ad esempio il lancio di una moneta è un tipico esperimento
di Bernoulli.
Sia D = (U, P) una distriduzione di probabilità (finita). Un evento è un
qualsiasi sottoinsieme A di U e la probabilità dell’evento A è definita come
X
P(A) := P(u) . (5.2)
u∈A

Se A ⊆ U è un evento, denotiamo con A il complementare di A in U. Si ha


ovviamente P() = 0, P(U) = 1, P(A) = 1 − P(A).

Proposizione 5.3. Se A1 , . . . , An sono eventi di U, allora

P(A1 ∪ A2 ∪ · · · ∪ An ) ≤ P(A1 ) + P(A2 ) + · · · + P(An ) , (5.3)

e se gli eventi sono due a due disgiunti, allora

P(A1 ∪ A2 ∪ · · · ∪ An ) = P(A1 ) + P(A2 ) + · · · + P(An ) . (5.4)

Inoltre vale il principio di inclusione/esclusione:

n
X X
P(A1 ∪ A2 ∪ · · · ∪ An ) = (−1)s P(Ai1 ∩ · · · ∩ Ais ) . (5.5)
s=1 i1 <···<is

La dimostrazione viene lasciata per esercizio.


Se D1 = (U1 , P1 ) e D2 = (U2 , P2 ) sono istribuzioni di probabilità, defi-
niamo la distribuzione prodotto D = (U, P), ove U := U1 ×U2 e P((u1 , u2 )) :=
P1 (u1 )P2 (u2 ). Si verifica facilmente che si tratta di una distribuzione di
probabilità. Questa definizione si estende in modo naturale al caso di n
distribuzioni.
♣ Esempio 5.4. Si consideri il prodotto di n copie di un esperimento di
Bernoulli, con probabilità di successo p e probabilità d’insuccesso q = 1 − p.
Un elemento dello spazio campione è una n−pla di successi/insuccessi. Se una
tale n−pla contiene k successi (e n − k insuccessi), allora la sua probabilità
è pk q n−k , indipendentemente dalla posizione occupata dai successi e dagli
insuccessi.
5.2. Probabilità condizionata ed indipendenza 83

5.2 Probabilità condizionata ed indipendenza


Sia D = (U, P) una distribuzione di probabilità finita. Per ogni evento B ⊆ U
con P(B) 6= 0 e per ogni u ∈ U definiamo
(
P(u)/P(B) se u ∈ B,
P(u | B) :=
0 altrimenti .

Se consideriamo B fissato, la funzione P(· | B) è una nuova funzione di proba-


bilità sullo stesso spazio dei campioni, che dunque definisce una nuova distri-
buzione di probabilità DB = (U, P(· | B)), detta distribuzione condizionata
da B.
Possiamo, in modo intuitivo, interpretare DB al seguente modo. Se un
esperimento casuale produce un risultato secondo la distribuzione D e se noi
conosciamo che l’evento B si è verificato, allora la distribuzione condizio-
nata assegna nuove probabilità ai possibili risultati, tenenedo in conto della
conoscenza che l’evento B si è verificato.
Come al solito si estende la definizione di P(· | B) agli eventi, ponendo
per ogni evento A ⊆ U
X P(A ∩ B)
P(A | B) = P(u | B) = .
P(B)
u∈A

Il numero P(A | B) è probabilità condizionata di A dato B.


Definizione 5.5. (i) Si dice che due eventi A e B di U sono indipendenti se
P(A ∩ B) = P(A)P(B) .
(ii) Gli eventi A1 , . . . , An si dicono a due a due indipendenti se P(Ai ∩
Aj ) = P(Ai )P(Aj ) per ogni i 6= j, e sono detti mutuamente indipendenti se
per ogni sottoinsieme {Aj1 , ,̇Ajs } si ha
P(Aj1 ∩ · · · ∩ Ajs ) = P(Aj1 ) · · · P(Ajs ) .
Sia B1 , . . . , Bn una famiglia di venti costituenti una partizione dello
spazio dei campioni U e si supponga P(Bi ) > 0 per ciascun evento Bi ,
i = 1, . . . , n. È facile verificare che per ogni evento A si ha
n
X n
X
P(A) = P(A ∩ Bi ) = P(A | Bi )P(Bi ) . (5.6)
i=1 i=1

Inoltre, se P(A) > 0, allora per ogni i = 1, . . . , n risulta


P(A ∩ B) P(A | Bi )P(Bi )
P(Bi | A) = = Pn . (5.7)
P(A) j=1 P(A | Bj )P(Bj )
84 Capitolo 5: Il metodo probabilistico

L’uguaglianza (5.7) è nota come teorema di Bayes e permette di calcolare la


probabilità condizionata P(Bi | A) in termini delle probabilità condizionate
P(A | Bj ).
L’uguaglianza (5.6) è utile per calcolare o stimare probabilità condizio-
nando su specifici eventi Bi in modo che le probabilità condizionate siano
facili da calcolare o stimare. Inoltre, se si vuole calcolare una probabilità
condizionata P(A | C), lo si può fare con una partrizione di C in eventi
B1 , . . . , Bn tali che P(Bi ) > 0 e utilizzando il semplice fatto che

n
X
P(A | C) = P(A | Bi )P(Bi )/P(C) . (5.8)
i=1

♣ Esempio 5.6. Supponiamo che la frequenza di incidenza della malattia X


nella popolazione totale sia 1%. Supponiamo anche che vi sia un test per la
malattia X e che questo test non sia perfetto: ha un 5% di falsi positivi (il
5% per cento di pazienti sani risulta positivo al test) e un 2% di falsi negativi
(il 2% di pazienti malati risultano negativi al test). Un medico somministra
il test ad un paziente e questi risulta positivo. In che modo il medico avverte
il paziente? In particolare, qual è la probabilità che effettivamente il paziente
abbia la malattia X, posto che il test sia risultato positivo?
È sorprendente che molti medici rispondano che la probabilità sia il
95%, poiché la frequenza dei falsi positivi è 5%. Si tratta di una conclusione
completamente sbagliata. Il ragionamente corretto da fare è il seguente.
Sia A l’evento che il test sia positivo e sia B l’evento che il paziente
abbia la malattia X. La quantità che dobbiamo stimare è P(B | A), cioè
la probabilità che il paziente abbia la malattia atteso che il test ha dato
risultato positivo. Usiamo il teorema di Bayes:

P(A | B)P(B) 0.98 · 0.01


P(B | A) = = ≈ 0.17 .
P(A | B)P(B) + P(A | B)P(B) 0.98 · 0.01 + 0.05 · 0.99

Quindi la probabilità che il paziente abbia la malattia, atteso che sia risultato
positivo al test, è all’incirca 17%. L’intuizione corretta è che è più probabile
ottenere un falso positivo che avere effettivamente la malattia.
È bene osservare che ciò che realmente accade molto spesso è più compli-
cato. Il medico potrebbe somministrare il test perché certi fattori di rischio
o sintomi suggeriscono che la probabilità che il paziente abbia effettivamente
la malattia è più alta di quella di un membro della popolazione scelto a caso.
5.3. Definizione assiomatica di probabilità 85

5.3 Definizione assiomatica di probabilità


Per poter considerare più a fondo gli aspetti teorici del calcolo delle proba-
bilità si fa ricorso a definizioni assiomatiche, che si basano su aspetti della
teoria della misura.
Sia Ω un insieme non vuoto.
Definizione 5.7. Una famiglia M di sottoinsiemi di Ω è detta una σ−algebra
se

1. Ω ∈ M;

2. se A ∈ M allora Ac := Ω \ A ∈ M; e
S
3. se {Ai | i ∈ N} è una successione di elementi di M, allora i∈N Ai ∈
M.

La coppia (Ω , M) è detta spazio misurabile e gli elementi di M sono detti


sottoinsiemi misurabili.
Una misura su uno spazio misurabile (Ω , M) è una funzione µ : M →
[0, +∞] tale che per ogni successione {Ai | i ∈ N} di sottoinsiemi misurabili
a due a due disgiunti si abbia
X
µ (∩i∈N Ai ) = µ(Ai ) . (5.9)
i∈N

Nel caso che µ(Ω) = 1 allora µ è detta misura di probabilità e la terna


(Ω , M , µ) uno spazio di probabilità. In questo caso Ω è lo spazio campione e
gli elementi di M sono gli eventi. Se E ∈ M è un evento, il numero µ(E) è
la probabilità dell’evento E.
♣ Esempio 5.8. Nel caso che Ω sia finito si può ottenere quanto descritto
per le distribuzioni di probabilità finite. Si considera la totalità M dei sot-
toinsiemi di Ω ed una funzione (distribuzione di probabilità) p : Ω → R tale
che X
1) p(x) ≥ 0 , 2) p(x) = 1 .
x∈Ω

Allora p definisce uno spazio di probabilità definendo la misura di probabilità


P : Ω → [0, 1] ponendo per ogni evento E ∈ M
X
P(E) := p(x) .
x∈E
86 Capitolo 5: Il metodo probabilistico

Altri concetti fondamentali sono i seguenti. Sia Ω un insieme e sia F una


famiglia di sottoinsiemi di Ω. La σ−algebra generata da F è la più piccola
σ−algebra contenente F. Questa si ottiene da F con le operazioni di passag-
gio al complementare e con unioni numerabili. Il caso che più ci interesserà è
allorquando Ω sia dotato di una topologia T . La σ−algebra di Borel è la σ−
algebra generata da T (la famiglia degli aperti di Ω). Questa nozione sarà
utilizzata specialmente nei casi di R e C dotati delle loro topologie naturali.
Definizione 5.9. Siano (Ω , M) e (Ω0 , M0 ) spazi misurabili. Una funzione
f : Ω → Ω0 è detta misurabile se f −1 (A0 ) ∈ M per ogni A0 ∈ M0 .
L’importanza di porsi in questo contesto astratto risiede nel poter definire
il concetto di integrale secondo Lebesgue, che ha un miglior comportamento
al passaggio al limite sotto il segno di integrale rispetto all’integrale di Rie-
mann. Diamo soltanto una rapida introduzione, rinviando per tutti i dettagli
a [3]. In quel che segue (Ω , M , µ) è uno spazio di misura.
Una funzione la cui immagine è un sottoinsieme finito è detta semplice.

Proposizione 5.10. Sia f : Ω → [0, +∞) una funzione misurabile (lo spazio
topologico [0, +∞) è dotato della σ−algebra di Borel). Esiste una successione
di funzioni misurabili semplici sn : Ω → [0, +∞), con n ∈ N, tali che

1. s1 (x) ≤ s2 (x) ≤ · · · ≤ sn (x) ≤ · · · ≤ f (x), per ogni x ∈ Ω; e

2. limn→∞ sn (x) = f (x), per ogni x ∈ Ω.

Sia s : Ω → [0, +∞) una funzione misurabile semplice. Se {a1 , . . . , an } è


l’insieme dei valori assunti da s, posto Ai := {x ∈ Ω | s(x) = ai } = s−1 (ai ),
si definisce integrale di s il numero reale
Z n
X
s dµ := ai µ(Ai ) . (5.10)
Ω i=1

Sia ora f : Ω → [0, +∞) una funzione misurabile. Si definisce integrale


secondo Lebesgue di f il numero reale (o infinito)
Z Z
f dµ := sup{ sn dµ}
Ω Ω

ove {sn }n∈N è una successione di funzioni misurabili semplici come nella
Proposizione 5.10.
Capitolo 6

Funzioni generatrici

Nel capitolo precedente abbiamo visto diversi problemi combinatori che am-
mettono soluzione in termini di formule esatte. Questa situazione non è però
la norma. Molto spesso si ha a disposizione una em formula ricorsiva (vedi i
numeri di Fibonacci), cioè si conosce della successione {an }n≥0 non già una
formula esatta ma bensì una relazione che lega an ai termini che lo precedo-
no. Il problema che ci poniamo è allora di trovare metodi che ci permettano
di risolvere la ricorrenza. Ciò si può fare con l’ausilio delle funzioni genera-
trici. Per comprendere questo concetto, partiamo da un modo equivalente di
descrivere una successione.
Ricordiamo la definizione formale di polinomio: un polinomio è una suc-
cessione quasi ovunque nulla. Dunque i polinomi sono successioni. Ora un
polinomio si rappresenta anche con una espressione del tipo
n
X
a0 + a1 x + a2 x2 + · · · + an xn = ai xi
i=1

dove xi è un simbolo (tecnicamente è una indeterminata) che ci indica il


posto che occupa ai . Allora, in modo puramente formale, possiamo definire
una somma di infiniti termini, e a queste espressioni daremo il nome di serie
formali di potenze, che generalizzano dunque i polinomi. Possono essere defi-
nite su un campo qualunque K. L’insieme delle serie formali di potenze nella
indeterminata x su K si denota con K[[x]]. Vedremo che questo insieme è un
anello commutativo con unità e privo di divisori dello zero, cioè un dominio
d’integrità. Bene, ma come si collegano al nostro problema? Abbiamo sem-
plicemente formalizzato la questione. Ma supponiamo che K sia R oppure
C. Una serie formale di potenze è pur sempre una serie di potenze che può
essere convergente e definire una funzione analitica. Dalla teoria delle fun-
88 Capitolo 6: Funzioni generatrici

zioni analitiche noi sappiamo che una serie di potenze convergente definisce
nel suo disco di convergenza una ben determinata funzione analitica. Allora,
associata alla nostra successione una serie formale di potenze, se questa, co-
me serie di potenze, converge, essa definisce una ben determinata funzione
analitica, che può essere una risposta al nostro problema originario. Se poi
si volesse avere qualche informazione sui singoli numeri an , vi sono tecniche
ben sviluppate della teoria delle funzioni analitiche che ci permettono di ave-
re non già un’espressione esatta per an , ma piuttosto delle stime, che spesso
sono molto buone quando n è abbastanza grande (stime asintotiche).
Cominceremo a trattare l’aspetto formsle delle serie di potenze, per sof-
fermarci poi su alcune questioni riguardanti le funzioni analitiche.

6.1 Serie di potenze: aspetto formale


Gli anelli di polinomi in un numero finito di indeterminate hanno assunto
rilevante importanza anche nelle applicazioni. Parimenti altri anelli, che ne
sono una immediata generalizzazione, sono divenuti anch’essi sempre più
importanti. Stiamo parlando degli anelli delle serie formali di potenze in
più indeterminate che ora descriveremo. Ci porremo, come è consuetudine
in matematica, in un contesto alquanto generale, anche se noi poi alla fine
saremo interessati al solo caso di serie formali in una indeterminata e a
coefficienti complessi.
Sia A un anello commutativo con unità 1 e sia R = A[x1 , . . . , xn ] l’anello
dei polinomi in n indeterminate su A. Una serie formale di potenze in n
indeterminate su A è una successione infinita f = (f0 , f1 , . . . , fk , . . . ) di po-
linomi omogenei di R, ove ciascun fk , se non è il polinomio nullo, è di grado
k, con k ∈ N0 . Definiamol’addizione e la moltiplicazione di due serie di po-
tenze (sottointenderemo spesso l’aggettivo formale) f = (f0 , f1 , . . . , fk , . . . )
e g = (g0 , g1 , . . . , gk , . . . ) ponendo:

f + g = (f0 + g0 , f1 + g1 , . . . , fk + gk , . . . ) , (6.1)
X
f g = (h0 , h1 , . . . , hk , . . . ) , dove hk = fi gj . (6.2)
i+j=k

È facile verificare che con queste definizioni di addizione e di moltiplicazione


l’insieme S delle serie formali di potenze su A diviene un anello commutativo
con unità. Questo anello è detto anello delle serie formali di potenze in n
ideterminate su A e sarà denotato con A[[x1 , . . . , xn ]]. Lo zero di S è la
successione (0, 0, . . . , 0, . . . ) e (1, 0, . . . , 0, . . . ) è l’identità moltiplicativa.
6.1. Serie di potenze: aspetto formale 89

I polinomi di R possono essere identificati con serie di potenze. Infatti se


f ∈ R e f = f0 + f1 + · · · + fm , ove ciascun fi è un polinomio omogeneo di
grado i, identifichiamo f con la la serie di potenze (f0 , f1 , . . . , fm , 0, 0, . . . ).
In questo modo l’anello R dei polinomi diviene un sottoanello dell’anello
delle serie formali di potenze S = A[[x1 , . . . , xn ]].
♥ Osservazione 6.1. Nel caso che A sia il campo reale R oppure complesso
C, allora le serie di potenze convergenti in un opportuno intorno dell’origine
formano un sottoanello S 0 di S, contenente ovviamente l’anello dei polinomi.
Sia f = (f0 , f1 , . . . , fk , . . . ) una serie di potenze non nulla. Il più piccolo
indice k per il quale fk è non nullo si chiama ordine di f , che denoteremo
con ord(f ). Se k = ord(f ) diremo che fk è la forma iniziale di f . (Qui forma
ha l’usuale significato di polinomio omogeneo.) Per convenzione porremo
ord(0) = ∞ e adotteremo la convenzione che ∞ + ∞ = ∞ e che n + ∞ = ∞
per ogni n ∈ N0 .

Teorema 6.2. Siano f e g serie di potenze di A[[x1 , . . . , xn ]]. Allora

ord(f + g) ≥ min{ord(f ), ord(g)} , (6.3)

ord(f g) ≥ ord(f ) + ord(g) . (6.4)

Inoltre, se A è un dominio d’integrità allora anche S è un dominio di integrità


e si ha
ord(f g) = ord(f ) + ord(g) . (6.5)

Dimostrazione. La prima è pressocché immediata. Per la seconda e terza


si osservi che nel prodotto la prima forma iniziale è eventualmente fh gk se
ord(f ) = h e ord(g) = k, e lo è certamente nel caso che A sia un dominio
d’integrità, perché allora anche l’anello dei polinomi lo è.

Le serie di potenze di ordine positivo formano un ideale di S. È l’ideale


generato da x1 , x2 , . . . , xn , che denoteremo con H. Per ogni intero q ≥ 1 l’i-
deale Hq consiste di tutte e sole le serie di potenze che hanno ordine maggiore
od uguale a q. Segue che

\
Hq = (0) .
q=1

Teorema 6.3. Se f = (f0 , f1 , . . . , fk , . . . ) è una serie di potenze, allora f è


invertibile in S se e solo se l’elemento f0 è invertibile in A.
90 Capitolo 6: Funzioni generatrici

Dimostrazione. Sia f invertibile: esiste g = (g0 , g1 , . . . , gk , . . . ) tale che f g =


1 (si ricordi che identifichiamo anche gli elementi di A con serie di potenze
e che 1 = (1, 0, . . . )). Allora segue f0 g0 = 1, e quindi f è un elemento
invertibile di A. Viceversa, se f0 è invertibile, possiamo determinare g =
(g0 , g1 , . . . , gk , . . . ), ove gk o è la forma nulla oppure è una forma di grado k,
tale che f g = 1. Infatti determiniamo g0 dall’equazione f0 g0 = 1, ottenendo
g0 = f0−1 (esiste la soluzione dal momento che f0 è invertibile). Determiniamo
quindi g1 dall’equazione f0 g1 + f1 g0 = 0, ottenendo

g1 = −f0−1 f1 g0 .

In generale determiniamo gk , con k ≥ 1, dall’equazione

f0 gk + f1 gk−1 + · · · + fk−1 g1 + fk g0 = 0 ,

che ha la soluzione

gk = −f0−1 (gk−1 f1 + · · · + g0 fk ) .

Per il modo con il quale vengono determinatle le forme gk si ha f g = 1.

Corollario 6.4. Se k è un campo, allora gli elementi invertibili dell’anello


delle serie di potenze k[[x1 , . . . , xn ]] sono le serie di potenze di ordine 0.
L’anello k[[x1 , . . . , xn ]] è un anello locale e il suo ideale massimale è l’ideale
H = hx1 , x2 , . . . , xn i.

L’anello A[[x1 , . . . , xn ]] delle serie formali di potenze è anche un anello


topologico. Mostriamo come possa introdursi su di esso una distanza che lo
rende uno spazio metrico. Fissiamo un numero reale r > 1. Per ogni f, g ∈ S
definiamo
d(f, g) = r−ord(f −g) .
Si noti che r−ord(f −g) è un numero reale se f 6= g. Se f = g allora ord(f −g) =
∞. Porremo convenzionalmente r∞ = 0. Con queste premesse è abbastanza
standard verificare che d è una distanza su S, cioè:

1. d(f, g) ≥ 0, per ogni f, g ∈ S e che d(f, g) = 0 se e solo se f = g;

2. d(f, g) + d(g, h) ≥ d(f, h) per ogni f, g, h ∈ S; e

3. d(f, g) = d(g, f ) per ogni f, g ∈ S.

Teorema 6.5. Lo spazio metrico (S, d) è completo, cioè ogni successione di


Cauchy è convergente.
6.2. Convergenza uniforme 91

La dimostrazione è abbastanza standard nell’ambito della teoria degli


spazi metrici. Ricordiamo soltanto alcune definizioni fondamentali.
Una successione di serie di potenze è un’applicazione da N0 in S. Come
è consuetudine identificheremo una successione con la sua immagine e scri-
veremo {f (t) }t≥0 per indicare una successione. Diremo che f ∈ S è un limite
della successione {f (t) }t≥0 per t → ∞ se per ogni numero reale  > 0 esiste
t() ∈ N0 tale che per ogni t > t() si abbia

d(f, f (t) ) <  . (6.6)

La (6.6) si scrive
(t) )
r−ord(f −f < . (6.7)
Se prendiamo  = r−k , con k ∈ N, allora (6.7) ci dà ord(f − f (t) ) > k. Ora
(t) (t) (t)
f = (f0 , f1 , . . . , fk , . . . ) e f (t) = (f0 , f1 , . . . , fk , . . . ). Quindi
(t) (t) (t)
f − f (t) = (f0 − f0 , f1 − f1 , fk − fk , . . . ) .

Allora dev’essere
(t) (t) (t)
f0 = f0 , f1 = f1 , . . . , fk = fk , per ogni t > t() = t(k) .

6.2 Convergenza uniforme


Sia X un insieme e sia (Y , dY ) uno spazio metrico. Supponiamo che {fn }n∈N0
sia una successione di funzioni fn : X → Y . L’insieme dei punti x ∈ X per i
quali la successione {fn (x)}n∈N0 (di Y ) converge è detto l’insieme di conver-
genza della successione (di funzioni) {fn }n∈N0 . Su questo sottoinsieme S di X
resta definita una funzione f : S → Y , che si chiama il limite puntuale della
successione. Questo tipo di convergenza è noto come convergenza puntuale.
Più importante è la convergenza uniforme, che presuppone quella puntuale.
Si dice che la successione {fn }n∈N0 converge uniformemente alla funzione
f : X → Y se per ogni numero reale  > 0 esiste un intero N () (dipendente
solo da ) tale che non appena n ≥ N () risulti

dY (f (x), fn (x)) <  , per ogni x ∈ X .

La funzione f si chiama il limite uniforme della successione. Scriveremo


f = limn→∞ fn e, salvo avviso contrario questo limite va inteso come limi-
te uniforme; altrimenti per essere più chiari aggiungeremo l’avverbio uni-
formemente. Una locuzione spesso usata è: la successione {fn } converge
uniformemente ad f .
92 Capitolo 6: Funzioni generatrici

Il caso che interessa è quando anche X è uno spazio metrico con funzione
distanza dX . Si ha il seguente

Teorema 6.6. Supponiamo che fn : (X , dX ) → (Y , dY ) sia continua


per ogni n ∈ N0 e che la successione {fn } converga uniformemente ad
f : (X , dX ) → (Y , dY ). Allora f è continua.

Dimostrazione. Fissiamo x0 ∈ X e  > 0. Vogliamo determinare δ tale che


dY (f (x0 ), f (x)) <  ogniqualvolta dX (x0 , x) < δ. Poiché f è limite uniforme
di {fn }, esiste una funzione fn tale che dY (f (x), fn (x)) < /3 per ogni
x ∈ X. Poiché fn è continua esiste δ > 0 tale che dY (fn (x0 ), fn (x)) < /3
ogniqualvolta dX (x0 , x) < δ. Pertanto, se dX (x0 , x) < δ, si ha

dY (f (x0 ), f (x)) ≤ dY (f (x0 ), fn (x0 ))+dY (fn (x0 ), fn (x))+dY (fn (x), f (x)) <  .

Consideriamo il caso particolare (Y , dY ) = (C , | |). Applichiamo le


considerazioniPprecedenti alle serie di funzioni. Se un : X → C per n ∈ N0 ,
l’espressione n∈N0 un si chiama una serie di funzioni. A questaP espressione
n
formale si dà un significato al seguente modo.
P Definiamo fn (x) = k=1 uk (x)
per ogni x ∈ X. Si dice che f (x) = u
n∈N0 n (x) se e solo se f (x) è il
P
limite puntuale della successione {fn (x)} per ogni x ∈ X. La serie n∈N0 un
converge uniformemente ad f se e solo se f è limite uniforme della successione
{fn }.

Teorema 6.7 (M–test di Weierstrass). Sia un : X → C una funzione tale


che |un (x)| ≤ Mn per ogni x ∈ X
P P (n ∈ N0 ) e supponiamo che la serie
n∈N0 M n sia convergente. Allora n∈N0 un è uniformemente convergente.

6.3 Funzioni generatrici


Sia R un campo. Una successione a valori in R è una funzione f : N0 → R.
Generalmente una successione viene indicata scrivendo la sua immagine:
{f (n)}n∈N0 e, di più, l’elemento f (n) viene indicato con fn , detto il coef-
ficiente n−esimo della successione. Un altro modo per descrivere la succes-
sione {an }n∈N0 è attraverso le serie formali di potenze, una generalizzazione
dei polinomi.
Una serie formale di potenze è un’espressione del tipo
X
an z n , (6.8)
n∈N0
6.3. Funzioni generatrici 93

che si chiama anche funzione generatrice della successione {an }. In questa


scrittura z appare come un semplice simbolo e le sue potenze z i servono da
“segnaposto” per gli elementi della successione. Si tratta di un modo diverso
di indicare la successione stessa, ma feconda di notevoli sviluppi. Come un
primo elementare esempio si ricordi il teorema del binomio:
n  
X n k
(1 + z)n = z
k
k=0

sicché la successione dei coefficienti binomiali (si osservi che n ∈ N è fissa-


to, mentre è k variabile in N0 ; i coefficienti della successione successivi all’
n−esimo sono nulli) ha per funzione generatrice il polinomio (1 + z)n .
Spieghiamo perché si parla di funzione generatrice. Supponiamo che z sia
una variabile complessa. Allora (6.8) è una serie di potenze che ha un suo
raggio di convergenza r ≥ 0. Se è r > 0, allora la serie definisce nel disco
|z| < r una funzione analitica . Lo studio di questa funzione possono essere
utili per derivare nuove proprietà della associata successione.
Vogliamo ora mostrare che l’insiene delle serie formali di potenze R[[z]] è
un anello. Premettiamo che due serie di potenze sono uguali se i coefficienti
di ugual posto sono uguali.
Proposizione 6.8. L’insieme R[[x]] è un anello con unità privo di divisori
dello zero (dominio di integrità), contenente come sottoanello l’anello dei
polinomi R[z].
Dimostrazione. Definiamo le operazioni e lasciamo al lettore i dettagli dimo-
strativi. L’operazione di addizione:
X X X
an z n + bn z n := (an + bn )z n .
n≥0 n≥0 n≥0

L’elemento neutro della addizione si indica con 0 (è la successione di tutti 0,


ove qui 0 è l’elemento neutro di R).
L’operazione di moltiplicazione (simile a quella dei polinomi):
  
X X X
 an z n   bn z n  := cn z n ,
n≥0 n≥0 n≥0

ove
n
X
cn := ak bn−k , per ogni n ∈ N0 .
k=0
L’elemento neutro è 1 (si assume coincidente con l’elemento neutro di R).
94 Capitolo 6: Funzioni generatrici

Caratterizziamo gli elementi invertibili di R[[z]] (nel seguito l’inverso di


a ∈ R, con a 6= 0, lo denoteremo con a−1 oppure con 1/a; la scrittura a/b
significherà il prodotto di a per l’inverso di b).
n
P
Proposizione 6.9. n≥0 an z è invertibile se e solo se a0 6= 0.

Dimostrazione. Cerchiamo se esiste n≥0 bn z n tale che


P

  
X X
 an z n   bn z n  = 1 .
n≥0 n≥0

Deve essere a0 b0 = 1. Pertanto, condizione necessaria perché la serie sia


che a0 6= 0. Ora se questa condizione è verificata, è subito visto
invertibile èP
che la serie n≥0 bn z n , con i coefficienti definiti induttivamente dalle
(
b0 = 1/a0
−a b −···−ak b0
bk = 1 k−1a0

verifica la condizione richiesta.


Capitolo 7

Trasformata di Fourier
discreta

Nell’era dei computers è naturale che quantità continue siano sostituite da


quantità finite. Problemi della combinatoria, che sono problemi discreti, pos-
sono avvantaggiarsi delle tecniche dell’analisi di Fourier. In fondo il trasporto
di questa teoria al caso discreto è abbastanza immediato. Lo spazio su cui si
applica questa teoria è l’anello delle classi resto modulo n, che sarà denotato
con il simbolo Z/nZ, per mettere in risalto il fatto che si tratta appunto del
quoziente dell’anello Z con l’ideale nZ (i multipli di n).
Le serie finite di Fourier sono abbastanza analoghe alle classiche serie di
Fourier utilizzate per lo studio di funzioni periodiche. Sembra che i mate-
matici abbiano in effetti considerato in principio la trasformata di Fourier
sulla circonferenza finita, prima ancora che Fourier stesso pubblicasse i suoi
lavori sulle serie di Fourier. Ad esempio Gauss applicò la trasformata di Fou-
rier discreta alla teoria dei numeri per sviluppare la legge della reciprocità
quadratica via le somme di Gauss (espressioni che coinvolgono esponenziali
complessi).

7.1 Lo spazio L2 (Z/nZ)


Consideremo il caso più semplice dell’analisi di Fourier finita, cioè quella
sul gruppo additivo Z/nZ. È un gruppo abeliano di ordine n ed è ciclico,
generato dalla classe resto 1 oppure −1. Seppure è il più semplice gruppo
abeliano per sviluppare l’analisi di Fourier, nondimeno è quello che sembra
sucettibile delle più svariate applicazioni. Per comodità di scrittura, poniamo
G = Z/nZ.
96 Capitolo 7: Trasformata di Fourier discreta

Definizione 7.1. L’insieme di tutte le funzioni f : G → C si denota con L2 (G).


Proposizione 7.2. L’insieme L2 (G) è uno spazio vettoriale complesso ri-
spetto all’addizione + e prodotto per uno scalare così definite:

(f + g)(x) = f (x) + g(x) , per ogni x ∈ G ;

(αf )(x) = αf (x) , per ogni α ∈ C ed ogni x ∈ G .


Inoltre
1. L2 (G) ha dimensione finita n = |G| ed una sua base è {δi | i ∈ G}
(dette funzioni delta), ove
(
1 se i ≡ j (mod n)
δi (j) = .
0 altrimenti

2. L2 (G) è dotato di prodotto hermitiano


X
hf, gi := f (x)g(x) , per ogni f, g ∈ L2 (G) .
x∈G

3. La base delle funzioni delta è una base ortonormale


La dimostrazione è lasciata per esercizio.
Utilizzando la base di cui sopra, possiamo sviluppare ogni funzione f : G →
C in “serie di Fourier”:
n−1
X
f (x) = f (a)δa (x) , dove f (a) = hf, δa i .
a=0

Si ha dunque un isomorfismo di spazi vettoriali T : L2 (G) → Cn , definito


ponendo
T (f ) = (f (0), f (1), . . . , f (n − 1)) .
Definizione 7.3. Siano f, g ∈ L2 (G). Definiamo convoluzione di f con g la
funzione f ∗ g ∈ L2 (G) tale che
X
(f ∗ g)(x) = f (y)g(x − y) , per ogni x ∈ G .
y∈G

Proposizione 7.4. Siano f, g, h ∈ L2 (G). Sussistone le seguenti proprietà:


1. f ∗ g = g ∗ f .
7.2. Proprietà della trasformata di Fourier 97

2. f ∗ (g ∗ h) = (f ∗ g) ∗ h.

3. δa ∗ δb = δa+b (mod n) .

4. (f ∗ δa )(x) = f (x − a).

La dimostrazione è lasciata per esercizio.


F Esercizio 7.5. Si consideri n = 15. Sia f = δ0 + δ1 + δ2 e g = 12 f . Si calcoli
f ∗ g. Si faccia poi il grafico di f e di f ∗ g.
♥ Osservazione 7.6. È certamente un’osservazione quasi banale il fatto che
l’operazione di convoluzione discreta è più semplice di quella continua (su
R): in questo caso infatti si devono calcolare integrali.
Ci sono due modi diversi di vedere la convoluzione. Il punto di vista
algebrico definisce L2 (G), con l’addizione puntuale, il prodotto per un nu-
mero complesso e l’operazione di convoluzione, come l’algebra gruppo di G.
È questo il punto di vista adottato nella teoria delle rappresentazioni dei
gruppi finiti. Dal punto di vista analitico o probabilistico, la convoluzione
corrisponde ad una somma di variabili casuali indipendenti.

7.2 Proprietà della trasformata di Fourier


Introduciamo ora la trasformata di Fourier discreta. Chi conosce la trasfor-
mata di Fourier classica si aspetta sviluppi in serie trigonometriche o in
esponenziali complessi, dato che

eix = cos x + i sin x .

In effetti gli esponenziali complessi appaiono. Continuiamo con la notazione


G = Z/nZ.
Definizione 7.7. Siano a , x ∈ G. Definiamo
 
2πiax
ea (x) := exp . (7.1)
n

È bene osservare che ea (x) non dipende dal rappresentante della classe
resto.
Nel seguito denoteremo con T il gruppo moltiplicativo dei numeri com-
plessi di modulo 1 (quindi T sta per 1−toro). Allora

ea : G → T
98 Capitolo 7: Trasformata di Fourier discreta

è un omomorfismo di gruppi. Tale omomorfismo è detto un carattere (od


anche rappresentazione 1−dimensionale) del gruppo G. Per i caratteri ea
sussistono le seguenti relazioni di ortogonalità:
Proposizione 7.8.
  (
X 2πiba n , a ≡ 0 (mod n)
hea , e0 i = exp = = nδ0 (a) . (7.2)
n 0 , altrimenti
b∈G
(
n , x ≡ y (mod n)
hex , ey i = = nδx (y) . (7.3)
0 , altrimenti
Definizione 7.9. La trasformata di Fourier discreta (da abbreviare con DT F )
è un’applicazione
Fn : L2 (G) → L2 (G)
così definita: per ogni f ∈ L2 (G)
X
Fn (f )(x) = fˆ(x) := f (y)ex (−y) = hf, ex i .
y∈G

La funzione fˆ è essa stessa detta trasformata di Fourier della f .


È immediato verificare che Fn è un operatore lineare. Elencheremo tra
un attimo le sue proprietà. Intanto vediamo una sua matrice.
F Esercizio 7.10. Sia {δa | a ∈ G} la base delle funzioni delta dello spazio
L2 (G). Allora la matrice di Fn in questa base è
 
Fn = ω −(j−1)(k−1) ,
1≤j,k≤n

dove ω = exp(2πi/n) è una radice primitiva n−esima dell’unità.


Si scriva questa matrice nei casi n = 2 e n = 4.
Teorema 7.11. DF T verifica le seguenti proprietà:
1. Fn : L( G) → L2 (G) è un automorfismo.
2. Convoluzione: Fn (f ∗ g)(x) = Fn (f )(x)Fn (g)(x), per ogni x ∈ G.
3. Inversione:
 
1 1X ˆ 2πixy
f (x) = Fn Fn (f )(−x) = f (y) exp .
n n n
y∈G

4. Uguaglianza di Parseval:
1 ˆ ˆ
hf, f i = hf , f i .
n
Capitolo 8

Teoria di Ramsey ed
Applicazioni
100 Capitolo 8: Teoria di Ramsey ed Applicazioni
Bibliografia

[1] T. Apostol, Introduction to analytic number theory.

[2] G. H. Hardy e E. M. Wright, An Introduction to the theory of numbers


(fifth edition). The Clarendon Press, Oxford, 1979.

[3] W. Rudin, Real and complex analysis.


Index

applicazione, 15 regola
biunivoca, 16 dell’addizione, 33
immagine, 15 della moltiplicazione, 33
iniettiva, 16 relazione, 19
suriettiva, 16 di equivalenza, 19

combinatoria, 7 sottografo, 29
configurazione combinatoria, 37 successione, 17, 98

divisione con resto, 23 teorema


doppio conteggio, 34 di Eulero, 35

Fibonacci, 11 unione, 17
numeri di, 11
funzione, 15
funzione analitica, 99

grafo, 26
isomorfismo, 26
matrice di adiacenza, 26

induzione
dimostrazione per, 21
principio di, 21
insieme
delle parti, 17
di indici, 17
intersezione, 17

partizione, 20
principio
della media, 36
prodotto cartesiano, 18

Potrebbero piacerti anche