Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nelle indagini statistiche si ricorre all’uso di elaboratori mediante i quali si esegue un “fitting di
dati”.
La prima fase del processo di risoluzione di un problema mediante elaboratore consiste nella
descrizione del problema mediante modello matematico.
Spesso le uniche informazioni sul problema in esame consistono in un insieme finito di dati:
- misure sperimentali;
- valori assunti da una funzione in certi punti;
- dati provenienti da indagini statistiche.
Dall’insieme di dati a disposizione si vuole costruire una funzione che rappresenti il fenomeno in
modo attendibile.
Esempio 1
Si vuole stimare la percentuale di crescita della popolazione italiana dal 1921 al 1981. Dati registrati
nei censimenti in migliaia:
1
Esempio 2
Le misure della forza F necessaria per estendere una molla, con costante di elasticità K, per piccoli
spostamenti x dalla posizione di equilibrio sono riportate nella tabella:
x 1 2 4 7 9 12
F 1,5 3,9 6,6 11,7 15,6 18,8
I due esempi mostrano che per trovare la funzione f(x) si può procedere in due modi:
1) determinare la funzione che assuma esattamente i punti (x, y) osservati (interpolazione per punti
noti, o interpolazione matematica);
2) determinare la funzione che si accosti il più possibile ai punti (x, y) osservati (interpolazione fra
punti noti, o interpolazione statistica).
La scelta di interpolare per via matematica o statistica dipende dalla qualità e quantità dei dati del
problema.
L’interpolazione matematica ci consente di costruire una funzione passante per punti assegnati e
descrive il problema mediante un modello che assume esatti i dati.
Nell’esempio 1 la funzione f(x) è la linea che passa per tutti i punti osservati di coordinate (x,P).
L’interpolazione statistica o approssimazione ci consente di costruire una funzione che si scosti
poco dai dati e descrive il problema mediante un modello che assume affetti da errore i dati.
Nell’esempio 2 la funzione f(x) è la retta di equazione F = 1,6x + 0,39 che passa fra l’insieme di
punti dei punti di coordinate (x,F).
2
Definizioni:
per interpolazione si intende la ricerca di una funzione matematica che approssima l’andamento di un
insieme di punti.
TIPI DI INTERPOLAZIONE
Interpolazione MATEMATICA
Calcola una funzione che passa PER tutti i punti
Interpolazione STATISTICA
Calcola una funzione che passa FRA i punti
Assegnati n punti (xi,yi) si vuole costruire un polinomio p(x) che nei nodi xi soddisfi le condizioni:
Di che grado deve essere il polinomio interpolante affinché esista e sia unico?
Le “a” sono i parametri e sono in numero uguale ai punti attraverso i quali bisognerà interpolare.
Esempio
Cercare l’equazione di una funzione passante per i punti: A(0;4), B(0,5;10), C(1;15).
passaggio per A: a0 = 4
passaggio per B: a0 + 0,5a1 + 0,52a2 = 10
passaggio per C: a0 + 1a1 + 12a2 = 15
3
Esempio
Si cerchi una funzione p(x) che passi per le coppie date nella seguente tabella:
x p(x)
0 1
1 2
2 17
3 82
Se la funzione y = p(x) è cercata nell’insieme dei polinomi di grado 3, allora dovrà risultare
a0 = 1
a0 + a11 + a21 + a31 = 2
a0 + a12 + a24 + a38 = 17
a0 + a13 + a29 + a327 = 82
la cui soluzione è
a0 = 1, a1 = 6, a2 = -11, a3 = 6
Dati n punti (xi,yi), i = 1,2,……n si vuole costruire il polinomio interpolante di grado n-1 passante
per i punti assegnati:
p(xi) = yi, i = 1,……,n
.................................................................
a + a x + a x 2 + ………. + a x n-1 = y
0 1 n 2 n n -1 n n
4
La ricerca del polinomio interpolatore può essere effettuata anche con un altro metodo.
Esempio
Si vuole determinare il polinomio p(x) di grado 2 tale che
x y
0 -1
1 2
2 7
(x – 1)(x – 2)
l1(x) =
(0 – 1)(0 – 2)
(x – 0)(x – 2)
l2(x) =
(1 – 0)(1- 2)
(x – 0)(x – 1)
l3(x) =
(2 – 0)(2- 1)
Esempio
Scrivere il polinomio di Lagrange interpolante i punti: A(0;-5), B(1;-6), C(2;-1), D(3;16).
(x – 1)(x – 2)(x – 3)
l1(x) =
(0 – 1)(0 – 2)(0 – 3)
(x – 0)(x – 2)(x – 3)
l2(x) =
(1 – 0)(1 – 2)(1 – 3)
(x – 0)(x – 1)(x – 3)
l3(x) =
(2 – 0)(2 – 1)(2 – 3)
(x – 0)(x – 1)(x – 2)
l4(x) =
(3 – 0)(3 – 1)(3 – 2)
5
FORMULA DI LAGRANGE
3. Interpolazione statistica
6
In generale esiste più di una curva di un certo tipo che interpola l’insieme dei dati.
Al fine di evitare l’intervento della valutazione personale nella costruzione di rette, parabole o altre
curve interpolatrici è necessario mettersi d’accordo su una definizione della “migliore retta
interpolatrice”, “migliore parabola interpolatrice”, e così via.
Quando si è scelto un certo tipo di interpolante, per es. una parabola (vedi il grafico riportato sotto),
è evidente che ne esistono infinite che passano fra i punti dati, per cui bisogna scegliere un certo
criterio per l’individuazione di quella più adatta (criterio di accostamento).
INTERPOLAZIONE STATISTICA
La condizione di accostamento più usata è quella detta “metodo dei minimi quadrati”.
Questo metodo consiste nel determinare i parametri della funzione interpolante prescelta in modo
che sia minima la somma dei quadrati degli scostamenti dei punti dalla funzione.
7
Definizione:
Una curva avente questa proprietà è detta interpolare i dati nel senso dei minimi quadrati ed è detta
“curva di regressione dei minimi quadrati”, o semplicemente “curva dei minimi quadrati”. Una
retta con questa proprietà sarà quindi detta “retta dei minimi quadrati”, una parabola, “parabola dei
minimi quadrati”, e così via.
E’ usuale servirsi della definizione vista quando x è la variabile indipendente ed y la variabile
dipendente. Se x è la variabile dipendente, la definizione viene modificata introducendo errori
orizzontali anziché verticali, che corrisponde ad uno scambio degli assi del diagramma. In generale
queste due definizioni conducono a due diverse curve dei minimi quadrati.
x x1 x2 … xn
y y1 y2 … yn
8
La formula (1) può essere messa anche sotto la forma:
ax + b – y = 0. (2)
Poiché i punti (xi,yi) non stanno esattamente sulla nostra retta, le formule (1) e (2) sono formule
approssimate. Pertanto, introducendo nella (2) al posto di x e y i loro valori x1,y1; x2,y2;…; xn,yn,
riportati nella tabella, otteniamo un sistema di uguaglianze:
ax 1 + b - y1 = d 1
ax + b - y = d
2 2 2
…………………
ax n + b - y n = d n
n
f (a, b ) = ∑ (ax i + b − y i ) ⇒ minima
2
i =1
a ∑ x i + bn = ∑ y i
(3)
a ∑ x i + b∑ x i = ∑ x i y i
2
che sono dette “equazioni normali” della retta dei minimi quadrati.
Le equazioni normali si possono facilmente ricordare osservando che si può ottenere la prima
equazione sommando da entrambi i membri della (1) mentre la seconda equazione si ottiene
moltiplicando entrambi i membri della (1) per x e poi sommando.
9
La soluzione del sistema di equazioni normali è data da:
n∑ x i yi − ∑ x i ⋅ ∑ yi ∑x ⋅∑y − ∑x y ⋅∑x
2
a= b=
i i i i i
n ∑ x − (∑ x i ) n ∑ x − (∑ x )
2 2 2 2 (4)
i i i
Esempio
Dai dati la seguente tabella determinare la retta dei minimi quadrati:
x 1 3 4 6 8 9 11 14
y 1 2 4 4 5 7 8 9
a ∑ x + bn = ∑ y
a ∑ x + b∑ x = ∑ xy
2
x y x2 xy y2
1 1 1 1 1
3 2 9 6 4
4 4 16 16 16
6 4 36 24 16
8 5 64 40 25
9 7 81 63 49
11 8 121 88 64
14 9 196 126 81
∑ x = 56 ∑ y = 40 ∑ x 2 = 524 ∑ xy = 364 ∑ y 2 = 256
Poiché ci sono 8 coppie di valori di x e y, n = 8 e le equazioni normali diventano
10
56a + 8b = 40
524a + 56b = 364
a = 0,636 b = 0,545
y = 0,636x + 0,545
a=
n ∑ xy − ∑ x ⋅ ∑ y
=
(8)(364) − (56)(40) = 0,636
n ∑ x − (∑ x ) (8)(524) − (56)2
2 2
b=
∑ x ⋅ ∑ y − ∑ xy ⋅ ∑ x = (524)(40) − (364)(56) = 0,545
2
n ∑ x − (∑ x ) (8)(524) − (56)
2 2 2
Si può semplificare la determinazione della retta dei minimi quadrati riscrivendo le (4) in un’altra
forma, ottenuta a partire da alcune considerazioni geometriche.
11
OSSERVAZIONE
essendo x =
∑ x i e y = ∑ y i le medie aritmetiche, rispettivamente, dei valori x e y.
n n
Sottraendo membro a membro dall’equazione della retta, si ha: y - y = a(x − x )
x' = x - x
y' = y - y
prendendo come nuova origine il punto ( x , y ), la retta
interpolante ha equazione:
y' = ax'
Con opportuni calcoli si giunge alla forma più nota e
comoda per il calcolo di a e b:
a=
∑ x ' y ' = ∑ (x − x ) ⋅ (y − y)
i i i i
∑ (x ' )i
2
∑ (x − x ) i
2
(5)
b = y − ax
Esempio
Utilizzando i dati dell’esempio precedente costruiamo la seguente tabella.
x y x - x y-y (x - x )( y - y ) (x - x )2
1 1 -6 -4 24 36
3 2 -4 -3 12 16
4 4 -3 -1 3 9
6 4 -1 -1 1 1
8 5 1 0 0 1
9 7 2 2 4 4
11 8 4 3 12 16
14 9 7 4 28 49
∑ x = 56 ∑ y = 40 ∑ (x - x )(y − y) = 84 ∑ (x - x ) = 132
2
x =7 y =5
∑ (x − x ) ⋅ (y − y) 84
a= = = 0,636 b = y − a x = 0,545
∑ (x − x )
2
132
12
4.2 La parabola dei minimi quadrati
La parabola dei minimi quadrati interpolante l’insieme dei punti (x1,y1), (x2,y2), …, (xn,yn) può
essere espressa dall’equazione: y = ax2 + bx + c,
dove i coefficienti a, b, c vengono determinati trovando il minimo della funzione a tre variabili:
( )
n
f (a, b, c ) = ∑ ax i + bx i + c − y i
2 2
⇒ minima
i =1
a ∑ x i 4 + b∑ x i 3 + c∑ x i 2 = ∑ x i 2 y i
a ∑ x i + b ∑ x i + c∑ x i = ∑ x i y i
3 2
(6)
a ∑ x i + b∑ x i + nc = ∑ y i
2
Esempio
Adattare una parabola dei minimi quadrati ai dati della seguente tabella:
x 1 2 4 6 8 12
y 9 5 4 5 6 10
x y x2 x3 xyx4 x2 y
1 9 1 1 91 9
2 5 4 8 16
10 20
4 4 16 64 256
16 64
6 5 36 216 1296
30 180
8 6 64 512 4096
48 384
12 10 144 1728 20736
120 1440
∑ x = 33 ∑ y = 39 ∑ x = 265 ∑ x = 2529 ∑ x = 26401 ∑ xy = 233 ∑ x 2 y = 2097
2 3 4
Risolvendo si ottiene:
a = 0,145
b = -1,636
c = 9,105
13
5. Rette e coefficienti di regressione
che è detta “ retta di regressione di y rispetto a x”. Il coefficiente angolare a1 è detto “coefficiente di
regressione di y rispetto a x”.
In modo analogo, si può calcolare l’equazione della “retta di regressione di x rispetto a y”, che ha
equazione:
x = a2y + b2,
dove:
∑ (x i − x ) ⋅ (y i − y )
a2= , b2 = x − a 2 y
∑ (y i − y )
2
OSSERVAZIONI
1. I due coefficienti di regressione hanno sempre lo stesso segno, perché hanno lo stesso
numeratore e al denominatore un numero sempre positivo.
3. Se sovrapponiamo in uno stesso diagramma le due rette di regressione, esse passano per il
“centro di distribuzione”, cioè per il punto di coordinate x , y .
Esempio
Data la tabella
x 1 3 4 6 8 9 11 14
y 1 2 4 4 5 7 8 9
14
x y x -x y -y (x - x )(y - y ) (x - x )2 (y - y )2
1 1 -6 -4 24 36 16
3 2 -4 -3 12 16 9
4 4 -3 -1 3 9 1
6 4 -1 -1 1 1 1
8 5 1 0 0 1 0
9 7 2 2 4 4 4
11 8 4 3 12 16 9
14 9 7 4 28 49 16
∑ x = 56 ∑ y = 40 ∑ (x - x )(y − y) = 84 ∑ (x - x ) = 132 ∑ (y - y) = 56
2 2
x =7 y =5
∑ (x − x ) ⋅ (y − y) 84 ∑ (x − x ) ⋅ (y − y)
a1 = = = 0,64 a 2= = 1,50
∑ (x − x ) ∑ (y − y)
2 2
132
b1 = y − a1 x = 0,55 b 2 = x − a 2 y = -0,50
15
6. La correlazione
Finora abbiamo considerato il problema della regressione di una variabile rispetto ad un’altra.
Passiamo ora a studiare il problema della “correlazione” che ha lo scopo di misurare il grado di
interdipendenza tra variabili.
Definizioni
Si dice che due variabili sono perfettamente correlate, ossia che tra esse esiste una “correlazione
perfetta”, se tutti i valori delle variabili soddisfano esattamente un’equazione.
Esempio: l’area A e il raggio r di un cerchio sono perfettamente correlate, dal fatto che A = πr2.
Si dice che due varibili sono incorrelate (o indipendenti) se non esiste alcuna relazione tra i loro
valori.
Esempio: se due monete regolari sono lanciate simultaneamente 200 volte, non c’è alcuna
relazione tra gli esiti (testa o croce) delle due monete.
In questi casi, si cerca appunto di determinare il grado di “interdipendenza”, nel senso che si vuole
vedere se si è più prossimi alla indipendenza, oppure alla correlazione perfetta (o dipendenza
funzionale).
Come nel caso della regressione, ci limiteremo allo studio della correlazione tra due variabili. In tal
caso si parla di “correlazione semplice”.
Come nel caso della regressione, si può parlare di “correlazione lineare”, oppure “non lineare”.
La più importante è certamente la prima, alla quale si limita il nostro studio.
La misura della correlazione lineare tra due variabili viene dal “coefficiente di correlazione
lineare” di BRAVAIS-PEARSON, così definito:
∑ (x i − x ) ⋅ (y i − y) σ xy
r = ± a 1a 2 = =
∑ (x i − x ) ⋅ ∑ (y i − y)
2 2 σx ⋅ σy
Dove
∑ (x i − x ) ⋅ (y i − y)
σ xy = è la covarianza di x e y
n
∑ (x i − x ) ∑ (y i − y)
2 2
σx = e σy = sono gli scarti quadratici medi di x e y.
n n
16
OSSERVAZIONI
0<r<1 -1<r<0
Esempio
Il coefficiente di correlazione lineare relativo ai dati riportati nell’esempio a pagina 15 è:
r = a 1a 2 = (0,64)(1,50) = 0,98
Dalle osservazioni fatte, essendo 0 < r < 1, possiamo affermare che tra le variabili x e y esiste una
correlazione diretta, come era stato evidenziato dalla rappresentazione delle due rette di regressione.
17