INTERPOLAZIONE
In Statistica e in genere nelle scienze
sperimentali, si studiano o si osservano
“relazioni” fra grandezze
Per esempio si può pensare allo studio della
relazione fra reddito e risparmio di una
popolazione oppure alla relazione tra
altezza e peso dei militari, ecc.
Di solito, i punti osservati si dispongono
su un diagramma chiamato diagramma
a dispersione:
1200
1000
RISPARMIO
800
600
400
200
0
0 500 1000 1500 2000 2500 3000 3500
REDDITO
Partendo da queste coppie di dati (x, y), si
vuole determinare la funzione
y = f(x)
che descrive il fenomeno
Definizione:
per interpolazione si intende la ricerca di
una funzione matematica che
approssima l’andamento di un insieme
di punti.
Per trovare la funzione si può procedere in due
modi:
1)determinare la funzione che assuma
esattamente i punti (x, y) osservati
(interpolazione per punti noti, o interpolazione
matematica);
2) determinare la funzione che si accosti il più
possibile ai punti (x, y) osservati
(interpolazione fra punti noti, o interpolazione
statistica).
TIPI DI INTERPOLAZIONE
Interpolazione MATEMATICA
Calcola una funzione che
passa PER tutti i punti
Interpolazione STATISTICA
Calcola una funzione che passa FRA i punti
A CHE COSA SERVE ?
inserimento di uno o più dati in una serie
che presenta vuoti.
ESTRAPOLAZIONE (valutazione di valori
esterni alla serie dei dati).
PEREQUAZIONE (livellazione o
“regolazione” dei dati di una serie non
regolare attraverso la “sostituzione” al
posto dei dati rilevati, di dati ottenuti dalla
funzione matematica trovata).
INTERPOLAZIONE MATEMATICA
SI UTILIZZA QUANDO LA FUNZIONE Y=f(X) DEVE
PASSARE PER TUTTI I PUNTI OSSERVATI.
La scelta della funzione interpolante dipende dai casi,
ma la funzione più usuale è quella espressa da un
polinomio di grado pari a superiore a n-1 se i punti sono
n:
y= a0 + a1x + a2x2 +...+ an-1 xn-1
in cui, le “a” sono i parametri e sono in numero uguale ai
punti attraverso i quali bisognerà interpolare.
Per esempio, se i punti fossero 3, la funzione sarebbe:
y=a0+a1x+a2x2
ESEMPIO
Esempio:
Un insegnante deve trasporre delle valutazioni degli scritti
dell’esame di stato da punteggio grezzo, in formato
percentuale, a punteggio finale, in 15esimi; vuole
mantenere le seguenti corrispondenze:
punteggio grezzo (x) punteggio finale (y)
0% 4
50% 10
100% 15
Si tratta di determinare l’equazione di una funzione di
secondo grado y=a0+a1x+a2x2 in quanto i punti da
interpolare sono 3: A(0;4), B(0,5;10), C(1;15).
Si costruisce un sistema imponendo le
condizioni di passaggio della funzione per
i 3 punti:
passaggio per A: 4=a0
passaggio per B: 10=a0 + 0,5²a2 + 0,5a1
passaggio per C: 15= a0 + 1²a2 + 1a1
Il sistema, risolto, da la seguente funzione:
y=-2x²+13x+4
Il polinomio interpolatore
le formule di Lagrange e di Newton
Supponiamo di avere n punti sul piano cartesiano, (x1,
y1), (x2, y2), ..., (xn, yn).
Come si può fare per scrivere una funzione
polinomiale y = P(x) che passi per tutti i punti dati?
La formula generale di Lagrange, scritta per esteso, è la seguente:
Equazione della curva polinomiale di grado (n-1), passante per i punti (x1, y1),
(x2, y2), ..., (xn, yn)
INTERPOLAZIONE
STATISTICA
Mentre nella interpolazione matematica la
funzione interpolante deve passare per tutti i punti
sperimentali, nell’interpolazione statistica la
funzione passa attraverso i punti osservati.
L’interpolazione statistica viene utilizzata quando il numero di punti
sperimentali è elevato
3
Y
0
0 1 2 3 4 5 6
X
E’ necessario che la funzione interpolante
passi il più vicino possibile ai valori
interpolati.
Ci sono vari metodi per attuare ciò, ma il
più usato è quello dei minimi quadrati
Questo metodo consiste nel determinare i
parametri della funzione interpolante prescelta in
modo che sia minima la somma dei quadrati degli
scostamenti dei punti dalla funzione
La condizione di accostamento è dunque la
seguente:
∑ (y − yˆ i ) ⇒ minima
2
i
i= 1 yi
ŷ
xi
La funzione teorica può assumere differenti
aspetti
RETTA
PARABOLA
FUNZIONE ESPONENZIALE
CASO DELLA RETTA
Ŷ = bx + a i parametri da determinare sono quindi a e b
n
f ( a, b ) = ∑ (y − bxi − a ) ⇒ minima
2
i
i= 1
Questa è una funzione a due variabili di cui occorre trovare il minimo
Si procede con la soluzione del sistema che pone le
derivate parziali prime uguali a zero per la ricerca
di eventuali punti critici:
f 'b = 2∑ ( bxi + a − yi ) ⋅ xi = 0 b∑ xi 2 + a ∑ xi = ∑ xi yi
f 'a = 2∑ ( bxi + a − yi ) ⋅ 1 = 0 b∑ xi + na = ∑ yi
Utilizzando il metodo di Cramer si giunge alle soluzioni del
sistema
∑ yi ⋅ ∑ xi − ∑ xi yi ⋅ ∑ xi
2
a =
∑ i ∑ i
2
n x − ( x ) 2
n∑ x y − ∑ x ⋅ ∑ y
b = i i i i
2 − (∑ x ) 2
n ∑ x
i i
E’ evidente che è difficile memorizzare le precedenti soluzioni.
Esistono allora due procedimenti che è possibile seguire:
1° procedimento
Si calcola il fattore b utilizzando la formula
n∑ x ⋅ y − ∑ x ⋅ ∑ y
b= i i i i
n∑ x 2 − (∑ x ) 2
i i
Mentre il fattore a si può ricavare dalla seconda equazione del sistema
a = y − b⋅ x y x Sono le medie delle
X e delle Y
ESEMPIO
X Y XY x2
1 12 12 1
2 13,5 27 4
3 14,8 44,4 9
4 16,5 66 16
5 18,2 91 25
TOT. 15 75 240,4 55
5 ⋅ 240,4 − 15 ⋅ 75
b= = 1,54
5 ⋅ 55 − 15 2
15 75
X = = 3 Y = = 15
5 5
a = Y − b ⋅ X = 15 − 1,54 ⋅ 3 = 10,38
2° Procedimento
Con questo procedimento si procede al calcolo delle medie dei valori
sperimentali di X e Y e successivamente si calcolano gli scarti dalla
media
b=
∑ xi '⋅ y i '
=
∑ ( xi − X ) ⋅ ( y i − Y )
∑ ( xi ' ) 2
∑ ( xi − X )
2
a = Y − b⋅ X
ESEMPIO
X Y X' Y' X'Y' X'2
1 10 -2 -15 30 4
2 17 -1 -8 8 1
3 26 0 1 0 0
4 32 1 7 7 1
5 40 2 15 30 4
tot 15 125 0 0 75 10
= 15/5 =3 ∑ ( x − X ) ⋅ ( y − Y ) 75
X
b= i i = = 7,5
∑ (x − X )
2
10
Y = 125/5 = 25 i
a = Y − b ⋅ X = 25 − 7,5 ⋅ 3 = 2,5
PERTANTO LA RETTA INTERPOLATRICE HA EQUAZIONE
Y = 2,5+ 7,5 X
45
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
INDICI DI ACCOSTAMENTO
Per valutare la bontà dell’accostamento tra i dati sperimentali e la
funzione ottenuta con i minimi quadrati si utilizzano alcuni indici
∑ yi − yˆ
Indice lineare: I =
1 ∑ yˆ i
2
∑ ( yi − yˆ i )
Indice quadratico n
I valori degli indici
I =
2 ∑ ˆi
y devono essere molto
n piccoli inferiori a 0.1
CASO DELLA PARABOLA
y = ax + bx + c 2
∑ ( ax )
n
f ( a , b, c ) =
2 2
i + bxi + c − y i ⇒ minima
i= 1
La condizione di accostamento è la seguente:
Si tratta dunque di calcolare il minimo di una funzione a tre variabili [f(a,b,c)].
Si procede con la soluzione del sistema che pone le derivate parziali prime
uguali a zero per la ricerca del punto critico (minimo relativo, in questo caso):
( )
f ' a = 2∑ axi 2 + bx i + c − y i ⋅ xi 2 = 0
( )
f 'b = 2∑ axi + bxi + c − y i ⋅ xi = 0
2
( )
f ' c = 2∑ axi + bxi + c − y i ⋅ 1 = 0
2
a ∑ xi + b ∑ xi + c ∑ xi = ∑ xi y i
4 3 2 2
a ∑ xi + b ∑ xi + c ∑ xi = ∑ xi y i
3 2
a ∑ xi + b∑ xi + nc = ∑ y i
2
Esempio:
Calcolare e rappresentare graficamente la parabola interpolante a
minimi quadrati per i seguenti punti:
x 1 2 4 6 8 12
y 9 5 4 5 6 10
Svolgimento:
Conviene sviluppare i calcoli per le varie sommatorie in tabella
(facilmente adattabile ad un foglio elettronico) come segue:
x y x2 x3 x4 xy x2y y teorico
1 9 1 1 1 9 9 7,61
2 5 4 8 16 10 20 6,41
4 4 16 64 256 16 64 4,88
6 5 36 216 1296 30 180 4,5
8 6 64 512 4096 48 384 5,28
12 10 144 1728 20736 120 1440 10,32
33 39 265 2529 26401 233 2097
Si imposta e si risolve il
seguente sistema
26.401a + 2.529b + 265c = 2.097
2.529a + 265b + 33c = 233
265a + 33b + 6c = 39
ottenendo la seguente funzione
y = 0,1448x² - 1,6363x + 9,1052
12
10 y = 0,1448x2 - 1,6363x + 9,1052
6
4 y
2 y teorico
0 y teorico
0 2 4 6 8 10 12 14
REGRESSIONE E
CORRELAZIONE
REDDITO* SPESE*
* In migliaia di euro
10 2
15 2,3
18 2,1
20 2,5
22 2,6
25 2,5
30 3
La domanda è la seguente:
esiste un legame tra le due variabili statistiche?
E se esiste quanto è forte o debole questo legame?
REGRESSIONE E CORRELAZIONE
Lo studio della regressione e della correlazione si
occupa della ricerca del legame e della “misurazione”
di tale legame tra due variabili statistiche.
Nel nostro corso si tratta della regressione e della correlazione lineare
intendendo che viene ricercato tra le variabili statistiche un legame di tipo
lineare
Lo studio può esser condotto in due modi:
• attraverso la regressione ( si ricerca il legame tra le due variabili statistiche
esprimendolo attraverso una funzione matematica)
• attraverso la correlazione ricercando la forza o debolezza di tale legame con il
calcolo di un indice
REGRESSIONE
Il termine regressione fu introdotto da Galton (1822-1911) a seguito di uno
studio sull’ereditarietà dei caratteri biologici di tipo quantitativo.
In particolare Galton prese in esame due variabili costituite rispettivamente
dalle altezze dei padri e dalle altezze dei figli.
Egli rilevò che le altezze dei figli di padri molto alti erano mediamente inferiori
a quelle dei padri, o più precisamente, regredivano verso la media
generale delle altezze della popolazione
Galton chiamò regressione tale tendenza
In generale in statistica lo studio della regressione consiste nella determinazione
di una funzione matematica che esprima la relazione tra due variabili
Siano X e Y due variabili statistiche misure di due caratteri quantitativi di
popolazione statistica (ex: X = Reddito e Y = Spese)
La REGRESSIONE: studia come una variabile varia al variare
dell’altra
determina una funzione matematica che esprima come una
variabile varia al variare dell’altra
Si parla di regressione lineare se la funzione è di tipo lineare
Utilizzando il metodo dei minimi quadrati si determinano due rette di
regressione:
La retta che esprime Y come funzione della X : y = b 1 x + a1
E la retta che esprime la X come funzione della Y : x= b2 y + a2
b1, b2: coefficienti di regressione
FORMULE PER IL CALCOLO : 1° procedimento
n∑ x ⋅ y − ∑ x ⋅ ∑ y
b1 = i i i i a1 = y − b ⋅ x
n∑ x 2 − (∑ x ) 2
i i
n∑ x ⋅ y − ∑ x ⋅ ∑ y
b2 = i i i i a2 = x − b ⋅ y
n∑ y 2 − (∑ y ) 2
i i
Sono le medie
y x delle x e delle y
FORMULE PER IL CALCOLO: 2° procedimento
n
∑ ( x − x )( y − y )
i i
b = i = 1 a = y− b x
1 n 2 1 1
∑ ( x − x)
i
i =1
n
∑ ( x − x )( y − y )
i i
b = i = 1 a = x−b y
2 n 2 2 2
∑ ( y − y)
i
i =1
b1 E b2 HANNO SEMPRE LO STESSO SEGNO
Se b1 e b2 sono positivi
esiste un legame lineare
diretto (all’aumentare di una
variabile aumenta l’altra)
Se b1 e b2 sono negativi
esiste un legame lineare inverso
(all’aumentare di una variabile
diminuisce l’altra)
esiste un legame lineare
b =
1 perfetto (diretto o
Se 1 b
2 inverso in base al segno
dei coefficienti) e le due
rette sono coincidenti
Se b1 = b2 =0 esiste indipendenza
lineare( le due rette sono parallele agli assi
cartesiani)
CORRELAZIONE LINEARE
La CORRELAZIONE studia quanto le variabili sono collegate fra di loro
misurando l’intensità del legame di interdipendenza fra le due variabili
Talvolta lo studio della correlazione precede quello della regressione in
quanto una variabile viene confrontata con tante altre per vedere con
quale risulti più connessa
Nello studio della correlazione si procede al
calcolo di un indice:
Si usa il segno +
se b1 e b2 sono
positivi
r = Indice di Bravais-Pearson = ± b1 ⋅ b2
Si usa il segno –
dove b1 e b2 sono i coefficienti di regressione se i coefficienti b1
e b2 sono
negativi
IL coefficiente r ha un campo di variazione: − 1≤ r ≤ 1
Un altro modo per definire il coefficiente di Bravais –Pearson è quello di
definirlo come rapporto tra la covarianza di x e y e il prodotto degli scarti
quadratici medi di x e di y.
σ
xy
r =
σ ⋅σ
x y
Dove :
∑ x ' y'
σ = covarianza
yy n
2 2
s.q.m. ∑ ( x' ) ∑ ( y' )
σ = σ =
x n y n
− 1≤ r ≤ 1
se r= -1 esiste una correlazione lineare perfetta negativa
Le due rette sono
sovrapposte(‘l’angolo
tra le rette è nullo)
se r= +1 esiste una correlazione lineare perfetta positiva
Le due rette sono
sovrapposte(‘l’angolo
tra le rette è nullo)
se r= 0 esiste INDIPENDENZA LINEARE fra le due variabili
− 1≤ r ≤ 0
0≤ r ≤ 1