Sei sulla pagina 1di 46

INTERPOLAZIONE

In Statistica e in genere nelle scienze


sperimentali, si studiano o si osservano
“relazioni” fra grandezze
Per esempio si può pensare allo studio della
relazione fra reddito e risparmio di una
popolazione oppure alla relazione tra
altezza e peso dei militari, ecc.
 Di solito, i punti osservati si dispongono
su un diagramma chiamato diagramma
a dispersione:
1200

1000
RISPARMIO

800

600

400

200

0
0 500 1000 1500 2000 2500 3000 3500
REDDITO
Partendo da queste coppie di dati (x, y), si
vuole determinare la funzione

y = f(x)

che descrive il fenomeno


Definizione:

per interpolazione si intende la ricerca di


una funzione matematica che
approssima l’andamento di un insieme
di punti.
Per trovare la funzione si può procedere in due
modi:

1)determinare la funzione che assuma


esattamente i punti (x, y) osservati
(interpolazione per punti noti, o interpolazione
matematica);

2) determinare la funzione che si accosti il più


possibile ai punti (x, y) osservati
(interpolazione fra punti noti, o interpolazione
statistica).
TIPI DI INTERPOLAZIONE

Interpolazione MATEMATICA
Calcola una funzione che
passa PER tutti i punti

Interpolazione STATISTICA
Calcola una funzione che passa FRA i punti
A CHE COSA SERVE ?
 inserimento di uno o più dati in una serie
che presenta vuoti.
 ESTRAPOLAZIONE (valutazione di valori
esterni alla serie dei dati).
 PEREQUAZIONE (livellazione o
“regolazione” dei dati di una serie non
regolare attraverso la “sostituzione” al
posto dei dati rilevati, di dati ottenuti dalla
funzione matematica trovata).
INTERPOLAZIONE MATEMATICA
 SI UTILIZZA QUANDO LA FUNZIONE Y=f(X) DEVE
PASSARE PER TUTTI I PUNTI OSSERVATI.

 La scelta della funzione interpolante dipende dai casi,


ma la funzione più usuale è quella espressa da un
polinomio di grado pari a superiore a n-1 se i punti sono
n:
 y= a0 + a1x + a2x2 +...+ an-1 xn-1

 in cui, le “a” sono i parametri e sono in numero uguale ai


punti attraverso i quali bisognerà interpolare.

 Per esempio, se i punti fossero 3, la funzione sarebbe:


y=a0+a1x+a2x2
ESEMPIO
 Esempio:
 Un insegnante deve trasporre delle valutazioni degli scritti
dell’esame di stato da punteggio grezzo, in formato
percentuale, a punteggio finale, in 15esimi; vuole
mantenere le seguenti corrispondenze:
punteggio grezzo (x) punteggio finale (y)
0% 4
50% 10
100% 15

 Si tratta di determinare l’equazione di una funzione di


secondo grado y=a0+a1x+a2x2 in quanto i punti da
interpolare sono 3: A(0;4), B(0,5;10), C(1;15).
 Si costruisce un sistema imponendo le
condizioni di passaggio della funzione per
i 3 punti:
passaggio per A: 4=a0
passaggio per B: 10=a0 + 0,5²a2 + 0,5a1
passaggio per C: 15= a0 + 1²a2 + 1a1
 Il sistema, risolto, da la seguente funzione:
y=-2x²+13x+4
Il polinomio interpolatore
le formule di Lagrange e di Newton

Supponiamo di avere n punti sul piano cartesiano, (x1,


y1), (x2, y2), ..., (xn, yn).
Come si può fare per scrivere una funzione
polinomiale y = P(x) che passi per tutti i punti dati?
La formula generale di Lagrange, scritta per esteso, è la seguente:

Equazione della curva polinomiale di grado (n-1), passante per i punti (x1, y1),
(x2, y2), ..., (xn, yn)
INTERPOLAZIONE
STATISTICA
 Mentre nella interpolazione matematica la
funzione interpolante deve passare per tutti i punti
sperimentali, nell’interpolazione statistica la
funzione passa attraverso i punti osservati.
L’interpolazione statistica viene utilizzata quando il numero di punti
sperimentali è elevato

3
Y

0
0 1 2 3 4 5 6
X
 E’ necessario che la funzione interpolante
passi il più vicino possibile ai valori
interpolati.

 Ci sono vari metodi per attuare ciò, ma il


più usato è quello dei minimi quadrati
 Questo metodo consiste nel determinare i
parametri della funzione interpolante prescelta in
modo che sia minima la somma dei quadrati degli
scostamenti dei punti dalla funzione
 La condizione di accostamento è dunque la
seguente:

∑ (y − yˆ i ) ⇒ minima
2
i
i= 1 yi
ŷ

xi
La funzione teorica può assumere differenti
aspetti

RETTA

PARABOLA

FUNZIONE ESPONENZIALE
CASO DELLA RETTA
Ŷ = bx + a i parametri da determinare sono quindi a e b
n
f ( a, b ) = ∑ (y − bxi − a ) ⇒ minima
2
i
i= 1
Questa è una funzione a due variabili di cui occorre trovare il minimo
Si procede con la soluzione del sistema che pone le
derivate parziali prime uguali a zero per la ricerca
di eventuali punti critici:

 f 'b = 2∑ ( bxi + a − yi ) ⋅ xi = 0  b∑ xi 2 + a ∑ xi = ∑ xi yi
 
 f 'a = 2∑ ( bxi + a − yi ) ⋅ 1 = 0  b∑ xi + na = ∑ yi
Utilizzando il metodo di Cramer si giunge alle soluzioni del
sistema

 ∑ yi ⋅ ∑ xi − ∑ xi yi ⋅ ∑ xi
2

a =
∑ i ∑ i
2
 n x − ( x ) 2



 n∑ x y − ∑ x ⋅ ∑ y
b = i i i i
 2 − (∑ x ) 2
 n ∑ x
i i
E’ evidente che è difficile memorizzare le precedenti soluzioni.
Esistono allora due procedimenti che è possibile seguire:

1° procedimento
Si calcola il fattore b utilizzando la formula

n∑ x ⋅ y − ∑ x ⋅ ∑ y
b= i i i i
n∑ x 2 − (∑ x ) 2
i i
Mentre il fattore a si può ricavare dalla seconda equazione del sistema

a = y − b⋅ x y x Sono le medie delle


X e delle Y
ESEMPIO
  X Y XY x2
         
  1 12 12 1
  2 13,5 27 4
  3 14,8 44,4 9
  4 16,5 66 16
  5 18,2 91 25
TOT. 15 75 240,4 55

5 ⋅ 240,4 − 15 ⋅ 75
b= = 1,54
5 ⋅ 55 − 15 2

15 75
X = = 3 Y = = 15
5 5

a = Y − b ⋅ X = 15 − 1,54 ⋅ 3 = 10,38
2° Procedimento

Con questo procedimento si procede al calcolo delle medie dei valori


sperimentali di X e Y e successivamente si calcolano gli scarti dalla
media

b=
∑ xi '⋅ y i '
=
∑ ( xi − X ) ⋅ ( y i − Y )
∑ ( xi ' ) 2
∑ ( xi − X )
2

a = Y − b⋅ X
ESEMPIO
  X Y X' Y' X'Y' X'2

  1 10 -2 -15 30 4

  2 17 -1 -8 8 1

  3 26 0 1 0 0

  4 32 1 7 7 1

  5 40 2 15 30 4

tot 15 125 0 0 75 10

= 15/5 =3 ∑ ( x − X ) ⋅ ( y − Y ) 75
X
b= i i = = 7,5
∑ (x − X )
2
10
Y = 125/5 = 25 i

a = Y − b ⋅ X = 25 − 7,5 ⋅ 3 = 2,5
PERTANTO LA RETTA INTERPOLATRICE HA EQUAZIONE

Y = 2,5+ 7,5 X

45
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
INDICI DI ACCOSTAMENTO

Per valutare la bontà dell’accostamento tra i dati sperimentali e la


funzione ottenuta con i minimi quadrati si utilizzano alcuni indici

∑ yi − yˆ
Indice lineare: I =
1 ∑ yˆ i

2
∑ ( yi − yˆ i )
Indice quadratico n
I valori degli indici
I =
2 ∑ ˆi
y devono essere molto
n piccoli inferiori a 0.1
CASO DELLA PARABOLA
y = ax + bx + c 2

∑ ( ax )
n
f ( a , b, c ) =
2 2
i + bxi + c − y i ⇒ minima
i= 1
La condizione di accostamento è la seguente:
Si tratta dunque di calcolare il minimo di una funzione a tre variabili [f(a,b,c)].
Si procede con la soluzione del sistema che pone le derivate parziali prime
uguali a zero per la ricerca del punto critico (minimo relativo, in questo caso):

( )
 f ' a = 2∑ axi 2 + bx i + c − y i ⋅ xi 2 = 0

( )
 f 'b = 2∑ axi + bxi + c − y i ⋅ xi = 0
2


( )
 f ' c = 2∑ axi + bxi + c − y i ⋅ 1 = 0
2
 a ∑ xi + b ∑ xi + c ∑ xi = ∑ xi y i
4 3 2 2


 a ∑ xi + b ∑ xi + c ∑ xi = ∑ xi y i
3 2


 a ∑ xi + b∑ xi + nc = ∑ y i
2
Esempio:
Calcolare e rappresentare graficamente la parabola interpolante a
minimi quadrati per i seguenti punti:

x 1 2 4 6 8 12

y 9 5 4 5 6 10

Svolgimento:
Conviene sviluppare i calcoli per le varie sommatorie in tabella
(facilmente adattabile ad un foglio elettronico) come segue:
x y x2 x3 x4 xy x2y y teorico
1 9 1 1 1 9 9 7,61
2 5 4 8 16 10 20 6,41
4 4 16 64 256 16 64 4,88
6 5 36 216 1296 30 180 4,5
8 6 64 512 4096 48 384 5,28
12 10 144 1728 20736 120 1440 10,32
33 39 265 2529 26401 233 2097

Si imposta e si risolve il
seguente sistema

 26.401a + 2.529b + 265c = 2.097



 2.529a + 265b + 33c = 233
 265a + 33b + 6c = 39

ottenendo la seguente funzione

y = 0,1448x² - 1,6363x + 9,1052


12

10 y = 0,1448x2 - 1,6363x + 9,1052

6
4 y
2 y teorico

0 y teorico
0 2 4 6 8 10 12 14
REGRESSIONE E
CORRELAZIONE
REDDITO* SPESE*
* In migliaia di euro
10 2
15 2,3
18 2,1
20 2,5
22 2,6
25 2,5
30 3

La domanda è la seguente:
esiste un legame tra le due variabili statistiche?
E se esiste quanto è forte o debole questo legame?
REGRESSIONE E CORRELAZIONE
Lo studio della regressione e della correlazione si
occupa della ricerca del legame e della “misurazione”
di tale legame tra due variabili statistiche.

Nel nostro corso si tratta della regressione e della correlazione lineare


intendendo che viene ricercato tra le variabili statistiche un legame di tipo
lineare

Lo studio può esser condotto in due modi:


• attraverso la regressione ( si ricerca il legame tra le due variabili statistiche
esprimendolo attraverso una funzione matematica)
• attraverso la correlazione ricercando la forza o debolezza di tale legame con il
calcolo di un indice
REGRESSIONE
Il termine regressione fu introdotto da Galton (1822-1911) a seguito di uno
studio sull’ereditarietà dei caratteri biologici di tipo quantitativo.

In particolare Galton prese in esame due variabili costituite rispettivamente


dalle altezze dei padri e dalle altezze dei figli.

Egli rilevò che le altezze dei figli di padri molto alti erano mediamente inferiori
a quelle dei padri, o più precisamente, regredivano verso la media
generale delle altezze della popolazione
Galton chiamò regressione tale tendenza
In generale in statistica lo studio della regressione consiste nella determinazione
di una funzione matematica che esprima la relazione tra due variabili

Siano X e Y due variabili statistiche misure di due caratteri quantitativi di


popolazione statistica (ex: X = Reddito e Y = Spese)

La REGRESSIONE: studia come una variabile varia al variare


dell’altra

determina una funzione matematica che esprima come una


variabile varia al variare dell’altra
Si parla di regressione lineare se la funzione è di tipo lineare

Utilizzando il metodo dei minimi quadrati si determinano due rette di


regressione:

La retta che esprime Y come funzione della X : y = b 1 x + a1

E la retta che esprime la X come funzione della Y : x= b2 y + a2

b1, b2: coefficienti di regressione


FORMULE PER IL CALCOLO : 1° procedimento

n∑ x ⋅ y − ∑ x ⋅ ∑ y
b1 = i i i i a1 = y − b ⋅ x
n∑ x 2 − (∑ x ) 2
i i

n∑ x ⋅ y − ∑ x ⋅ ∑ y
b2 = i i i i a2 = x − b ⋅ y
n∑ y 2 − (∑ y ) 2
i i

Sono le medie
y x delle x e delle y
FORMULE PER IL CALCOLO: 2° procedimento

n
∑ ( x − x )( y − y )
i i
b = i = 1 a = y− b x
1 n 2 1 1
∑ ( x − x)
i
i =1

n
∑ ( x − x )( y − y )
i i
b = i = 1 a = x−b y
2 n 2 2 2
∑ ( y − y)
i
i =1
b1 E b2 HANNO SEMPRE LO STESSO SEGNO

Se b1 e b2 sono positivi
esiste un legame lineare
diretto (all’aumentare di una
variabile aumenta l’altra)

Se b1 e b2 sono negativi
esiste un legame lineare inverso
(all’aumentare di una variabile
diminuisce l’altra)
esiste un legame lineare
b =
1 perfetto (diretto o
Se 1 b
2 inverso in base al segno
dei coefficienti) e le due
rette sono coincidenti

Se b1 = b2 =0 esiste indipendenza
lineare( le due rette sono parallele agli assi
cartesiani)
CORRELAZIONE LINEARE

La CORRELAZIONE studia quanto le variabili sono collegate fra di loro


misurando l’intensità del legame di interdipendenza fra le due variabili

Talvolta lo studio della correlazione precede quello della regressione in


quanto una variabile viene confrontata con tante altre per vedere con
quale risulti più connessa
Nello studio della correlazione si procede al
calcolo di un indice:

Si usa il segno +
se b1 e b2 sono
positivi
r = Indice di Bravais-Pearson = ± b1 ⋅ b2
Si usa il segno –
dove b1 e b2 sono i coefficienti di regressione se i coefficienti b1
e b2 sono
negativi

IL coefficiente r ha un campo di variazione: − 1≤ r ≤ 1


Un altro modo per definire il coefficiente di Bravais –Pearson è quello di
definirlo come rapporto tra la covarianza di x e y e il prodotto degli scarti
quadratici medi di x e di y.

σ
xy
r =
σ ⋅σ
x y

Dove :
∑ x ' y'
σ = covarianza
yy n

2 2
s.q.m. ∑ ( x' ) ∑ ( y' )
σ = σ =
x n y n
− 1≤ r ≤ 1

se r= -1 esiste una correlazione lineare perfetta negativa

Le due rette sono


sovrapposte(‘l’angolo
tra le rette è nullo)

se r= +1 esiste una correlazione lineare perfetta positiva

Le due rette sono


sovrapposte(‘l’angolo
tra le rette è nullo)
se r= 0 esiste INDIPENDENZA LINEARE fra le due variabili

− 1≤ r ≤ 0

0≤ r ≤ 1