Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
bo -Y Intercetta
Y =Valore Predetto
Esempio Ticket Tickets
price sold
18.00 4513
Il prezzo del biglietto (Ticket price) 24.50 3223
30.00 3088
ed il numero di biglietti venduti 25.00 3909
33.00 2492
(Tickets sold) sono stati registrati 23.00 3889
27.00 3359
al Red Rock Theatre. Esiste una 22.00 3737
relazione tra le due misure ? 32.00
16.00
2148
4736
26.00 3146
29.00 2945
15.00 5136
24.00 3982
21.00 3882
28.50 3141
23.50 3620
20.00 4323
34.00 2587
22.50 3963
5000
Tickets sold
4000
3000
2000
15 25 35
Ticket price
Correlazione
Il coefficiente di correlazione, r, misura la forza della relazione
lineare
-1 £ r £ 1
Comandi Minitab™:
Stat>Basic Statistics>Correlation
Variables: Ticket Price, Tickets Sold
Minitab™ Output:
Correlazione (Pearson)
Correlazione tra Ticket Price e Tickets Sold = -0.956
P-Value = 0.000
Preparare la linea di regressione
Comandi Minitab™:
Stat>Regression>Regression>Fit regression model…
Graphs…>Four in one
Risultati della regressione
Regression Analysis: Tickets Sold versus Ticket Price
Analysis of Variance
Model Summary
Coefficients
Regression Equation
Tickets
Obs Sold Fit Resid Std Resid
9 2148,0 2588,1 -440,1 -2,06 R
R Large residual
Equazione di regressione
• Y = 6984 - 137 X
X = Ticket Price Y = Tickets Sold
• Esiste una forte relazione lineare tra Ticket Price (costo dei
biglietti) e Ticket Sales (vendita dei biglietti).
• Adjusted R2 = .910
• 91.0% della variazione nella vendita di biglietti (Ticket Sales) è
spiegabile dalla relazione esistente con il costo dei biglietti
(Ticket Price).
• Correlazione r = radice quadrata di .915 = .956
• L’equazione di regressione è utile per predire la vendita
dei biglietti per prezzi tra $15 e $34.
• CAUTELA per prezzi inferiori o superiori.
Aggiungere la linea al grafico
Comandi Minitab™
Stat>Regression>Fitted Line Plot
Fitted Line Plot
Tickets Sold = 6984 - 137,4 Ticket Price
5500 S 230,938
R-Sq 91,5%
5000 R-Sq(adj) 91,0%
4500
Tickets Sold
4000
3500
3000
2500
2000
15 20 25 30 35
Ticket Price
Worksheet: SIMPLE REGRESSION V1.MTW
Controllare la validità della regressione
R ed R2 danno una misura della bontà di adattamento della regressione.
Aggiungere un termine
quadratico al modello
Residuals Versus the Order of the Data
(response is Tickets)
Grafici diagnostici Residuals Versus the Fitted Values
(response is Tickets)
400
400
300
300
200
200
100
100
Residual
0
Residual
0
-100
-100 -200
-200 -300
-300 -400
-400 -500
2000 3000 4000 5000
-500
Fitted Value
2 4 6 8 10 12 14 16 18 20
Observation Order
400
300
200
100
Residual
0
-100
-200
-300
-400
-500
15 25 35
Ticket p
6 A
4
Y
1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
X
Usare la
linea di regressione
Le equazioni di regressione possono essere usate
per predire Y:
?
?
Y
X
Più di una X
X’s Sì CORRELATION
MULTIPLE REGRESSION
continue? SCATTER PLOTS
No
Sì
2 X’s? TWO-WAY ANOVA
No
DESIGN OF
EXPERIMENTS
Più di una X continua
Graph>Plot>Graph Variables
175000
Electricity Kwh
165000
Y X 155000
135000
Kwh Employees 40 50 60
Avg Temp
70 80
Kwh …
185000 185000
175000
175000
Electricity Kwh
165000
Electricity Kwh
165000
155000
155000
145000
145000
135000
135000
125000
125000
145 155 165 175 185 195 205 215 225
5000 7000 9000 11000 13000 15000 17000 19000 Employees
Production Kgs.
bo - Y intercetta
b1 - cambiamento di Y per cambiamento unitario di X1
b2 - cambiamento di Y per cambiamento unitario di X2
Y = Valore predetto
Analysis of Variance
Source DF SS MS F P
Regression 5 6411324665 1282264933 34.92 0.000
Residual Error 19 697592100 36715374
Total 24 7108916765
Residual
Percent
50 0
10
1 -10000
-10000 -5000 0 5000 10000 120000 140000 160000 180000 200000
Residual Fitted Value
Residual
3,0
0
1,5
0,0 -10000
-10000 -5000 0 5000 10000 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Controllare la validità della regressione
• p-value per Working Days = 0.328>0.05.
• p-value per Visitors = 0.135>0.05
• Queste variabili non sembrano contribuire
significativamente.
• Ripetere la regressione con tre variabili:
Average Temperature, Production Kilograms, &
Employees
Nuova regressione
Regression Analysis: The regression equation is:
Analysis of Variance
Source DF SS MS F P
Regression 3 6284747092 2094915697 53.38 0.000
Residual Error 21 824169672 39246175
Total 24 7108916765
Controllare la validità della regressione
Residual Plots for Electricity Kwh
Normal Probability Plot Versus Fits
99
N 25
AD 0,247
90 10000
P-Value 0,728
Residual
Percent
50
0
10
-10000
1
-10000 0 10000 120000 140000 160000 180000 200000
Residual Fitted Value
4,5
10000
Frequency
Residual
3,0
0
1,5
-10000
0,0
-10000 -5000 0 5000 10000 15000 2 4 6 8 10 12 14 16 18 20 22 24
Residual Observation Order
Regressione Stepwise
Regressione Stepwise
Stepwise Selection of Terms
Tempo: 20 minutes