Sei sulla pagina 1di 22

MasterGi www.hackmed.

org
Statistica Medica
Premessa: il seguente testo cerca di riassumere e rendere in forma comprensibile ai non esperti in
matematica e statistica le nozioni e le procedure necessarie a svolgere gli esercizi dellesame di
Statistica Medica.
Verranno presi in esame:
- Il calcolo di Media aritmetica, geometrica, armonica; moda e mediana di un campione,
coefficiente di variazione e limiti fiduciali della media aritmetica campionaria intervallo di
confidenza!.
- "applicazione dei test statistici: test di Student con approssimazione di #oc$ran in caso di
varianze non omogenee!; test del t. paired ad una o a due code!; test del #$i %uadrato di
Paerson con la correzione di &ates %uando vi ' un solo grado di libert(!; test di )nalisi della
varianza ad un criterio!; test sulla regressione lineare semplice.
)llinterno del programma di Statistica Medica sono anc$e presenti altri due test statistici, ovvero il
test di analisi della varianza a * criteri ed il test sulla correlazione lineare semplice, tuttavia non $o
inserito la sintesi delle procedure di %uesti test perc$+ a %uanto ne so ' molto improbabile c$e
possano capitare allesame di Statistica Medica degli esercizi in cui sia necessario applicare %uesti
ultimi * test statistici; in ogni caso se dovesse essere necessario si potrebbero sempre aggiungere in
seguito le parti riguardanti %uesti test statistici.
Il consiglio c$e posso dare a tutti %uelli c$e devono affrontare %uesto esame ' %uello di cercare di
imparare a risolvere gli esercizi facendo molti esercizi di prova, ovvero di prendere gli esercizi dal
libro di Statistica Medica oppure da Internet e cercare di risolverli applicando le procedure c$e $o
riassunto in %uesto file, noterete c$e non ' difficile come sembra allinizio,
-on essendo io un matematico n+ uno statistico, e non essendo stati %uesti appunti revisionati da un
matematico n+ da uno statistico, ritengo opportuno ricordare c$e possono essere presenti degli errori
in %ualsiasi parte del testo; tuttavia %uesto testo ' basato sugli appunti c$e $o preso fre%uentando le
lezioni di Statistica Medica, studiando sul libro di Statistica Medica ed andando a cercare spesso
delucidazioni in Internet per le parti c$e mi risultavano poco c$iare, applicando %ueste procedure
sono riuscito a superare lesame..
1
MasterGi www.hackmed.org
Media, moda e mediana
- Media aritmetica: Somma di tutti i valori di un gruppo diviso la numerosit( del gruppo
stesso.
)d esempio abbiamo %uesti numeri: / ; 0 ; 1 ; 2
"a media aritmetica sar(: 3/ 4 0 4 1 4 2! : 05 6 /1 : 0! 6 0
- Media 7eometrica: "a radice ennesima elevata alla numerosit(! delle singole modalit(
elevate alle rispettive fre%uenze.
)d esempio:
Modalit
(
8vento!
9re%uenza
: *
0 :
/ *
6
2
MasterGi www.hackmed.org
Per calcolare la radice elevata alla ennesima numerosit( totale! potenza devo elevare %uel numero
stesso al reciproco della numerosit( totale:
6
Per fare ci; devo scrivere sulla calcolatrice:
- Media )rmonica M$!: Il numero totale delle osservazioni numerosit( totale! diviso la
sommatoria del reciproco delle singole modalit( per le rispettive fre%uenze:
- Moda: "a modalit( il valore! c$e presenta la massima fre%uenza; possono essere presenti
pi< di un valore di moda distribuzioni bimodali, trimodali, plurimodali!.
)d esempio abbiamo %uesti valori: 0; :; 2; *; 1; =; /; 0
Per calcolare la moda mi sar( utile riscrivere tutti i numeri in ordine crescente:
/; *; :; 0; 0; 2; 1; =
"a moda sar( il numero 0 perc$+ ' il valore c$e si presenta il maggior numero di volte.
3
MasterGi www.hackmed.org
9acciamo ora un esempio di moda plurimodale:
)bbiamo %uesti valori: *; 0; 2; >; ?; 1; ?; 2; ?; *; /; 2; 0; *
@ra riscriver; tutti i valori in ordine crescente:
/; *; *; *; 0; 0; 2; 2; 2; 1; ?; ?; ?; >
In %uesto esempio avremo tre mode: *, 2, ?, perc$+ %uesti valori $anno la fre%uenza massima
riscontrata, ovvero ognuno di %uesti valori si presenta tre volte.
- Mediana: Ai una distribuzione di modalit( valori! ordinati in modo crescente o decrescente,
' data dalla modalit( centrale nel caso in cui la numerosit( totale sia un numero dispari o
dalla semisomma delle modalit( centrali nel caso la numerosit( totale sia un numero pari.
3 Semisomma di ) e B 6 ) 4 B! C * 5
9acciamo un esempio in cui la numerosit( totale ' un numero dispari;
)bbiamo %uesti valori: 2; :; ?; ?; =; 0; >
Per calcolare la mediana mi sar( utile riscrivere tutti i valori in ordine crescente:
:; 0; 2; ?; ?; = ; >
In %uesto esempio la mediana sar( ?
9acciamo un esempio in cui la numerosit( totale ' un numero pari;
)bbiamo %uesti valori: 2; :; ?; *; ?; =; 0; 2;
Per calcolare la mediana mi sar( utile riscrivere tutti i valori in ordine crescente:
*; :; 0; 2; 2; ?; ?; =
In %uesto esempio, essendo la numerosit( totale un numero pari, la mediana sar( data dalla
semisomma delle modalit( centrali: 32 4 2! : *5 6 2
4
MasterGi www.hackmed.org
- )pprossimazioni per arrotondamento:
esempi!
*,:0* D *,:0
*,:0? D *,:2
*,:02: D *,:2
*,:02E D *,:0 o *,:2
- Potenze negative
------------------------------------------------------------------------------------------------------------------------
Devianza, varianza,
deviazione standard, codevianza e
coefficiente di variazione
Aevianza, varianza, deviazione standard e codevianza sono degli Findici di dispersioneG c$e
servono per calcolare: i limiti fiduciali della media aritmetica campionaria intervallo di confidenza!
e per lo svolgimento dei test statistici: test di Student, test del t. paired, test del #$i %uadrato di
Paerson, test di )nalisi della varianza e test sulla regressione lineare semplice.
5
MasterGi www.hackmed.org
- Aevianza: In un gruppo di valori ' la somma dei %uadrati degli scarti dalla media aritmetica
di ogni valore per le rispettive fre%uenze ogni valore va sottratto alla media aritmetica e poi
moltiplicato per s+ stesso; poi tutti i valori vanno sommati!.
#osa significa lo scarto di un valore dalla media aritmeticaH Significa semplicemente sottrarre %uel
valore alla media aritmetica.!
)d esempio abbiamo un gruppo di valori: *,= C E C E,2 C 1,* C :,1 C :,= C -*,*
Innanzi tutto devo calcolare la media aritmetica di %uesto gruppo di valori:
3*,= 4 E 4 E,2 4 1,* 4 :,1 4 :,= 4 -*,*!5 : ? 6 *,/
@ra faccio la somma dei %uadrati degli scarti della media aritmetica:
*,= I *,/!J 4 E I *,/! J 4 E,2 I *,/!J 4 1,* I *,/!J 4 :,1 I *,/!J 4 :,= I *,/!J 4 -*,* I *,/!J 6
E,0> 4 0,0/ 4 *,21 4 /1,=/ 4 *,*2 4 *,=> 4 /=,0> 6 0?,>
- Varianza: "a devianza fratto i gradi di libert( numerosit( meno / se ' un unico gruppo;
numerosit( meno * se sono * gruppi; ovvero numerosit( meno numero di gruppi!.
Kiprendendo lesempio precedente abbiamo %uesto gruppo di valori:
*,= C E C E,2 C 1,* C :,1 C :,= C -*,*
In %uesto caso la devianza come abbiamo calcolato sopra! ' 0?,> %uindi la varianza sar( data dalla
devianza diviso i gradi di libert( del gruppo, in %uesto caso i gradi di libert( saranno 1 numerosit(
meno /!, %uindi la varianza sar( 0?,> : 1 6 ?,>=
- Aeviazione standard: "a radice %uadrata della varianza.
Kiprendendo ancora lesempio precedente, abbiamo %uesto gruppo di valori:
6
MasterGi www.hackmed.org
*,= C E C E,2 C 1,* C :,1 C :,= C -*,*
In %uesto caso la varianza ' ?,>= %uindi la deviazione standard si calcoler( semplicemente
eseguendo L?,>= 6 *,=*
- #odevianza: Per calcolare la codevianza devo avere una tabella con * variabili M ed N! in
cui le * variabili siano appaiate appartenendo allo stesso soggetto oggetto!. )d esempio in
un campione di 0 bambini sono stati misurati il peso e la statura
@ra devo trovare la media aritmetica della variabile M e %uella della variabile N
Media aritmetica di M 6 **,2
Media aritmetica di N 6 /E:,2
@ra devo ricompilare la tabella di prima ma inserendo per ogni valore di M ed N il suo valore di
scarto dalla corrispettiva media aritmetica, %uindi:
M D *E,2 I **,2 6 -* CC */,= I **,2 6 -E,? CC *:,1 I **,2 6 /,/ CC **,: I **,2 6 -E,*
N D /EE I /E:,2 6 -:,2 CC /E: I /E:,2 6 -E,2 CC /E2 I /E:,2 6 /,2 CC /E1 I /E:,2 6 *,2
@ra potr; ricompilare la tabella:
7
MasterGi www.hackmed.org
@ra devo sommare %uei valori c$e ricavo dal prodotto tra lo scarto dalla media di M ed il
corrispettivo scarto dalla media di N; il risultato della sommatoria di %uesti valori sar( la
#@A8VI)-O)
In %uesto caso: ? 4 :,2 4 /,12 4 -E,2! 6 =,2
- #oefficiente di variazione #.V.!:
8
MasterGi www.hackmed.org
Limiti fiduciali della media aritmetica
campionaria
(Intervallo di confidenza)
I limiti fiduciali della media aritmetica campionaria ci forniscono un intervallo di valori allinterno
del %uale con una probabilit( data del >EP >2P o del >>P! si trover( il valore della media
aritmetica dellintero universo statistico; ovvero estrapolato un campione da una popolazione intera
in assenza di errori sistematici!, noi calcoleremo la media aritmetica di %uel campione per un dato
parametro; non ' per; detto c$e la media aritmetica di %uel campione per %uel dato parametro ad
esempio temperatura corporea! sia uguale alla media aritmetica dellintera popolazione da cui il
campione ' stato preso, per %uello stesso parametro temperatura corporea!.
Qramite il calcolo dei limiti fiduciali, noi possiamo trovare un intervallo di valori situati Fai latiG
della media aritmetica campionaria allinterno del %uale noi avremo, con una probabilit( data del
>EP >2P oppure del >>P solitamente! il valore della media aritmetica dellintera popolazione da
cui il campione ' stato preso.
"a formula per il calcolo dei limiti fiduciali della media aritmetica campionaria ':
= Media aritmetica campionaria
t 6 Valore ricavato dalla tabella del t di Student per un dato valore di con i gradi di libert(
corrispondenti al valore della numerosit( del gruppo del campione! meno /
dev. stand. 6 ' la deviazione standard; si trova calcolando la devianza, poi la varianza ed infine
facendo la radice %uadrata della varianza per una spiegazione pi< esaustiva vedi sopra!
9
MasterGi www.hackmed.org
D ' c$iamato l8KK@K8 SQ)-A)KA
Valori usuali di :
= E,E/ 6R >>P
= E,E2 6R >2P
= E,/ 6R >EP
------------------------------------------------------------------------------------------------------------------------
Test t di Student
(Il confronto tra due medie)
Serve %uando bisogna sapere se la differenza tra due medie sia significativa ossia se si possa
affermare c$e la differenza non sia dovuta al caso ma esista invece una reale diversit( tra le medie
delle due popolazioni da cui i campioni stessi derivano.
Se il valore c$e risulta dal t di Student ' inferiore al valore critico 6R AI998K8-O) -@-
SI7-I9I#)QIV) 6R #I@8 #)SS)"8 Il valore critico ' %uel valore c$e trovo nella tabella dei
valori del t di Student con T E,E2 o T E,E/ ed i gradi di libert( corrispondenti ai gradi di libert(
totali 6R numerosit( I *!.
10
MasterGi www.hackmed.org
Se il valore c$e risulta dal t di Student ' superiore al valore critico 6R AI998K8-O)
SI7-I9I#)QIV) 6R #I@8 -@- #)SS)"8 .
Svolgimento dellesercizio
Uo due gruppi di numeri i valori non sono appaiati, ovvero non appartengono allo stesso soggetto,
oggetto,! devo calcolare per ognuno: la media aritmetica, la devianza, la varianza e la deviazione
standard Il calcolo di media aritmetica, devianza, varianza, deviazione standard ' stato spiegato
precedentemente!;
poi applico la formula del t di Student
V) 6 Media aritmetica di )
VB 6 Media aritmetica di B
dev) 6 devianza di )
devB 6 devianza di B
n) 6 numerosit( di )
nB 6 numerosit( di B
n) 4 nB I * 6 gradi di libert( totali
------------------------------------------------------------------------------------------------------------------------
Studio dellomogeneit( delle varianze in un t di Student
@gni volta c$e faccio un t di Student devo verificare lomogeneit( delle varianze:
11
MasterGi www.hackmed.org
Aevo dividere la varianza maggiore per %uella minore; cosW ottengo un valore, ora devo confrontare
%uesto valore ad un altro valore c$e trovo sulla tabella )-@V). Il valore )-@V) va cercato sulla
tabella T0,05 %uando il t di Student va eseguito per significativit( T0,05 e viceversa sulla tabella
)-@V) T0,01 %uando $o eseguito il t di Student con T0,01. [ "a tabella )-@V) ' la tabella dei
punti critici della distribuzione 9 rapporto tra varianze!5. Il valore tabulare lo trovo intersecando il
valore dei gradi di libert( del numeratore c$e ' dato dal valore dei gradi di libert( del gruppo con la
numerosit( maggiore con il valore dei gradi di libert( del denominatore c$e ' dato dal valore dei
gradi di libert( del gruppo con la numerosit( minore. Il valore c$e si interseca in %uesto modo va
confrontato con %uello precedente varianza maggiore diviso varianza minore! e se il valore
tabulare %uello trovato sulla tabella )-@V)! ' superiore 6R V)KI)-O8 @M@78-88.. Se
invece il valore tabulare ' inferiore 6R "8 V)KI)-O8 -@- S@-@ @M@78-88, cosW dovr;
applicare lapprossimazione di #oc$ran.
)pprossimazione di #oc$ran
Xuando le varianze -@- S@-@ @M@78-88 dovr; confrontare il valore del t ricavato con il test
di Student! non pi< con i valori tabulari semplici 6R valore critico dato da a T0,05 oppure
T0,01 e gradi di libert( totali numerosit( totale I *!; ma il valore a cui dovr; confrontare il t del t
di Student! ' il t c$e ricaver; dalla formula dellapprossimazione di #oc$ran
t) e tB 6 Sono i valori tabulari ricavati dalla tabella dei punti critici del t di Student e non sono altro
c$e il valore c$e deriva dallintersecazione della colonna T0,05 oppure T0,01a seconda del mio
...! e dei gradi di libert( del gruppo stesso ad esempio t) per T0,05 con il gruppo ) avente 1
gradi di libert( ': *,02!
V)K) 6 Varianza di )
V)KB 6 Varianza di B
n) 6 numerosit( di )
12
MasterGi www.hackmed.org
nB 6 numerosit( di B
@ra se t sar( maggiore di t 6R AI998K8-O) SI7-I9I#)QIV)
Se invece t ' minore di t 6R AI998K8-O) -@- SI7-I9I#)QIV) #)SS)"8!
T. Paired
(Significativit della differenza tra medie con
dati non indipententi)
Qest statistico utile a confrontare * medie %uando i dati non sono indipendenti, ovvero abbiamo per
esempio /E soggetti a cui viene misurata la pressione arteriosa prima e dopo la somministrazione di
un farmaco e noi vogliamo sapere se le medie sono significativamente diverse, %uindi abbiamo
almeno * valori derivanti dallo stesso soggetto o oggetto,! per ogni soggetto o oggetto,!
Per fare lesercizio sul t paired devo calcolare per ogni soggetto oggetto, elemento,! la differenza
tra il /Y valore ed il *Y valore c$iamer; il gruppo dei valori derivanti dalla sottrazione tra il /Y ed il
*Y valore di ogni elemento 6R 7KSPP@ #!. Aovr; calcolare la M8AI) )KIQM8QI#), ")
A8VI)-O), ") V)KI)-O) 8 ") A8VI)OI@-8 SQ)-A)KA A8" 7KSPP@ #.
@ra potr; applicare la formula del t paired
13
MasterGi www.hackmed.org
Qrover; cosW un certo valore di tp, ora dovr; confrontare %uesto valore con * punti critici diversi a
seconda c$e il test sia ad una coda oppure a * code, i gradi di libert( saranno dati dalla numerosit(
del gruppo # - /.
Il Q8SQ 8 )A S-) #@A) %uando la media di uno dei due gruppi pu; essere
8S#"SSIV)M8-Q8 M)77I@K8 oppure 8S#"SSIV)M8-Q8 MI-@K8 della media dellaltro
gruppo ovvero la media di un gruppo non pu; essere sia maggiore c$e minore rispetto alla media
dellaltro gruppo.. In %uesto caso dovr; cercare il punto critico per esempio di un test con
T0,05, nella tabella del t di Student con T0,10 ovvero moltiplicato per *. In modo analogo al
test a * code, i gradi di libert( saranno dati dalla numerosit( del gruppo # meno /.
Il Q8SQ 8 ) AS8 #@A8 %uando la media di uno dei due gruppi pu; essere SI) M)77I@K8
#U8 MI-@K8 KISP8QQ@ )"") M8AI) A8"")"QK@ 7KSPP@. Qrover; il punto critico nella
tabella dei valori del t di Student con il corrispettivo valore di (T0,05 oppure T0,10) ed i gradi
di libert( dati dalla numerosit( del gruppo # meno /.
Il !"i#$uadrato di Paerson
Serve a verificare la significativit( delle differenze tra le distribuzioni di fre%uenze ovvero permette
di confrontare due o pi< campioni per verificare, stabilita una certa probabilit( di prima specie, se le
differenze tra le distribuzioni di fre%uenza assolute, riferite alle diverse modalit( del carattere
studiato, siano significative.
Il metodo del c$i-%uadrato non pu; essere applicato a fre%uenze relative percentuali!, inoltre '
applicabile %uando il valore contenuto in ogni cella sia R 2 ed il numero totale delle osservazioni sia
R :E, in caso contrario bisogna usare altri test ad esempio test esatto di 9is$er!
Inoltre %uando vi ' un solo grado di libert( ' opportuno applicare la correzione di &ates.
Solitamente abbiamo * caratteri in un campione di un tot di unit( statistic$e; ogni carattere pu;
avere pi< classi. )bbiamo cio' un tot di soggetti c$e vengono raggruppati in base a * criteri;
14
MasterGi www.hackmed.org
allinterno di %uesti criteri ci possono essere * o pi< classi; un criterio ' posto nelle rig$e della
tabella e laltro criterio ' posto nelle colonne della tabella.
Il /Y criterio, %uello delle rig$e ' il criterio I-AIP8-A8-Q8, mentre il *Y criterio, %uello delle
colonne, ' il criterio AIP8-A8-Q8. #on il #$i-%uadrato di Paerson noi vogliamo sapere se il
criterio I-AIP8-A8-Q8 influenza in maniera significativa con un certo valore di ) i valori del
criterio AIP8-A8-Q8, ovvero se c' una correlazione significativa tra il variare delle fre%uenze
del criterio I-AIP8-A8-Q8 ed il variare delle fre%uenze del criterio AIP8-A8-Q8, ovvero se il
criterio I-AIP8-A8-Q8 influenza significativamente il criterio AIP8-A8-Q8.
8sempio: )bbiamo * criteri: K8AAIQ@ e K8-AIM8-Q@ S#@")SQI#@. Prendiamo un tot di
studenti e c$iediamo ad ogni studente il K8AAIQ@ della sua famiglia ed il suo K8-AIM8-Q@
S#@")SQI#@; cosW possiamo costruire una tabella mettendo ogni studente in una data cella della
tabella in base al suo K8AAIQ@ ed al suo K8-AIM8-Q@ S#@")SQI#@. "indagine viene fatta
per appurare se il livello del reddito della famiglia influisce significativamente sul livello del
rendimento scolastico; per %uesto il criterio K8AAIQ@ ' il criterio I-AIP8-A8-Q8, mentre il
criterio K8-AIM8-Q@ S#@")SQI#@ ' il criterio AIP8-A8-Q8 dal K8AAIQ@ secondo
lindagine!.
@ra per verificare se il K8-AIM8-Q@ S#@")SQI#@ criterio dipendente! dipende in maniera
significativa dal K8AAIQ@ criterio indipendente! poniamo come ipotesi Uo! c$e %uesto non sia
vero e c$e la differenza tra i vari rendimenti scolastici sia solo #)SS)"8; cosW calcolo la
percentuale sul totale di studenti con rendimento scolastico BS@-@, AIS#K8Q@ e S#)KS@;
trover; c$e :0 su ?E $anno rendimento BS@-@, *E su ?E $anno rendimento AIS#K8Q@ e /1 su
?E $anno rendimento S#)KS@, %uindi:
:0 : ?E 6 E,2 6R 2EP! rendimento BS@-@
*E : ?E 6 E,: 6R :EP! rendimento AIS#K8Q@
15
MasterGi www.hackmed.org
/1 : ?E 6 E,* 6R *EP! rendimento S#)KS@
Xuesti sono i valori percentuali di rendimento c$e sarebbe lecito attendersi se il rendimento non
fosse correlato al livello di reddito familiare IP@Q8SI Uo!. Per verificare %uesta ipotesi costruisco
una nuova tabella con i valori attesi casuali:
Aevo moltiplicare la numerosit( di ogni criterio indipendente nellesempio /> CC *2 CC *1! per %uei
valori c$e poco fa $o trovato nellesempio E,2 CC E,: CC E,*!.
Xuindi dovr; fare:
K8-AIM8-Q@ BS@-@ 6R /> M E,2 6 >,2 6R arrotondo 6 > CC
*2 M E,2 6 /*,2 6R arrotondo 6 /* CC
*1 M E,2 6 /:
Se $o valori con le virgole devo approssimare!.
Aevo ripetere %uesto procedimento per ogni classe di variabile dipendente, cosW potr; costruire la
tabella dei valori attesi casuali:
Xuesti sono i valori attesi c$e avremmo se il numero di studenti con rendimento scolastico buono,
discreto e scarso non fosse correlato con il reddito familiare.
@ra possiamo applicare la formula del c$i I %uadrato di Paerson 2)
J 6 ? I >!J : > 4 /* I /*!J : /* 4 /2 I /:!J : /: 4 2 I 1!J : 1 4 ? I =!J : = 4 = I = !J : = 4 ? I
0!J : 0 4 1 I 2!J : 2 4 : I 2!J : 2 6 0,*>
16
MasterGi www.hackmed.org
@vvero devo sottrarre al valore della /Y tabella, il corrispettivo valore della *Y tabella, poi devo
elevare il valore ottenuto al %uadrato ed infine devo dividere il valore ottenuto al valore della *Y
tabella tabella dei valori attesi! c$e $o pocanzi usato; il valore c$e $o ottenuto con %uesta
procedura lo devo sommare ad ogni altro valore c$e deriva dalla stessa procedura per ogni casella
della tabella ' pi< difficile a dirsi c$e a farsi,!
@ra potr; concludere lesercizio confrontando %uesto valore di J con il punto critico c$e trovo
nella tabella dei punti critici della distribuzione del c$i I %uadrato di Paerson per un dato valore di Z
con i gradi di libert( c$e calcolo facendo il prodotto tra il numero di criteri della variabile
indipendente meno / per il numero di criteri della variabile dipendente meno /:
3numero di colonne I /! [ numero di rig$e I /!5.
-ellesempio di prima abbiamo : criteri per la variabile dipendente K8-AIM8-Q@
S#@")SQI#@ 6R BS@-@, AIS#K8Q@, S#)KS@! e : criteri per la variabile indipendente
K8AAIQ@ 6R )"Q@, M8AI@, B)SS@!: Xuindi i gradi di libert( saranno :-/! [ :-/! 6 0
-ella tabella dei punti critici della distribuzione del c$i I %uadrato di Paerson, per Z 6 E,/ e per 0
gradi di libert( il valore sar( ?,?=
#onfrontando il valore di J di 0,*> con il valore del punto critico di ?,?= avr; c$e:
0,*> \ ?,?= 6 Uo
@vvero non c' una correlazione significativa al >EP delle probabilit(! tra il reddito familiare ed il
rendimento scolastico.
------------------------------------------------------------------------------------------------------------------------
#orrezione di &ates Xuando vi ' un solo grado di libert(!
)llinterno della formula del c$i I %uadrato di Paerson il valore osservato pi< alto deve essere
ridotto di E,2 ad esempio 0E I E,2 6 :>,2! ed il valore pi< basso deve essere aumentato di E,2 ad
esempio /E 4 E,2 6 /E,2! per il resto il procedimento da applicare per eseguire %uesto test statistico
' esattamente lo stesso.
17
MasterGi www.hackmed.org
%nalisi della varianza ad un criterio
Xuesta procedura permette di stabilire, sempre ad una certa probabilit( di Z, se due o pi< campioni
derivano dallo stesso universo statistico Uo!, ovvero se i criteri con cui si ' stabilito c$e un
elemento appartiene ad un campione piuttosto c$e ad un altro, costituiscono una fonte di variabilit(
sistematica, tale da poter affermare c$e gli stessi campioni provengano da differenti popolazioni
statistic$e U/! si tratter( allora di verificare %uanto della variabilit( complessiva sia dovuta
allerrore e %uanto al trattamento, se %uestultimo abbia prodotto, sui campioni esaminati, una
variabilit( maggiore di %uella casuale cio' se il trattamento $a avuto o meno un effetto
significativamente diverso dal caso.
#ome riconoscere uno di %uesti eserciziH
Solitamente il %uesito dellesercizio da svolgere con lanalisi della varianza ad / criterio recita:
V)"SQ)K8 ") SI7-I9I#)QIVIQ) A8""8 AI998K8-O8 QK) ")QQIVIQ) A8""8 AS8
V)KI)BI"I es. effetto dei * diversi geni, oppure effetto dei * diversi antibiotici,!
Svolgimento dellesercizio:
Uo vari gruppi: valori non appaiati! es. gruppo ), B, #; devo calcolare la media aritmetica di ogni
gruppo e la devianza di ogni gruppo mi servir( per calcolare la devianza entro gruppi!.
@ra per; devo calcolare la devianza totale: Per ogni gruppo devo fare la sommatoria del %uadrato di
ogni valore, otterr; cosW un valore per ogni gruppo simbolo 6R ]^*i!
@ra devo sommare i valori ottenuti da tutti i gruppi tra di loro simbolo 6R ]]^*i!
@ra dovr; trovare un altro valore, ovvero la sommatoria dei valori di tutti i gruppi somma di tutti i
valori del gruppo ), sommati alla somma di tutti i valori del gruppo B, sommati alla somma di tutti
i valori del gruppo #! simbolo 6R ]^i!
Uo bisogno di solo un altro valore, ovvero la numerosit( totale di tutti i gruppi insieme! Simbolo
6R ntot!
Per calcolare la devianza totale dovr; applicare una semplice formula:
18
MasterGi www.hackmed.org
6R #osW trover; la A8VI)-O) Q@Q)"8
@ra dovr; trovare la A8VI)-O) 8-QK@ 7KSPPI e la A8VI)-O) QK) 7KSPPI:
- A8VI)-O) 8-QK@ 7KSPPI: Si calcola semplicemente sommando la devianza di ) 4
devianza di B 4 devianza di # A8V) 4 A8VB 4 A8V# !
- A8VI)-O) QK) 7KSPPI : Si calcola semplicemente sottraendo alla devianza totale la
devianza entro gruppi A8Vtot - A8Ventro!
@ra dovr; trovare la V)KI)-O) Q@Q)"8, la V)KI)-O) 8-QK@ 7KSPPI e la V)KI)-O)
QK) 7KSPPI:
- V)KI)-O) Q@Q)"8: Aevianza totale diviso il numero di gradi di libert( dati dalla
numerosit( totale meno /.
- V)KI)-O) 8-QK@ 7KSPPI: Aevianza entro diviso i gradi di libert( dati dalla somma dei
gradi di libert( di ogni gruppo ovvero numerosit( del gruppo ) I / sommato a numerosit(
del gruppo B I / sommato a numerosit( del gruppo # I /! 6R %uesti sono i gradi di libert(
entro gruppi.
- V)KI)-O) QK) 7KSPPI: Aevianza tra diviso i gradi di libert( totali meno i gradi di
libert( entro gruppi vedi sopra!
@ra dovr; dividere il valore della V)KI)-O) QK) 7KSPPI con %uello della V)KI)-O) 8-QK@
7KSPPI e ricaver; un valore: 9
19
MasterGi www.hackmed.org
Il valore di 9 sar( il valore da confrontare al valore Q)BS")K8
Per ricavare il valore tabulare dovr; andare a trovare sulla tabella 9 con Z uguale al mio Z D
Z6E,E2 oppure Z6E,E/!; %uel valore c$e deriva dallintersecazione dei 7K)AI AI "IB8KQ) A8"
-SM8K)Q@K8 D 7K)AI AI "IB8KQ) QK) 7KSPPI ed i 7K)AI AI "IB8KQ) A8"
A8-@MI-)Q@K8 D 7K)AI AI "IB8KQ) 8-QK@ 7KSPPI.
Se il valore di 9 sar( maggiore a %uello del punto critico D AI998K8-O) SI7-I9I#)QIV)
Se il valore di 9 sar( minore di %uello del punto critico D AI998K8-O) -@- SI7-I9I#)QIV)
La regressione lineare semplice
#on la regressione lineare semplice analizziamo la dipendenza di una variabile variabile
dipendente: N! da unaltra variabile variabile indipendente: M! ovvero analizziamo il tipo e
lintensit( della relazione c$e sussiste tra le due variabili.
Si ricorre allanalisi della regressione %uando dai dati campionari si vuole ricavare un modello
statistico c$e predica i valori della variabile dipendente N! a partire dalla variabile indipendente M!
ovvero dalla variabile causa e %uindi determinare se esista una relazione lineare tra le variabili per
un dato valore di Z.
Solitamente in un esercizio sulla regressione lineare semplice $o un campione ad esempio /E
persone, oppure /E prelievi di sangue, oppure /E diverse categorie lavorative,! da ogni singolo
esponente del campione sono state misurate ricavate! * variabili; si cerca di sapere se una variabile
la variabile dipendente! sia influenzata in maniera significativa per un dato valore di Z! dallaltra
variabile la variabile indipendente!.
Il %uesito dellesercizio sar( %uindi:
#)"#@") ") SI7-I9I#)QIVIQ) A8"") K8")OI@-8 8SISQ8-Q8 QK) ") V)KI)BI"8
I-AIP8-A8-Q8 8 ") V)KI)BI"8 AIP8-A8-Q8 @PPSK8 V8KI9I#) S8 I V)"@KI
A8"") V)KI)BI"8 & SI)-@ AIP8-A8-QI A)I V)"@KI A8"") V)KI)BI"8 V!.
20
MasterGi www.hackmed.org
Svolgimento dellesercizio:
Aevo calcolare la A8VI)-O) A8"") V)KI)BI"8 V e la A8VI)-O) A8"") V)KI)BI"8 &
@ra devo calcolare la #@A8VI)-O) V&!: Per fare %uesto compilo una tabella con i valori degli
scarti dalla media dei valori di M ed i valori degli scarti dalla media dei valori di N appaiati e
moltiplico gli uni per gli altri; ricavo cosW dei valori; ora devo sommare %uesti valori ed il risultato
c$e otterr; sar( la #@A8VI)-O) V&!.
@ra posso calcolare la A8VI)-O) A8"") K87K8SSI@-8 facendo:
"a devianza totale non sar( altro c$e la A8VI)-O) AI &.
@ra posso calcolare la A8VI)-O) A)"") K87K8SSI@-8 6
@ra dovr; calcolare le V)KI)-O8 A8"") K87K8SSI@-8 e V)KI)-O) A)"")
K87K8SSI@-8, per fare %uesto per; dovr; conoscere i gradi di libert( totali, i gradi di libert(
della regressione ed i gradi di libert( dalla regressione:
- 7K)AI AI "IB8KQ) Q@Q)"I 6 -umerosit( di N I /
- 7K)AI AI "IB8KQ) A)"") K87K8SSI@-8 6 -umerosit( di N I *
- 7K)AI AI "IB8KQ) A8"") K87K8SSI@-8 6 7radi di libert( totali I gradi di libert(
dalla regressione 6 /
21
MasterGi www.hackmed.org
#osW potr; calcolare le V)KI)-O8 A8"") e A)"") K87K8SSI@-8:
- V)KI)-O) A8"") K87K8SSI@-8 6 Aevianza della regressione : 7radi di libert( della
regressione D Varianza della regressione 6 Aevianza della regressione
- V)KI)-O) A)"") K87K8SSI@-8 6 Aevianza dalla regressione : 7radi di libert( dalla
regressione D Varianza dalla regressione 6 3Aevianza dalla regressione : numerosit( di N I
*!5
9inalmente potr; calcolare il valore di 9:
Aovr; confrontare 9 con il punto critico della tabella dei punti critici della distribuzione 9 rapporto
tra varianze D )-@V)! con un dato valore di Z ed il valore c$e si interseca dai 7K)AI AI
"IB8KQ) )" -SM8K)Q@K8 6 7radi di libert( A8"") regressione c$e prima $o trovato ed i
7K)AI AI "IB8KQ) )" A8-@MI-)Q@K8 6 7radi di libert( A)"") regressione c$e prima $o
trovato.
Se il valore di 9 sar( maggiore del punto critico dovr; rifiutare lipotesi Uo, viceversa la dovr;
accettare se il valore di 9 sar( minore di %uello del punto critico.
MasterGi
22