Sei sulla pagina 1di 15

PowerPoint 04 Sintesi della distribuzione di un carattere: la variabilità

• La variabilità di una distribuzione


• Indici basati sullo scostamento della media
• Coe ciente di variazione
• Standardizzazione
• Box-plot

La variabilità
Di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità del carattere

Deve soddisfare almeno due requisiti:

• Deve assumere il suo valore minimo se è solo se tutte le unità della distribuzione presentano la stessa modalità

• Deve aumentare tanto più diverse e disperse sono le modalità rilevate

La varianza
Di un insieme di n valori osservati x1,x2…xn di una variabile x con media aritmetica x è data da:

Il numeratore della varianza è detto devianza

Calcolo sempli cato della varianza

Varianza di una trasformazione lineare

La varianza di un carattere Y, ottenuti attraverso la trasformazione X+ di un carattere X di media x e varianza

Somma di una costante non cambia la variabilità

La deviazione standard
La varianza non possiede la stessa unità di misura dei valori della
distribuzione.

Se X è una variabile misurata in cm, la varianza sarà cm2

Funzione monotona e dunque preserva l’ordine

Il coe ciente di variazione


La varianza è un indice di variabilità che risente:

Dell’unità di misura
Dell’ordine di grandezza dei dati

Pertanto non è possibile

Confrontare la variabilità tra fenomeni con unità di misura diverse

Confrontare l variabilità tra popolazioni che, pur essendo misurate con la stessa unità di misura, possiedono valori
molto diversi

Dobbiamo utilizzare un indice di variabilità, che non dipenda dallkunità di misura e dall’ordine di grandezza delle
variabili.

Se x > 0, può essere utilizzato il coe ciente di variazione:

se x con la barretta è 0 non ha senso, la media deve essere positiva

ffi
ffi
fi
ffi
La standardizzazione
Applicazione ai dati originali di una trasformazione lineare
(standardizzazione) che riconduce a qualsiasi variabile ad
avere media nulla e varianza unitaria.

Indicano di quanto il dato Xi dista dalla media. In termini


di numero di scarti quadratici medi

La distribuzione risultante ha media nulla e varianza


unitaria

Trasformazione lineare :

Intervalli di variabilità
Sono indici che confrontano due valori caratteristici della distribuzione

Campo di variazione
Dato un insieme di n valori osservati ordinati in senso crescente:

De niamo campo di variazione la di erenza fra il +grande e il più piccolo d’Italia valori:

R=0 se tutte le unità presentano lo stesso valore

Attenzione a distribuzioni di frequenza in classi

È falsamente dilatato in presenza di valori anomali

Di erenza interquartile
Dato un insieme di n valori osservati x, x,…xn, de niamo di erenza interquartile la di erenza fra il terzo e il primo
quartile:

W rappresenta il campo di variazione per il 50%


delle unità centrali ( le osservazioni estreme
vengono escluse)

È un indice approssimativo

Box-plot
Misura sintetica di rappresentare gra camente la
variabilità

ff
fi
ff
fi
fi
ff
ff
PowerPoint 05 Analisi dell’associazione fra due caratteri
• Distribuzioni doppie frequenze
• Analisi dell’associazione fra due caratteri
• La dipendenza di un carattere quantitativo da un carattere qualitativo o discreto
• L’interdipendenza tra caratteri quantitativi

Tabella di frequenze a doppia entrata

Frequenze assolute= fare le somme

Distribuzione doppie di frequenze


La distribuzione unitaria doppia riferita a due caratteri può essere
sintetizzata attraverso una tabella di frequenze a doppia entrata detta
anche distribuzione doppia di frequenze.

Dati due caratteri X eY, si de nisce distribuzione doppia di frequenze


l’insieme delle frequenze congiuntive fj, ovvero le frequenze assolute
delle unità che presentano congiuntamente la modalità i-esima della
variabile X e la modalità j-esima della variabile Y.

Distribuzioni marginali
L’ultima colonna e l’ultima riga sono dette distribuzioni marginali rispettivamente di X e Y.

F i. Indica la frequenza assoluta delle unità che presentano nel collettivo la modalità xi e qualunque modalità Y

F .j indica la frequenza assoluta delle unità che presentano nel collettivo la modalità y i e qualunque modalità di X

Distribuzioni condizionate
Sono Le righe e le colonne interne alla tabella a doppia entrata

La distribuzione dalla prima riga f11, f1j, f1k ci dice come si distribuisce il carattere Y quando consideriamo le sole
unità che presentano la modalità x1 di X

Proprietà distribuzione coppie


fi
Media e varianza condizionate
Per ogni distribuzione di un carattere quantitativo si può calcolare:

Media o baricentro di una distribuzione doppia


Dati due caratteri quantitativi possiamo sintetizzare la distribuzione doppia mediante il punto di coordinate(x,y)

Chiamati punto medio o baricentro della distribuzione.

Associazione tra due caratteri


• Dipendenza logica= ci sono a priori relazioni di causa ed e etto es. Peso di un uomo dipende da alimentazione,
età ecc.

• Indipendenza logica=non ci sono a priori nessuna relazione di causa ed e etto es. importazioni di banane e
numero annuale di incidenti automobilistici

Uno degli scopi fondamentali dell’analisi statistica è veri care se esiste una forma di indipendenza o meno tra le
modalità dei caratteri osservati.

Tramite due approcci: analisi della dipendenza e analisi di interdipendenza

Indipendenza statistica
L’assenza di un qualsiasi legame fra i due caratteri.

Che strumenti uso per individuarla?

Le distribuzioni di frequenza condizionata del carattere Y perchè mostrano come si distribuisce Y al variare
delle modalità di X

Due caratteri X e Y si dicono indipendenti se le distribuzioni relative condizionate di un carattere rispetto alle
modalità dell’altro sono uguali

Condizioni di fattorizzazione

Frequenze =prodotto delle marginali diviso N


Prima riga 1 4 5 diviso 10= 1 Seconda riga 2 8 10 diviso 20= 1

Devo vedere se sono uguali, sono uguali però non basta per dire che sono dipendenti, devo farlo con tutte le righe

fi
ff
ff
Dipendenza e Interdipendenza
Se i due caratteri non sono indipendenti, allora fra di essi sussiste qualche tipo di relazione.

Dipendenza perfetta di Y da X
Quando ad ogni modalità di X è associata una sola modalità di Y

Interdipendenza perfetta di X da Y
Se ad ogni modalità di uno dei due caratteri corrisponde una e una sola modalità dell’altro e viceversa

Dipende dal numero di modalità di X e Y. Se sono uguali, allora ci può essere interdipendenza perfetta, altrimenti si
può avere solo dipendenza perfetta.

TABELLA INDIPENDENZA STATISTICA

TABELLA DI DIPENDENZA PERFETTA

TABELLA DI INTERDIPENDENZA PERFETTA


Interdipendenza tra i caratteri quantitativi

Associazione fra caratteri qualitativi sconnessi

Indice di associazione Chi-quadrato


Normalizzazione del X2
La concordanza e la discordanza

La covarianza

Ii
La correlazione

Proprietà del coe ciente di correlazione

Esempio

Relazione tra le varie forme di Indipendenza


ffi
08 PowerPoint variabili casuali e distribuzioni di probabilità parte 1
• Variabili casuali
• Variabili casuali discrete
• Variabili casuali continue
• Valore atteso e varianza di una v.c.
• V.C. Standardizzate

VARIABILI CASUALI

Variabili casuali discrete e continue


Una variabile casuale discreta può assumere un insieme discreto ( nito e
numerabile) di numeri reali

Una variabile casuale continua può assumere tutti gli in niti valori compresi in un intervallo reale

Se Ω è discreto, la variabile casuale sarà discreta

Se Ω è continua, la variabile casuale può essere continuano discreta

X è la variabile casuale, mentre xi è una sua realizzazione

Variabili casuali discrete


fi
fi
Funzione di ripartizione

Proprietà
Variabili casuali continue
• Una variabile casuale continua può assumere tutti gli in niti valori di un intervallo reale

• Per tale motivo non ha senso assegnare una probabilità a ogni singolo valore che la variabile casuale può
assumere

• Comunque si ssi tale probabilità, la somma delle probabilità risulterebbe in nita

• Molto meglio assegnare una misura di probabilità a tutti i possibili intervalli sull’asse reale

FUNZIONE DENSITÀ’
Funzione di densità: della variabile casuale continua X la funzione matematica f(x) per cui l’area sottesa alla
funzione, è uguale alla probabilità che X assuma un valore in quell’intervallo.

Proprietà:
fi
fi
fi
Funzione di ripartizione

Valore atteso di una variabile casuale


varianza di una variabile casuale

Valori caratteristici di una funzione lineare di una variabile casuale

Variabile casuale standardizzate

Potrebbero piacerti anche