Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
- Parte DESCRITTIVA
1. Rilevazione e raccolta dati
2. Rappresentazione e interpretazione
- Teoria PROBABILITÁ
3. Generalizzazione dei risultati -> INFERENZA
Collettivo statistico: insieme dei casi individuali in cui si manifesta il fenomeno di interesse
Caratteri:
QUALITATIVI
QUANTITATIVI
si osserva il carattere X
se osserviamo X e Y in contemporanea
X= genere
- M
- F
Supponiamo di avere
M= 8 unitá
F= 12 unità
N= 20
K= n1 modalità= 2
È lo schema con cui si associa a ciascuna modalità del carattere X la sua rispettiva
Possiamo rappresentare la distribuzione la distribuzione di frequenza per una distribuzione doppia usando
una tabella a doppia entrata
Carattere X: genere
carattere quantitativo, numero di modalità elevato -> conviene aggregare le modalità in intervalli
Es:
- X1, x2,…, xk
- N1,n2,…,nk
- F1,f2,…,fk
- Chiamiamo
ISTOGRAMMA DI FREQUENZA
assumiamo valori uniformemente
distribuiti dentro le classi e
interpoliamo con una retta.
MEDIA ARITMETICA
- Distribuzione disaggregata x1, …, xn
- Distribuzione di frequenza
- Come possiamo calcolare la media aritmetica in una distribuzione definita per classi?
MEDIA GEOMETRICA
- Investimento
Definizione:
o
- DISTRIBUZIONE DIFREQUENZA
Es: un giocatore gioca 2 euro, tre giocato, vincita complessiva pari a 432 euro
o
- DISTRIBUZIONI DI FREQUENZE
o
- Distribuzione disaggregata
o Costruisco una modifica (Y1,…,Yn ; Yi=Cxi)
Esempio: 6000 abitanti di un comune, distribuiti in 3 quartieri. La densità abitativa (abitanti/km2):
TOTALE= 6.000
Caratteri quantitativi ordinati in ordine crescente. La mediana è quel valore che lascia a dx e sx lo stesso
numero di osservazioni.
o Se N è dispari:
- DISTRIBUZIONE DI FREQUENZE
X1,X2,…,Xk
N1,n2,…,nk
o Determiniamo le frequenze cumulate:
F1,F2,…,Fk
Individuiamo F h−1 , Fh , t . c
o Assegniamo alla mediana il valore
Esempio1:
esempio2:
- Individuare la classe mediana. Utilizziamo lo stesso criterio visto per le distribuzioni di frequenza.
- Assumiamo uniforme distribuzione alle osservazioni all’interno delle classi e determiniamo m
mediante la formula di interpolazione
Invertiamo:
Esempio: calcolo la mediana per
QUANTILI:
si definisce il quantile di ordina alfa il valore che lascia a sinistra un numero di osservazioni pari a alfa x
100%
percentili
Quartili
Per le distribuzione definite per classi definiamo la CLASSE MODALE come la classe con DENSITÁ di
frequenza maggiore.
Esercizio1
VARIANZA
- DISTRUBUZIONE DISAGGREGATA:
- DISTRIBUZIONE DI FREQUENZA:
definizione: la varianza è una quantità quadratica, non ha la stessa unitá di misura dei dati
Mostriamo l’equivalenza:
Tutte le definizioni e le proprietà visto fin’ora valgono anche per distribuzioni in classi con Xi al posto di Xi
Due distribuzioni che hanno la stessa media e stessa varianza, ma inidci di simmetria diversi
- Q3= 3° quartile
- Q1= 3° quartile
- M=q2= mediana
INDICI DI FORMA
Curtosi (Indice di appiattimento)
esempio:
Y= titolo di studio (A= analfabeta, EM= elementari/medie, SU= superiori o universitá; t=3)
-
la definizione qui sopra è equivalente a:
Distribuzioni condizionate pe riga sono tutte uguali tra di loro e sono uguali alla marginale relativa di Y.
-
o Le distribuzioni relative per colonna sono uguali tra di loro e sono uguali alla marginale
relativa di X
DIPENDENZA PERFETTA
Es:
In tutti i casi intermedi tra dipendenza perfetta e indipendenza, vogliamo stabilire e quantificare la
dipendenza.
Definiamo: INDICE CHI QUADRATO
Peró il chi quadrato non ci permette di quantificare la dipendenza. Vorremma indice C tale che
- C=0= Indipendenza
- C=1= dipendenza perfetta
0≤C≤1
esempio:
- X= sesso capofamiglia
- Y= fascia di reddito
COVARIANZA
Definiamo la covarianza come
Definizione di covarianza:
Formula operativa
Mettiamo l’equivalenza
La covarianza è un indice NON normalizzato. Vogliamo ottenere un indice che varia tra -1 e 1
R varia tra -1 e 1
graficamente:
R=0 -> non c’è un legame tra X e Y, ma potrebbero esserci altri legami
Es:
Esempio:
X= variabile indipendente
Y= variabile dipendente
Ɛ= componente residuale (errore) e contiene tutto ciò che contribuisce a ‘’spiegare’’ y che non sia x
Quello che noi vogliamo fare è postulare una relazione del tipo y= f(x)+Ɛ e utilizzare per selezionare la f(x)
migliore
assumiamo
conosco la funzione f() ma non conosco bo,b1, b2. Il lavoro si è semplificato a scegliere i parametri che
minimizzano le componenti RESIDUALI.
Procedura generale
1. postulare y=f ( x ,b o ,b 1 , … , b s ) +ε
- X1,…,xn
- Y1,…,yn
Postuliamo f ( x )=b0 +b1 x
Definiamo:
y= produzione di legname in m3
a. interpoliamo con una retta y rispetto a X => vogliamo ottenere Ỹ =b0 +b1 x
sappiamo:
Abbiamo bisogno:
Otteniamo:
Dobbiamo calcolare:
INDICE DI DTERMINAZIONE
Valutiamo la bontá dell’interpolazione mediante la retta dei minimi quadrati: quanto delle y i abbiamo
spiegato mediante x i?
BUONA INTERPOLAZIONE
CATTIVA INTERPOLAZIONE
y i−μ y =¿
(ricordate ^y i=b0 +b1 x i)
Chiamiamo:
^y i−μ y=> componente SPIEGATA (dalle Xi)
Non usiamo direttamente gli scarti per costruire il nostro inidice, ma usiamo le DEVIANZE:
i=1
N
DEVIANZA SPIEGATA: D s L =∑ ( ^yi −μ y )
2
i=1
N
DEVIANZA RESIDUA: D RL=∑ ( y i−^y i )
2
i=1
Possiamo mostrare:
D y =D s L + D R L
2 D sL
R=
Dy
1° caso limite:
1=1