In questo caso su ogni riga c’è un individuo (persone), ma può essere qualsiasi cosa.
osserviamo; cognome, altezza, anno di nascita…
Definizioni
Variabile statistica o carattere:
ad esempio:
sesso, anno di nascita, luogo di nascita etc.
4 tipologie di variabili
Qualitative:
Nessun ordine tra le modalità = Variabile Nominale
variabile priva di ordine
(es: sesso, cognome, colore occhi, stato lavorativo, sport etc.)
non c’è ordine nelle modalità di risposta; posso dire maschio o femmina, oppure,
femmina o maschio, non c’è un ordine preciso di come li devo presentare
1
come si sintetizza una variabile qualitativa se non si possono fare calcoli; es non posso
fare la media del colore degli occhi!
questa variabile può essere resa quantitative, posso dire sufficiente vale=0, insufficiente=
1… ecc (questa è una cosa soggettiva, ma non posso fare dei calcoli, vedi tabella!)
La codifica è utile, perché semplifica il database
attenzione: magari abbiamo il numero ma non ha senso!
Quantitative:
sono numerici (numeri interi, o con la virgola)
Continue = Variabile definita su una Scala (es: durata di una connessione internet,
temperatura meteo, ora di arrivo)
2
Peso e altezza sono variabili quantitative continue,
numero di modalità è infinito in quanto il peso è un numero reale (numero con la virgola), il
peso può essere 45,1 45,2 ecc…, dato che l’altezzaa e il peso sono variabili scala e dipendono solo
dagli strumenti di misura
Se dico che il peso assume come modalità 45, 46 ecc… sto facendo un approssimazione, dato che il
peso è 45,1 ecc…
- Statistica univariata:
o Ciascuna variabile presa separatamente
1. tabelle
Per sintetizzare le informazioni di base!
Una prima sintesi è ottenuta raggruppando i valori uguali in una tabella Modalità/frequenze
Righe= modalità distinte
Colonne=quante volte si presenza quella modalità/frequenz
3
Variabili qualitative: tabella individui/modalità per la variabile sesso
Assume i valori:
- 0 = Maschio
- 1 = Femmina
variabile nominale, ricordandomi che non posso fare medie su questi valori e dopo di che
costruisco una tabella di frequenza
Possiamo contare quanti individui assumono ogni differente modalità producendo così una:
- Tabella di frequenza o
- Distribuzione di frequenza
4
Ci sono 3 tipi di frequenze
Assolute (il puro conteggio): FrqAss
o La somma delle FrqAss ci dà il totale degli individui osservati (N)
Relative (indipendenti dal numero degli individui): FrqRel = FrqAss / N (numero individui)
o La somma di tutte le FrqRel è 1.
Se le modalità di risposta sono poche (es ho solo maschio o femmina) È’ POSSIBILE ELENCARLE
TUTTE E CONTARNE LA FREQUENZA
se le modalità sono tante e non ho più la funzione di sintesi, quindi visto che non rispetta il mio
scopo di sintetizzare, non ha senso!
Ove possibile le classi dovrebbero essere tutte di uguale ampiezza per evitare distorsioni
5
Esempio: Età
tabella di frequenza di una variabile quantitative discreta, posso farla, ma non è molto utile
perché non è sintetica (es età in cui non ho osservato nessuno)
Quindi raggruppo in classi di modalità
2. Se modifico il criterio di formazioni delle classi, modifico l’immagine che viene fornita
tramite questa sintesi
soggettivo
dove è possibile (variabili quantitative) le classi dovrebbero essere della stessa ampiezza
(classi decennali, tranne la prima aperta a sinistra e l’ultima aperta a destra)
posso manipolare i dati!
6
Attenzione:
IL MODO DI RAGGRUPPARE IN CLASSI NON E’ UNICO, E’ ARBITRARIO, E PUO’ MODIFICARE LE
CONCLUSIONI!
Nel caso della variabile quantitativa almeno le classi devono avere un certo ordine, altrimenti se è
qualitativa si può fare ciò che si vuole
qui invece la maggiorparte degli studenti sembra straniero, perciò bisogna stare attenti quando
forniamo le classi, in quanto devono essere il più obiettive possibile!
7
Variabili quantitative discrete
numeri di figli
8
Esempio: Peso
(Raggruppiamo i pesi delle varie persone in classi)
non c’è discuntinuitità tra le classi, dove finisce una classe inzia la successiva!
9
Strumenti grafici
strumenti che mi servono per rappresentare graficamente le stesse info della tabella.
Sono una maniera conveniente di rappresentare una distribuzione di frequenza o, più in generale,
dei dati
Istogramma
(per variabili quantitative) (poche colonne – “bassa definizione”)
La tabella è difficile da leggere, quindi raggruppiamo in classi. Invece per l’istogramma non è così,
possiamo mettere tante info e metto tante classi.
+ ci sono classi meglio è!
Istogramma
(molte colonne – “media definizione”)
10
Istogramma
(ancora più colonne – “alta definizione”)
Oltre agli istogrammi e ai grafici a barre ci sono un infinità di altri tipi di grafici:
in Excel..
11