Nozioni preliminari
Nicola Salvati
a.a. 2015/2016
Part I
Introduzione
Modalità di esame:
Prova intermedia: ?
Prova scritta (domande con risposte chiuse a scelta multipla su esercizi e teoria).
Attenzione: sono ammessi alla prova scritta solo gli studenti regolarmente iscritti
on-line
Prova orale obbligatoria per coloro che, pur ricevendo un voto complessivamente
sufficiente, ottengono un punteggio inferiore a 4/7 all’esercizio di teoria
Attenzione: La prova orale deve essere sostenuta alla data della prima prova orale
disponibile subito dopo la prova scritta sostenuta
Coloro che non superano la prova scritta possono visionare il compito alla prima
prova orale disponibile
Tutoraggio di statistica
Concetti generali
Concetti generali
Concetti generali
Concetti generali
Unità statistiche
Statistica descrittiva
Inferenza statistica
Figure: Rappresentazione grafica del processo di induzione statistica (Inferenza statistica classica).
Dati statistici
Caratteri statistici
Sono delle caratteristiche delle unità analizzate che vengono rilevate (cioè
osservate) e studiate in relazione ad un determinato fenomeno. Alcuni esempi:
Caratteri statistici rilevabili su individui: statura, peso, reddito percepito, età, stato
civile, ecc.
Caratteri statistici rilevabili su aziende: numero di dipendenti, utile netto, fatturato,
settore di attività, ecc.
Caratteri statistici
Modalità dei caratteri statistici: valori o attributi specifici che può assumere un
carattere su un’unità statistica.
Le modalità devono essere:
esaustive: devono rappresentare tutti i possibili modi di manifestarsi del carattere;
non sovrapposte: ad ogni unità statistica si può associare una sola modalità.
Nel momento in cui un carattere assume una certa modalità in corrispondenza di
un’unità statistica, siamo in presenza di un dato statistico.
N.B. Nella pratica statistica, la classificazione tra variabili discrete e continue non è
rigida. Talvolta alcune variabili continue sono trattate come discrete e viceversa
Caratteri qualitativi
Si distingue tra:
Caratteri sconnessi o nominali: caratteri per cui le modalità non si possono
ordinare
Esempi: religione, luogo di nascita, colore degli occhi;
Caratteri ordinati (o ordinali): caratteri le cui modalità presentano un ordine
logico. Possono essere:
rettilinei: l’ordine è a salire o a scendere (esempi: titolo di studio, gradi militari, grado
di soddisfazione)
ciclici: non c’è un ordine crescente o decrescente (esempi: direzione del vento, mesi
dell’anno)
Caratteri quantitativi
Si distingue tra:
Caratteri discreti: caratteri le cui modalità scaturiscono da un conteggio
Esempi: numero di figli, età in anni;
Caratteri continui: caratteri le cui modalità scaturiscono da una misurazione
Esempi: peso, altezza, temperatura;
I caratteri quantitativi continui si riferiscono sempre ad una scala di misura
In pratica un carattere discreto è tale se l’insieme dei valori che può assumere è finito
o numerabile. Un carattere continuo, invece, può teoricamente assumere tutti i valori
all’interno di uno o piú intervalli reali.
Caratteri quantitativi
Part II
Table: Distribuzione di frequenza assoluta del carattere Stato civile (popolazione Demo).
Table: Distribuzione di frequenza assoluta del carattere Livello di istruzione (popolazione Demo).
Table: Distribuzione di frequenza assoluta, relativa e relativa percentuale del carattere Stato civile
(popolazione Demo).
Table: Distribuzione di frequenza assoluta, relativa e relativa percentuale del carattere Livello di
istruzione (popolazione Demo).
Le distribuzioni delle frequenze relative dei caratteri Stato civile e Livello di istruzione
ci consentono di affermare che nella popolazione Demo:
Circa la metà delle unità statistiche è coniugata, la restante metà è non
coniugata;
Il 30% circa delle unità statistiche possiede il diploma come titolo di studio, e non
si è mai iscritto all’università;
Il 5.61% delle unità statistiche possiede una specializzazione post-laurea.
Frequenza relativa cumulata: è data dalla somma delle frequenze relative con cui
si presentano le prime j modalità del carattere. La frequenza relativa cumulata si
indica con Fj e si calcola come Fj = f1 + f2 + . . . + fj
Frequenza relativa percentuale cumulata: è data dalla somma delle frequenze
relative percentuali con cui si presentano le prime j modalità del carattere. La
frequenza relativa percentuale cumulata si indica con Pj e si calcola come
Pj = p1 + p2 + . . . + pj
Table: Distribuzione di frequenza assoluta e frequenza assoluta cumulata del carattere Livello di
istruzione (popolazione Demo).
Per esempio nel caso del carattere Età della popolazione Demo il Valore minimo
(modalità piú bassa) è pari a 18, il Valore massimo (modalità piú alta) è pari a 77
Supponiamo di voler suddividere il carattere in 6 classi
Si ha: (77 − 18)/6 ≈ 10
La prima classe raggrupperà quindi le modalità da 18 a 27, la seconda da 28 a
37, ecc. Attenzione: bisogna sempre indicare se i valori estremi della classe sono
inclusi o meno nella stessa, in modo da saper collocare univocamente ciascuna
unità nella classe corretta
Table: Distribuzione di frequenza assoluta e relativa del carattere Età suddiviso in 6 classi
(popolazione Demo).
N.B. La prima classe potrebbe essere lasciata aperta ”a sinistra”, ovvero < 27,
l’ultima classe aperta ”a destra”, ≥ 68. Gli estremi delle classi possono essere indicate
anche con le parentesi: la parentesi tonda indica che il valore non è compreso, la
quadra che è compreso. Esempio: [18, 27) corrisponde a 18 ` 27
Table: Distribuzione di frequenza assoluta e relativa del carattere Età suddiviso in 6 classi
(popolazione Demo2).
Rappresentazioni grafiche
Rappresentazioni grafiche
Grafico a nastri
Si utilizza solitamente per caratteri qualitativi nominali.
Rappresenta la frequenza (assoluta o relativa) di una tabella di frequenze
sottoforma di rettangoli (nastri)
Ogni nastro ha la medesima base ed i nastri sono tra loro equidistanti
Le lunghezze dei nastri sono proporzionali alle frequenze
Figure: Grafico a nastri per i caratteri “Possesso della TV” e “Possesso del PC”. Popolazione
Demo, frequenze assolute.
Grafico a barre
Si utilizza per caratteri qualitativi nominali, ordinati e quantitativi discreti
Rappresenta la frequenza (assoluta o relativa) di una tabella di frequenze
sottoforma di rettangoli (barre)
Ogni frequenza della distribuzione viene rappresentata da una barra (rettangolo)
Ogni barra ha la medesima base
Le barre sono fra loro equidistanti
Le altezze (delle barre) sono proporzionali alle frequenze
Figure: Grafico a barre per il carattere “Numero di famigliari”. Popolazione Demo, frequenze
relative percentuali.
Grafico a torta
Si utilizza soprattutto per caratteri qualitativi nominali
E’ una rappresentazione grafica circolare che mostra le frequenze di una
distribuzione sottoforma di sezioni (“spicchi”) di un cerchio
E’ indicata quando si vuole rappresentare la composizione di un aggregato,
l’incidenza delle frequenze delle singole modalità rispetto al totale
Non è indicata quando il numero di modalità è troppo elevato, poichè
aumentando i settori circolari il confronto tra questi diventa complicato
Ogni settore (“spicchio di torta”) corrisponde ad una modalità del carattere
L’angolo al centro di ciascun settore è proporzionale alle frequenze
Figure: Grafico a barre per il carattere “Possesso del Fax”. Popolazione Demo, frequenze relative
percentuali.
Figure: Istogramma per il carattere “Età” suddiviso in sei classi di uguale ampiezza (Popolazione
Demo).
Nicola Salvati, a.a. 2015/2016 Statistica corso D: Nozioni preliminari
Distribuzione dei caratteri statistici
Rappresentazione grafica dei caratteri statistici
Table: Distribuzione di frequenza assoluta e relativa, ampiezza elle classi e densità di frequenza del
carattere Età suddiviso in 3 classi (popolazione Demo).
Figure: Istogramma per il carattere “Età” suddiviso in tre classi di diversa ampiezza (Popolazione
Demo).
Nicola Salvati, a.a. 2015/2016 Statistica corso D: Nozioni preliminari