Sei sulla pagina 1di 5

Che cos’è la statistica?

Una scienza che ha per oggetto lo studio di fenomeni collettivi (altezza, ecc…)
suscettibili di misurazione e definizione quantitativa.

Unità Statistiche: unità su cui andiamo a raccogliere i dati (persone, ospedali, aziende, viti)

Collettivo di riferimento: insieme delle unità statistiche

Si può avere a che fare su una popolazione o su un campione (parte di una popolazione).

Due rami: statistica descrittiva e statistica inferenziale (fare inferenza, cioè passare dal campione alla
popolazione).

Mettere a fuoco:

- Unità statistiche (soggetti di studio)


- Variabile (o carattere o fenomeno)
- Rilevazione censuaria (tutta la popolazione) o campionaria (per campione)

Parametro: sintesi numerica di dati della popolazione (MEDIA)

Statistica: sintesi numerica di dati del campione (MEDIA)

PRIMA FASE: ASTRAZIONE

Scopo dell’indagine?

1) Definire Unità Statistiche, individuare la popolazione di riferimento (eventualmente come


individuare il campione?)

SECONDA FASE: RILEVAZIONE

Interviste, questionari, ecc…

TERZA FASE: SPOGLIO

 Si ottiene la MATRICE DEI DATI (Foglio Excel solitamente, ogni riga è un “record” e ogni colonna una
“variabile”

Modalità di un carattere: modo in cui si manifesta

La lista delle modalità deve essere esaustiva, contemplare tutti i modi in cui il carattere si manifesta e le
modalità devono essere incompatibili. “Altro” voce residuale.

Modalità categoriali (vocaboli o attributi)- carattere qualitativo

Modalità quantitative -può essere chiamata intensità - (numeri) – carattere quantitativo

Le modalità possono essere “in ordine”

Scala di misurazione:

- Nel qualitativo: scala nominale (se due unità statistiche per un certo carattere hanno una stessa
modalità o diverse), quando l’unica operazione possibile è dire se sono uguali o diverse (carattere
qualitativo sconnesso, non c’è ordine tra le modalità), il carattere qualitativo ordinato è rilevato con
scala ordinale.
- Nel quantitativo: scala a intervalli e scala di rapporti. Distinzione: esistenza o meno di uno zero vero
o di uno zero arbitrario, ad esempio la misurazione della temperatura (intervalli).
Caratteri quantitativi:

- Discreti: caratteri numerici che possono assumere solo un numero finito di valori anche infinità
numerabile (es. numero figli)
- Continui: tutti i valori all’interno di un intervallo (es.altezza)

Spesso i caratteri quantitativi continui vengono espressi tramite modalità di classi (es. reddito e fasce di
reddito) – l’estremo superiore di una classe deve coincidere con l’estremo inferiore della classe successiva.
(Es. 1000-1200) Possibile anche classi più strette in un determinato intervallo. Ampiezza: quanto è ampia la
classe.

n o N = numero unità statistiche (N grande solitamente si riferisce alla popolazione, n al campione).

X,Y,Z = carattere se quantitativo A,B,C se qualitativi

K = numero delle modalità

x(i) (i=1,2,3…..k)

n(i) = frequenza assoluta della iesima modalità (numero di unità statistiche associate alla modalità iesima)

Es

X n(i)

0 4

1 7

2 6

3 2

4 1

Classi di reddito

1000-1500

1500-2000

2000-2500

2500-3500

FREQUENZE RELATIVE

f(i)= n(i)/n

Somma di tutte le F(i)=1

Percentuale

FREQUENZE CUMULATE

Solo se si ha a che fare con caratteri che siano almeno qualitativi ordinati (o qualitativo rettilineo). Quindi
solo se c’è un ordine tra le modalità. Con il genere ad esempio non si può fare, col titolo di studio no.

N(i) = somma di tutte le n(i)

F(i) = cumulare le f(i)


Le classi per caratteri quantitativi discreti sono delimitate da estremo inferiore a estremo superiore +1.

DENSITA’ DI FREQUENZA

Quando abbiamo classi di modalità di caratteri quantitativi continui

a(i)= ampiezza ciascuna classe (differenza estremo sup.e inf)

d(i)= densità di frequenza (o frequenze specifiche)

d(i)=n(i)/a(i),

d(i)rel=f(i)/a(i)

FINO A QUA FATTI CAPITOLI 1,2,9

GRAFICI

Rappresentazione grafica frequenze relative

Rappresentazione grafica frequenze assolute

Capire che carattere si ha:

1) Se qualitativo(ordinato o nominale), grafico a barre, su x modalità su y le n(i)d


2) Se quantitativo discreto = retta o bastonicini dove x modalità e su y le n(i)
3) Se quantitativo continuo, quale che sia l’ampiezza si calcola l’ampiezza e la densità di frequenza,
dopo istogrammi la cui altezza corrisponde alla densità di frequenza. Area rettangolo = n(i)

FREQUENZE ASSOLUTE CONGIUNTE (n.1,n.2 v n1.,n2. ) n.. totale

FREQUENZE CONDIZIONATE
ATTEGGIAMENTO RELIGIOSO CONDIZIONATO RISPETTO ALL’OPINIONE

CONDIZIONATO CHI RISPETTO A CHE COSA – SONO UNIVARIATE, se condizono l’opinione rispetto
all’atteggiamento ne ho 2

FREQUENZE CONDIZIONATE RELATIVE DELL’OPINIONE RISPETTO ALL’ATTEGGIAMENTO

INDICI DI POSIZIONE (o Misure di centralità) – capitolo 3 libro di testo

Servono a fare sintesi dei dati (dopo frequenze e grafici)

Cioè calcolo media, moda, mediana. Proprietà e teoremi della moda aritmetica.

Moda = modalità alla quale è associata la frequenza maggiore (frequenza o frequenza specifica).
Un carattere può essere bimodale (occhi 20 azzurri 20 neri)

MEDIANA: si basa sull’idea di poter mettere in ordine le unità statistiche in base al carattere di cui voglio
calcolare la mediana (quindi non si può calcolare sui caratteri qualitativi sconnessi). È IL VALORE DI UNA
MODALITA’. In base a n se è pari o dispari le mediane saranno una o due.

1) Calcolare la posizione centrale (se n è dispari, la posizione centrale è (n+1)/2, se n è pari allora sono
n/2 e n/2 + 1
2) Calcolare le frequenze cumulate (Ni)

3) Andare a vedere dove cade rispetto alla cumulata la posizione che cerco e qual è la modalità che
sta in quella posizione. In questo caso “Laurea”. Se in un carattere qualitativo le due posizioni sono
occupate da due modalità diverse la mediana non può essere calcolata. Se è quantitativo si smezza.

SE intervalli, bisogna calcolare densità di frequenza per calcolare moda.

Potrebbero piacerti anche