Sei sulla pagina 1di 26

STATISTICA DESCRITTIVA UNIVARIATA

1) Di cosa si occupa la Statistica?


Si occupa dei fenomeni collettivi, quindi dei principi scientifici da applicare per
l’osservazione dei fenomeni.
2) Cosa sono i fenomeni collettivi. Fare un esempio
I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di
osservazioni, quindi non basta osservare il semplice punto. Prendiamo come
esempio la mortalità, non possiamo soffermarci a chiederci solo “com’è morto?”
dobbiamo vedere tutti gli altri punti, come:
- quando è morto
- com’è morto
- sesso
- nazionalità
3) Cosa sono i caratteri statistici? Quali sono le principali tipologie
Carattere statistico → è ciascuno degli elementi che descrivono un’unità statistica.
Ogni carattere statistico è presente nelle unità con più modalità. (per esempio il
carattere statistico «sesso» può avere, per ogni unità statistica di una popolazione o
di un campione, le due modalità M e F).
4) Che cos’è una distribuzione statistica?
Una distribuzione statistica consiste nell'insieme delle risposte assunte da un
carattere statistico osservato su un dato collettivo. Si immagini di aver osservato o
rilevato sulle N unità statistiche della popolazione una variabile X le cui modalità
sono risultate essere (x1, x2,…, xl,…, xN).

5) Descrivere le diverse tipologie di distribuzioni statistiche


● Distribuzione statistica semplice di frequenza, ad ogni modalità della
variabile X si fa corrispondere la rispettiva frequenza. In altre parole, la
distribuzione di frequenza dice quante volte una determinata modalità si
presenta nel collettivo, oggetto di studio.
● Distribuzione statistica semplice per classi, indica la frequenza guardando
però più classi quindi più numeri.
● Le distribuzioni statistiche doppie o bivariate, due caratteri distinti della
stessa unità statistica.
● Distribuzione doppia di frequenza
● Distribuzione tripla o trivariata di frequenza
6) Fare un esempio di distribuzione di quantità.
es. (modalità, età = quantità, quante persone
hanno quell’età)

7) Cosa sono le distribuzioni condizionate?


Si definisce distribuzione condizionata ognuna delle distribuzioni semplici dei dati espresse
da una riga o da una colonna della tabella stessa. Per creare una tabella di distribuzione in
forma aggregata dovremmo costruire una tabella tridimensionale la cui scrittura sarebbe
impossibile, al posto di questa soluzione si costruiscono le distribuzioni doppie condizionate
secondo i primi due caratteri X e Y per ogni modalità del terzo carattere Z, aggiungendo poi
la distribuzione doppia marginale di X e Y la quale prescinde dal terzo carattere,
normalmente come terzo carattere si prende quello con minori modalità

ES.
8) Che differenza c’è tra fenomeni di stato e fenomeni di movimento
(rispetto al tempo)
I caratteri di stato sono quelli in cui la modalità del carattere deve essere individuata
nell'unità facendo riferimento ad un istante di tempo
I caratteri di movimento sono quelli in cui la modalità del carattere va osservata
nell'unità facendo riferimento ad un intervallo di tempo.
ES. Peso, altezza, stato civile sono caratteri di stato. Consumo di energia elettrica,
guadagni, spese, sono caratteri di movimento.
9) Quali sono le fasi di una rilevazione statistica
La rilevazione dei dati è l'insieme delle operazioni con cui si perviene alla
conoscenza delle modalità dei caratteri da osservare nelle diverse unità di un
collettivo.
● Studio osservazionale ⇒ piano della rilevazione ⇒ indagine statistica
● Studio sperimentale ⇒ protocollo della sperimentazione ⇒ sperimentazione

A) Scopo e finalità dello studio. Esplorativo, studio descrittivo, esplicativo ,


trasversale , longitudinale
B) Dettaglio dei caratteri e scale di misura. Elencazione dei caratteri, scale di misura,
modalità (modalità automatiche, definite dal ricercatore, classificazioni ufficiali … )
C) Unità statistica, popolazione, unità di rilevazione.
D) Periodo di riferimento e svolgimento. (fenomeni di stato e di movimento)
E) Tipo di rilevazione. totale o censuaria, parziale o campionaria (dimensione del
campione e modalità di estrazione) unica, saltuaria periodica.
​F) Strumenti di misura, questionario e modalità di somministrazione.
G) Lavoro sul campo.
H) Codifica, registrazione su supporto magnetico, revisione, produzione dei micro
dati.
I) Elaborazione dei dati, produzione macrodati , risultati e rapporto di ricerca.

Il questionario (detto anche Modello di rilevazione)


Caratteristiche di un buon questionario
- domande strettamente necessarie, questionario non eccessivamente lungo
- domande facilmente ed univocamente interpretabili
- non devono richiedere sforzi eccessivi di memoria
- non devono creare imbarazzo o tensione psicologica né essere tendenziose

Elementi importanti
- parole utilizzate
- ordine delle domande

Tipi di domande
Domande chiuse, domande aperte,
Questionario strutturato, non strutturato o semistrutturato

Modalità di somministrazione
- intervista diretta o faccia a faccia.
- intervista telefonica
- autocompilazione del questionario
- compilazione via web
​Le statistiche ufficiali e le fonti dei dati
=> Istituto Nazionale di Statistica (ISTAT)
=> Sistema Statistico Nazionale (SISTAN, 1989)
Confindustria, Doxa, Abacus, Cirm, …
10)Quali sono le proprietà delle frequenze relative?
● fi e pi Sono numeri non negativi.
● La somma delle frequenze relative delle modalità di un dato carattere in un
dato collettivo è pari a 1 mentre quello delle frequenze percentuali è pari a
100
11) Che cos’è la densità di frequenza?
E’ il rapporto tra frequenza relativa (o assoluta) di una classe e la sua ampiezza
12)In cosa consiste l’ipotesi di uniforme distribuzione per le distribuzioni
per classi?
Quando andiamo a dividere un evento per classi, supponiamo gli elementi abbiano
lo stesso numero di “caratteri”, (magari non è vero ma comunque possiamo
supporlo) quindi prendendo quella classe possiamo dividerla tranquillamente.
13)Come si rappresenta graficamente una distribuzione per classi?
Con l’istogramma di frequenza
14)Che cos’è la funzione di ripartizione di un carattere continuo e a cosa
serve
È detta funzione di ripartizione del carattere quantitativo X la funzione che associa
ad un qualsiasi numero reale x la frequenza relativa delle unità della popolazione
che presentano un valore del carattere non superiore a x.
Viene usata per descrivere fenomeni quantitativi o comunque descritti con valori
misurati su scale ordinali, intervallari o proporzionali, ma non se misurati con una
scala nominale. sono dette frequenze relative cumulate.
15)Quali sono le proprietà della funzione di ripartizione?
● Il valore minimo che assume è 0.
● Il valore massimo è 1.
● La funzione non è mai decrescente, nel senso che al crescere del valore della
variabile indipendente x i valori della funzione non possono mai diminuire.
● Dati due valori reali a e b, la frequenza relativa dei casi compresi
nell’intervallo aperto a sinistra a--|b è data dalla espressione freq{a<X
≤b}=F(b)- F(a) ovvero dalla differenza tra il valore della funzione di ripartizione
in b e in quello di a.
16)Cosa sono i rapporti statistici?
Sono rapporti tra grandezze riguardanti fenomeni collettivi i quali consentono la
comparazione di situazioni diverse e rendono più facilmente interpretabili le intensità
dei fenomeni; le grandezze messe nei rapporti sono micro-dati, ovvero ricavati da
conteggi o somme di dati elementari; infine un rapporto ha senso fintanto che vi sia
un legame logico fra le intensità messe a rapporto.
17)Fare un esempio di rapporto di composizione, di coesistenza e di
derivazione
Rapporti di composizione: rapporti tra una parte ed il tutto. Le frequenze relative
semplici o percentuali sono esempi di rapporti di composizione: fi = ni / n.
Rapporti di coesistenza: rapporti tra una parte ed un’altra parte. Esempio: rapporto di
mascolinità, rapporto tra nati maschi e nati femmine, per 100.

Per ogni 100 nate femmine, abbiamo 106 nati maschio → rapporto di mascolinità
Rapporti di derivazione: rapporti tra le intensità di un fenomeno di movimento e un
fenomeno di stato che genera quel movimento.

ESEMPIO DI RAPPORTO DI COMPOSIZIONE


Sono esempi di rapporti di composizione: maschi residenti sul totale dei
residenti di una comunità; residenti di una determinata fascia di età sul totale
dei residenti; pezzi di scarto sul totale dei pezzi prodotti da un'azienda; operai
di un'azienda sul totale dei dipendenti dell'azienda
18)Come si calcola un incremento percentuale?

19)Come si costruiscono i numeri indice semplici e a cosa servono?


Una volta scelto il periodo di base, i valori per gli altri periodi si ottengono dividendo il
valore relativo ad ogni periodo per quello scelto come base, e si moltiplica il risultato
ottenuto per 100 (per ottenere il valore in percentuale). I numeri indice sono utilizzati
per confrontare i dati su un particolare fenomeno ( variabile statistica ) in luoghi o
tempi differenti.
20)Che differenza c’è tra numeri indice a basi fissa e a base mobile?
Gli indici a base fissa mostrano l'andamento di medio-lungo periodo del fenomeno,
in quanto mostrano l'andamento nel tempo del fenomeno studiato. Gli indici a base
mobile, invece, analizzano l'andamento nel tempo delle variazioni di intensità del
fenomeno tra due periodi di tempo contigui.
21)Come si fa lo slittamento della base di una serie di numeri indice a base
mobile?
Consiste nello spostare la base di costruzione dei numeri indici a base fissa da un
tempo all’altro senza conoscere le intensità originali del fenomeno; supponendo di
conoscere solamente i numeri indice bIt e volendo porre il tempo c come base

22)Come si passa da una serie di numeri indice a base fissa alla


corrispondente serie di numeri a base mobile e viceversa?
Passaggio da base fissa a base mobile = Tale operazione consiste nel dividere
ciascun numero indice a base fissa per quello che lo precede e moltiplicare il
risultato per la base prescelta (100 in genere)
Passaggio da base mobile a base fissa = Bisogna per prima cosa notare che il
numero indice a base fissa del tempo t in base b si ottiene dal prodotto tra il numero
indice in base b precedente e il numero indice a base mobile del tempo t
23)Come si ricostruiscono le intensità originali del fenomeno a partire dai
valori dei numeri indice corrispondenti?
Conoscendo una serie di numeri indice a base fissa di un fenomeno è possibile
ricostruirne le intensità originali purché si conosca almeno un’intensità di un anno

24)In cosa consiste la ricostruzione di serie di numero indice parziali?


Per riscostruire i numeri indice in base (es.) 1985 successivi al 1990 e in base 1990
prima del 1990 è necessario sapere almeno un valore per entrambe le serie, nel
nostro caso nel 1990, da lì è possibile costruire le serie mancanti
25)Cosa sono e a cosa servono le rappresentazioni grafiche delle
distribuzioni statistiche?
Le rappresentazioni grafiche hanno lo scopo di facilitare l’interpretazione e la
comprensione delle distribuzioni statistiche; esse si differenziano a seconda della
natura dei caratteri rappresentati e del tipo di rappresentazione.Gli elementi
costitutivi sono il titolo, scala, fonte.
26)Quali sono le principali tipologie di rappresentazioni grafiche?
Ci sono le rappresentazioni per caratteri qualitativi: grafici a colonne, grafici a nastri,
grafici a colonne contrapposte, grafici a nastri contrapposti (troncamento),
aerogrammi circolari e rettangolari.
Ci sono rappresentazioni per serie storiche: carattere di stato e carattere di
movimento.
Ci sono rappresentazioni per serie territoriali: cartogrammi
Ci sono rappresentazioni per caratteri quantitativi discreti: diagramma ad aste.
Ci sono rappresentazioni per caratteri quantitativi continui: istogramma di frequenza.
27)A cosa servono i valori medi?
A sintetizzare una intera distribuzione statistica semplice con un’unica modalità o
valore numerico.
28)Che cos’è la moda? Che cos’è il valore centrale?
Valore medio che va ad individuare per sintetizzare, quindi quel valore che si ripete
più volte. è la semisomma del valore minimo e massimo rilevato. → valore più basso
+ valore più alto/2
29)Che cos’è la mediana e come si calcola?
Un valore del carattere che non è superato dal 50% dei termini, bipartisce la
graduatoria dei termini. ​ESEMPIO= Dunque, se la lista dei dati è costituita dai
numeri: 18 24 32 60 70, la mediana è 32 (cioè, il valore al centro). Se la lista è
costituita da dati in numero dispari come 5 22 34 52, la mediana è 28: cioè: 22 + 34
= 56 / 2 = 28.
30)Cosa sono i quantili, a cosa servono e come si calcolano?
I quantili sono una generalizzazione del concetto di mediana, sia q un valore
compreso tra 0 e 1; è detto q-esimo quantile di una distribuzione statistica semplice il
valore più piccolo del carattere che non è superato da una frazione q di collettivo.
Per trovare il quantile generico si usa lo stesso procedimento usato per trovare la
mediana sostituendo lo 0,5 con q.
31)Cos’è la media aritmetica di un carattere quantitativo e qual è il
significato del numero che si ottiene?
Le medie analitiche sono medie calcolabili SOLO da caratteri quantitativi tramite una
funzione matematica prendendo una generica distribuzione semplice unitaria:
x1,x2,x3,x4, xN. Ogni x determina l’intensità del carattere. Una funzione dei termini:
f(x1,x2,x3…xN)
32)Quali sono le proprietà dei valori medi e della media aritmetica in
particolare?
Le proprietà di cui godono tutte le medie sono:
● Internalità: un valore medio ha questa proprietà quando, considerando x1 il
valore più piccolo della distribuzione e xN più grande, è sempre non più
piccolo di x1 ed è sempre non più grande di xN.
● Omogeneità: un valore medio ha questa proprietà se è espresso nella stessa
unità di misura con cui è rilevato il carattere; inoltre se si moltiplica ogni
termine della distribuzione per una costante K il valore medio della nuova
distribuzione ottenuta è pari a quello della distribuzione originaria moltiplicato
per K.

Le proprietà soddisfatte solo da alcune medie sono:


Traslativa: un valore medio M ha questa proprietà se, considerando una
distribuzione statistica semplice unitaria di un carattere quantitativo con media M, ad
ogni termine della distribuzione si aggiunge una stessa quantità K si ottiene una
nuova distribuzione con media M+K. Dispongono di questa proprietà i quantili, la
moda e la media aritmetica.
Le proprietà specifiche della media aritmetica sono:
- Proprietà associativa: la media aritmetica dell’intero collettivo può essere vista
come una media aritmetica delle medie di ciascun sottocollettivo, essa è una
media pesata che tiene conto dell’ammontare delle sottopopolazioni
- Proprietà degli scarti dalla media aritmetica: essa afferma che la somma degli
scarti positivi e negativi dalla media aritmetica è zero
33)Quali sono i criteri per scegliere il valore medio da usare?
Un valore medio essendo la sintesi in un unico valore di un’intera distribuzione
permette il confronto fra distribuzioni secondo uno stesso carattere in collettivi
diversi; inoltre il tipo di valore medio cambia a seconda del tipo di carattere utilizzato
infatti:
● Per caratteri qualitativi sconnessi è realizzabile solo la moda.
● Per caratteri qualitativi ordinati si possono fare moda, mediana e quantili.
● Per caratteri quantitativi si possono fare moda, mediana e quantili, e media
aritmetica.
34)A cosa servono i numeri indici complessi?
I numeri indici complessi sono rapporti statistici che misurano le variazioni
simultanee di più fenomeni dello stesso tipo considerati insieme, essi sono numeri
positivi e puri quindi indipendenti dall’unità di misura.
35)Come si calcola e interpreta il numero indice dei prezzi di Laspeyres?
Il numero indice di Laspeyres è una media ponderata dei numeri indice semplici di
ogni bene, ovvero una media di rapporti in cui i pesi assegnati ai beni sono dati dai
loro valori monetari calcolati al tempo base. Rapporto tra la spesa da sostenere al
tempo corrente e quella al tempo base per acquistare la stessa quantità di beni del
tempo base; questo indice è però tendenzioso ovvero tende a sovrastimare
l’aumento dei prezzi in quanto esso funzionerebbe correttamente se le quantità
fossero indipendenti dall’indice dei prezzi, questa sovrastima tende ad aumentare
con l’aumento della differenza tra i tempi
bIt= somatoria di pit qit diviso la sommatoria di pib qib
CONSENTE IL CONFRONTO DEI PREZZI NEL TEMPO
DUE TEMPI
TEMPèO CORRENTE E TEMPO BASE
T è IL TEMPO CORRENTE
LA QUANTITà C’è QUELLA BASE COME NELLA FORMULA
INVECE NELLA FORMULA C’è SIA IL PREZZO BASE CHE QUELLO CORRENTE
Cosa sono i numeri indice ufficiali?
L'elaborazione dei numeri indici ufficiali in Italia spetta all’ISTAT la quale ha elaborato
numeri indici che possono essere suddivisi in quattro grandi classi che riguardano
importanti aspetti della vita economica Italiana, essi sono:
- numeri indice dei prezzi: si divisono in numeri indice dei prezzi, alla
produzione, all’ingrosso e al consumo.
- numeri indice della produzione: si dividono in numeri indici della produzione,
agraria e forestale, industriale …..
- numeri indice degli scambi commerciali, che si dividono in, vendite al
dettaglio, importazioni ed esportazioni.
- numeri indice del lavoro, che si dividono in retribuzioni contrattuali, guadagni
lordi, retribuzioni lorde e costo del lavoro.
36)Come si deflaziona un valore monetario?
Si calcola attraverso un’ operazione mediante la quale data una cifra di un certo
anno si stabilisce la cifra equivalente dell’anno preso come base che consente
l’acquisto delle stesse quantità di beni (detta cifra in moneta dell’anno base).
37)Che cos’è la variabilità e come si misura?
La variabilità è definita come l’attitudine di un carattere a presentarsi con modalità
diverse, essa essendo più o meno grande va misurata attraverso il grado di
variabilità di un carattere in un collettivo, essa sarà poi nulla quando il carattere si
presenta in tutti i casi allo stesso modo e sarà crescente man mano che aumenta la
differenza fra le modalità portando alla regola di come un indice di variabilità:
- non sia mai negativo
- deve valere 0 in caso di variabilità nulla
- assumere valori via via più grandi al crescere della variabilità.
38)Cos’è, quando si utilizza e come si interpreta la differenza interdecilica o
interquartilica?
La differenza interdecilica è la differenza tra nono decile e primo decile
La differenza interquartilica è la differenza tra terzo quartile e primo quartile.
39)Cosa sono gli scostamenti medi e come si calcolano?
Lo scostamento medio assoluto di una distribuzione dalla media aritmetica S(¯x) è
una misura di variabilità che tiene conto di tutti i valori della distribuzione e si calcola
facendo la media aritmetica degli scarti assoluti dei singoli dati dalla loro media.
40)In cosa consiste la proprietà di scomposizione della varianza?

è un rapporto
quello a base fissa è un rapporto tra le intensità di un fenomeno in situazioni diverse
e il rapporto di un fenomeno in una situazione detta base
41)Conosce un indice di variabilità relativo?
Un indice di variabilità relativo è il coefficiente di variazione percentuale e si calcola
così: Cv = 100 S2/M1, 100 X la varianza/media artimetica
42)Che cos’è la concentrazione?
è una proprietà dei caratteri trasferibili. Un carattere trasferibile si dice concentrato
in un collettivo se non è posseduto in parti uguali da ogni unità statistica.
43)Cosa si intende per scarto standardizzato?
Lo scarto quadratico medio (o deviazione standard, o scarto tipo, o scostamento
quadratico medio) è un indice di dispersione statistico, vale a dire una stima della
variabilità di una popolazione di dati o di una variabile casuale.

X - MEDIA ARIT/ VARIANZA

44)Che cos’è e come si misura l'asimmetria di una distribuzione?


L’asimmetria si divide in 2:
- positiva, una distribuzione è chiamata così se gli positivi non corrispondono a
scostamenti negativi della stessa entità; in questo caso la media aritmetica è
maggiore della mediana.
- negativa,una distribuzione è chiamata così se gli scostamenti negativi sono
più grandi in valore assoluto e non corrispondono a scarti positivi della stessa
entità; in questo caso la media aritmetica è minore della mediana.

STATISTICA DESCRITTIVA BIVARIATA


45)Qual è lo scopo dell’analisi bivariata?
Evidenzia se vi sono eventuali correlazioni o una qualche relazione tra due o più
distinte variabili aleatorie. In contrapposizione l'analisi univariata si occupa dello
studio di una sola variabile aleatoria.
46)Come si definisce l’indipendenza statistica tra due caratteri in una
tabella di contingenza?
Analisi della dipendenza: quando uno dei due caratteri si può assumere
logicamente dipendente dall’altro considerato come causa del primo.
Analisi dell’interdipendenza: quando i due caratteri hanno uno stesso ruolo e si
influenzano reciprocamente.
47)Come sono le distribuzioni di un carattere condizionate alle modalità
dell’altro in caso di indipendenza statistica?
Per analizzare il comportamento di un carattere rispetto all’altro le distribuzioni
condizionate migliori sono le distribuzioni di frequenza relativa/percentuale del
carattere dipendente condizionate alle modalità di quello indipendente
48)Cosa sono le frequenze teoriche di indipendenza e come sono state
ricavate?
Se non vi è indipendenza statistica tra due caratteri si dice che tra essi c’è
connessione o dipendenza statistica la quale va misurata attraverso un grado di
connessione presente nella distribuzione doppia che ci interessa e che indichi
quanto ci discostiamo dalla condizione di indipendenza; le frequenze calcolate con la
formula sono dette frequenze teoriche di indipendenza (n’ij).

Ogni frequenza di associazione è uguale al prodotto delle


corrispondenti frequenze marginali diviso per la dimensione del collettivo.

49)Cosa sono le contingenze pesate? Come si interpretano?


Indice di connessione è indicato con la lettera Φ (FI) e si chiama contingenza
quadratica media; tale indice è adimensionale (si interpreta quindi come uno
scostamento relativo medio delle frequenze di associazione da quelle teoriche di
indipendenza) e vale 0 in caso di indipendenza statistica (quando non c’è
connessione), per i calcoli è più agevole usare la seconda formula con Φ2.
50)Quando un carattere si dice perfettamente dipendente dall’altro?
Un carattere Y si dice perfettamente dipendente da un altro carattere X se ad ogni
modalità di X è associata un’unica modalità della Y, in altre parole le unità statistiche
che presentano una stessa modalità X presentano anche una stessa modalità Y
51)Come si calcola e come si interpreta l’indice di contingenza quadratica
media?
L’indice di contingenza quadratica media è uguale a zero nel caso di indipendenza
assoluta fra i due caratteri, è positivo in tutti gli altri casi e il suo valore è tanto
maggiore quanto maggiore è la connessione tra i caratteri statistici esaminati.
La sua formula è: S= righe T= colonne

52)Che cos’è l’indice V di Cramer?


La V di Cramer è un indice utilizzato per misurare il grado di associazione tra due
variabili nominali il cui risultato è un valore reale nell'intervallo.

53)Quando un carattere quantitativo si dice dipendente in media da un altro


carattere?
Quando le distribuzioni condizionate siano uguali e quindi devono essere uguali
anche le medie parziali; la situazione inversa però non è vera infatti se le
distribuzioni condizionate hanno tutte la stessa media non vuol dire che siano uguali;
possiamo infine affermare che l’indipendenza in media non implica l’assenza di
connessione tra i due caratteri.

54)Cos’è, come si costruisce la linea delle medie? Che informazioni ci dà?


Se anche il carattere X è quantitativo è possibile costruire una rappresentazione
grafica che rappresenti la variazione della media parziale di Y al variare delle
modalità di X; tale rappresentazione è una retta costruita su un piano cartesiano
dove sull’asse delle ascisse si mette il carattere X e sull’asse delle ordinate il
carattere Y, i punti avranno coordinate (xi, yi trattino sopra la y); unendo tali punti
otterremo una linea detta linea o spezzata delle medie la quale mostra l’andamento
dei valori delle medie parziali al crescere del valore X.
55)Che rapporto c’è tra la indipendenza statistica e l’indipendenza in
media?
Quando due caratteri sono indipendenti statisticamente allora sono indipendenti
anche in media.
56)Cosa si intende per associazione spuria?
Nell'analisi dell’associazione tra due caratteri lo stabilire la presenza di connessione
fra due variabili non identifica una relazione causa effetto, per esserci connessione
infatti oltre alla sequenza temporale è necessario che la relazione osservata non sia
spuria; due variabili sono connesse in modo spurio quando l’unica ragione della loro
connessione è che entrambe sono influenzate da altre variabili, un esempio di tale
connessione sono i danni di un incendio che aumentano con l’aumentare del numero
dei pompieri, ma non sono di fatto i pompieri a provocare i danni ma l’entità
dell’incendio il quale richiede un maggior numero di pompieri per essere spento.

57)Cos’è un grafico a dispersione o nuvola di punti? Come si


costruisce?Cosa rappresenta ogni punto della nuvola e per quali tipi di
caratteri si usa questo grafico?
Il grafico di dispersione, detto anche grafico a dispersione o grafico a nuvola di punti
è un tipo di grafico in cui due variabili di un set di dati sono riportate su uno spazio
cartesiano. Ha tutti punti sparsi, ognuno corrisponde a un elemento preso nella
costruzione della statistica, quindi per costruirlo basta mettere i vari elementi. Questo
grafico si usa per i caratteri quantitativi.
58)Cosa si intende per interpolazione di una variabile e quali sono le sue
fasi?
Si parla di interpolazione statistica (o interpolazione attraverso i punti) quando si
intende rappresentare in maniera sintetica una relazione funzionale tra due (o più)
variabili statistiche attraverso una funzione f(x). L'interpolazione si svolge in tre fasi
1) Si decide il tipo di funzione da utilizzare guardando la struttura della nuvola
dei punti,
2) Nella classe di funzioni scelta si decide l’equazione migliore per la retta
interpolatrice,
3) Si vede se la retta interpolatrice che abbiamo costruito è soddisfacente.
studiando solo il caso semplice di interpolazione lineare delle rette
l’equazione è y*=a+ bx. Variando a e b si ottengono tutte le rette del piano.

59)In cosa consiste il metodo dei minimi quadrati?


Il metodo dei minimi quadrati stabilisce la migliore retta interpolatrice della nuvola dei
punti è quella che minimizza la somma degli scostamenti al quadrato tra i valori
empirici e quelli teorici. Per il metodo dei minimi quadrati l'accostamento migliore
viene ottenuto minimizzando la somma dei quadrati delle differenze tra i dati
osservati e i dati teorici. σx2= varianza di X mentre il numeratore viene definito
covarianza di X ed Y.Lo scopo è quello di conoscere l’andamento del fenomeno
anche negli intervalli fra i punti di osservazione
60)Come si trova la retta interpolatrice dei minimi quadrati?
Bisogna determinare il punto minimo di una funzione a due variabili tramite delle
formule
Dove i simboli con il trattino sopra sono le medie dei valori X e Y osservati, DEV(X) è
la devianza della variabile X e Cod (X,Y) è la codevianza ovvero la quantificazione di
quanto le due variabili si discostano congiuntamente dalle rispettive medie; le
formule accanto infine sono le formule brevi per i calcoli. Nella formula della retta il
coefficiente angolare:
- Determina la pendenza della retta,
- Quantifica l’incremento che subisce il valore teorico Y quando la variabile
indipendente X aumenta di una unità.Quindi maggiore sarà il valore di b
maggiore sarà la variazione di Y causata da una variazione unitaria di X.

61)Qual è il significato dei parametri della retta interpolatrice dei minimi


quadrati?
Indica l'altezza in cui la retta interseca l'asse verticale. Detta Intercetta.

62)Quali sono le proprietà della retta dei minimi quadrati?


La retta interpolatrice ha tre proprietà:
1) La retta interpolatrice passa per il baricentro dei dati ovvero il punto di
coordinate(x, y col trattino sopra) infatti se nell’equazione della retta al posto
di x metto la media di x e pongo l’equazione per a ottengo come valore
teorico il valore della media di y.
2) La media dei valori teorici è uguale a quella dei valori empirici

Da questa proprietà deriva anche la caratteristica che la somma degli scostamenti


dei valori teorici dalla media dei valori empirici è nulla.
3) Supponiamo di fare una traslazione delle origini della variabile indipendente e
della dipendente passando dai dati originali (xi, yi; dove i=1,2, 3, ..., N) a nuovi
dati (x’i, y’i; i=1, 2, ..., N) dove x’i= xi + ki e y’i=yi+ k2, dove le k sono costanti
scelte da me; da ciò i dati della retta interpolatrice originari si ottengono da
quelli trasformati con le seguenti relazioni: b=b’ e a= a’+ b’*k1-k2.

Il fatto che b non cambi è dovuto alla proprietà traslativa della media aritmetica; le
quantità Cod (X, Y) e Dev (X) rimangono invece inalterate.
63)Che differenza c’è tra interpolazione ed estrapolazione?
Si parla di extrapolazione quando i valori teorici vengono calcolati per valori della
variabile indipendente esterni all’intervallo determinato da quelli minimo e massimo
osservati.

Si parla di interpolazione statistica (o interpolazione attraverso i punti) quando si


intende rappresentare in maniera sintetica una relazione funzionale tra due (o più)
variabili statistiche attraverso una funzione f(x).)

64)Cos’è l’errore standard di interpolazione?


Misura lo scostamento medio tra i valori empirici e i valori teorici.

65)Come si misura la bontà di adattamento della retta interpolatrice?

Più il suo valore è basso più è prevedibile la Y se si conosce la X, se fosse 0


invece i valori di Y sono una funzione esatta di quelli della X.
66) In cosa consiste l’analisi dei residui?
La devianza residua ed è data dalla somma dei quadrati degli scostamenti tra valori
empirici e teorici e si chiama così perché si tratta di scostamenti non spiegabili da X
ma attribuibili a cause residue che contribuiscono a determinare il valore della
variabile indipendente. Dalla devianza residua se si estrae la radice quadrata divisa
per il numero delle osservazioni si ottiene l’errore quadratico medio di interpolazione
ovvero la misura dello scostamento medio dei valori teorici dai valori empirici.

67)In cosa consiste e a cosa serve l’analisi dei regressione lineare?


E’ lo studio della dipendenza lineare (espressa mediante l’equazione di una retta) di
un carattere statistico Y considerato come logicamente dipendente, da un carattere
statistico X, assunto come variabile indipendente.
L’analisi consiste nella nella determinazione della retta interpolatrice dei minimi
quadrati, detta retta di regressione; nel leggere i valori dei parametri della retta, detti
coefficienti di regressione, per descrivere la relazione di dipendenza; nel misurare il
grado di dipendenza lineare mediante la bontà dell’adattamento R2.
L’analisi viene completata con l’Analisi dei residui per verificare l’adeguatezza della
retta a descrivere la relazione di dipendenza di Y da X.
68)Quando due caratteri si dicono concordanti o discordanti? Fare un
esempio di caratteri concordanti o discordanti.
Due caratteri quantitativi X e Y si dicono concordanti o correlati positivamente se
valori alti di un carattere tendono ad associarsi valori alti dell’altro carattere e
viceversa.
Due caratteri quantitativi X e Y si dicono discordanti o correlati negativamente se a
valori alti di un carattere tendono ad associarsi valori bassi dell’altro e viceversa. La
concordanza è quindi la tendenza di due caratteri a variare nella stessa direzione
mentre la discordanza è la tendenza a variare in direzioni opposte.

69)Cosa vuol dire interpolare una serie storica?


Lo scopo è quello di capire l’andamento dei valori della serie, qui il tempo è la
variabile indipendente mentre quella dipendente è l’intensità del fenomeno.
70)Come si calcola e come si interpreta l’indice di correlazione lineare di
Bravais-Pearson

L’indice si interpreta così: r = -1 perfetta correlazione lineare negativa


-1 < r < 0 correlazione negativa
r = 0 indifferenza o incorrelazione
0 < r < +1 correlazione positiva
r = +1 perfetta correlazione lineare positiva
71)Fare un esempio in cui l’indice di correlazione lineare di
Bravais-Pearson vale 1, -1 oppure 0
se r = 0 la retta di regressione di una variabile in funzione dell’altra è parallela
all’asse delle ascisse
se r = +1 i punti della nuvola sono allineati lungo una retta con pendenza positiva
se r = -1 i punti della nuvola sono allineati lungo una retta con pendenza negativa

72)Cosa sono i ranghi?


È detto rango il posto che occupa un termine nella graduatoria dei termini e si indica
con il simbolo xPi, tali ranghi vengono assegnati rispetto al carattere X e Y ottenendo
una nuova distribuzione.
73)Come si calcola e cosa misura l’indice di cograduazione di Spearman?
La correlazione per ranghi di Spearman è una tecnica statistica non parametrica
utilizzata per valutare la relazione tra due variabili quantitative o qualitative ordinali.

74)Che legame c’è tra gli indici di Bravais-Pearson e Spearman?


Indice di Bravais- Pearson e Spearman sono entrambi indici che danno luogo a
risultati adimensionali e puri e hanno entrambi come intervallo -1 e 1. L'indice r è
influenzato dai valori estremi mentre l'indice c no per questo c è preferibile a r
quando sono presenti valori anomali o estremi
75)Cosa si intende per correlazione spuria?
2 variabili sono connesse in modo spurio quando l’unica ragione della loro
connessione è che entrambe sono influenzate da altre variabili, un esempio di tale
connessione sono i danni di un incendio che aumentano con l’aumentare del numero
dei pompieri, ma non sono di fatto i pompieri a provocare i danni ma l’entità
dell’incendio il quale richiede un maggior numero di pompieri per essere spento.

CALCOLO DELLE PROBABILITA’


76)Che cos’è un esperimento casuale e cosa si intende per spazio
campionario dell’esperimento? Come si definisce il concetto di
probabilità?
Si chiama prova o esperimento casuale qualsiasi processo o avvenimento provocato
dall'uomo o osservato in natura di cui si conoscono i possibili esiti o risultati, ma non
quale esattamente si verificherà.
Si chiama spazio campionario o universo degli eventi elementari di un esperimento
casuale l’insieme degli eventi elementari.
Definizione di probabilità: Probabilità di un evento A dello spazio campionario SE
è data dal rapporto tra il numero degli eventi elementari favorevoli ed il numero di
quelli possibili, sotto l’ipotesi che siano egualmente possibili.
77)Cosa si intende per definizione assiomatica di probabilità?
Gli assiomi che definiscono la probabilità sono i seguenti.
1) Ad ogni evento casuale E dello spazio degli eventi è associato un numero non
negativo P(E) detto probabilità dell'evento E.
2) All'evento U, rappresentato da un insieme che contiene tutto lo spazio degli
eventi,è associata una probabilità P(U) = 1.

78)Enunciare la legge della somma e la legge del prodotto tra eventi.


79)Dire quando due eventi sono indipendenti.
Due eventi A e B si dicono indipendenti se la probabilità della loro intersezione è pari
al prodotto delle rispettive probabilità, ovvero Pr(A ∩ B) = Pr( A ) Pr( B )
80)Che cos’è una variabile casuale e cosa si intende per distribuzione di
probabilità della variabile casuale.
Si chiama variabile casuale la variabile numerica che si ottiene stabilendo una
qualsiasi regola che faccia corrispondere ad ogni evento elementare di un
esperimento casuale uno ed un solo numero reale.
Una distribuzione di probabilità è l’equivalente di un distribuzione di frequenza
relativa riferita agli eventi che possono verificarsi a seguito di un esperimento
casuale.
81)Come si calcolano il valore atteso e la deviazione standard di una
variabile casuale e come si interpretano i valori corrispondenti?

82)Quando due variabili casuali si dicono indipendenti e cosa significa


questo?
Due variabili casuali X e Y si dicono indipendenti se per una qualunque
coppia di valori possibili x e y si verifica sempre che Pr(Y= y X=x ) = Pr(Y= y )
Pr( X= x )
83)Quando una variabile casuale continua si dice distribuita normalmente.
Com’è fatta la sua distribuzione di probabilità?
Le variabili casuali continue sono quelle che possono assumere un insieme continuo
di valori, basta osservarle dai grafici, assumono una quantità non numerabile ma
continua di valori, che cioè possono assumere tutti i valori intermedi di un intervallo
(ad esempio: il peso o l'altezza).

84)Come si calcola la probabilità che una variabile casuale normale assuma


un valore in un dato intervallo?
ma si dovrebbe ricorrere alla stima intervallare (formula) per vedere in che intervallo
puó ricadere il valore della variabile
85)Che cos’è una combinazione lineare di variabili casuali?
Una combinazione lineare di due variabili casuali indipendenti ha varianza uguale
alla combinazione lineare delle rispettive varianze, con coefficienti pari ai quadrati
dei coefficienti rispettivi 1.

86)Quali sono le proprietà di una combinazione lineare di variabili casuali


indipendenti?

87)Cosa dice il teorema del limite centrale e perché è così importante?


Il teorema limite centrale afferma che la distribuzione della somma di un numero
elevato di variabili casuali indipendenti e identicamente distribuite tende distribuirsi
normalmente, indipendentemente dalla distribuzione delle singole variabili. Per le
distribuzioni di probabilità della media del campione utilizziamo il teorema del limite
centrale secondo il quale al crescere di n tale distribuzione di probabilità si
approssima sempre di più a quella normale
88)Che cos’è una variabile casuale dicotoma? Quali sono i valori del valore
atteso e della deviazione standard?
Quella con sole due alternative. È detto valore atteso di una variabile casuale discreta la
media aritmetica dei valori possibili ponderati con le rispettive probabilità; questo valore è
indicato con il simbolo E(X) e si calcola tramite la somma dei prodotti dei valori possibili della
variabile casuale per le rispettive probabilità

89)Quali sono le distribuzioni di probabilità della somma e della media di


un numero sufficientemente grande di variabili casuali dicotome?
La distribuzione binomiale

INFERENZA STATISTICA
90)Quali sono i vantaggi del campionamento rispetto al censimento?
La rilevazione e l’elaborazione di informazioni comporta un costo, è quindi
necessario quando si vuole conoscere un determinato fenomeno collettivo bisogna
farlo con il minor numero di informazioni possibili; ciò si attua limitando il numero di
caratteri e il numero dei casi da osservare, per questa seconda operazione si utilizza
il campionamento ovvero la selezione di un sottoinsieme di unità della popolazione
su cui rilevare i dati.

Che il campione è ogni sottoinsieme di unità della popolazione oggetto di studio,


selezionate allo scopo di trarne conoscenza sull’intera popolazione
È detto campione ogni sottoinsieme di unità della popolazione oggetto di studio,
selezionate allo scopo di trarne conoscenza sull’intera popolazione.
Gli aspetti positivi di una rilevazione campionaria, detta parziale, rispetto ad una
rilevazione totale detta anche censuaria sono tre e sono:
● Costi contenuti: in generale le indagini economico sociali sono condotte su
persone, famiglie e imprese le cui popolazioni hanno milioni di unità
richiedendo costi altissimi per indagini totali, si userà quindi una rilevazione
censuaria solo per piccole popolazioni o per necessità dello stato di
censimenti che vengono fatti ogni 10 anni, per tutti gli altri casi si usa una
rilevazione campionaria.
● Tempestività: è molto più semplice elaborare i dati di 2000 famiglie piuttosto
che quelli di milioni di famiglie, inoltre la tempestività dell’informazione che si
ricava da un'indagine è cruciale per la sua utilità.
● Qualità del dato: ogni rilevazione comporta degli errori fatti nelle varie fasi
dell’indagine, per ridurli al minimo ci vuole quindi molta scrupolosità e
competenza in queste fasi, inoltre minori sono i dati maggiore è l’attenzione
che si può riservare all’elaborazione e minori saranno gli errori; un'indagine
campionaria consente di rilevare dati di qualità superiore al punto da poter
ricavare informazioni aggregate più corrispondenti al vero rispetto ad un
censimento, permettendo così di investire più risorse nella raccolta e
trattamento dei dati.

L'operazione di campionamento ha però il limite di non essere utilizzabile per


ottenere informazioni su sotto-collettivi al contrario dei censimenti che danno risultati
attendibili per qualsiasi sottocollettivo; tutto ciò è riferito al caso delle popolazioni
finite le quali sono realmente esistenti.

91)Che cos’è e come si estrae un campione casuale semplice?


Il campionamento casuale semplice garantisce ad ogni unità della popolazione la
stessa probabilità di entrare a far parte della popolazione e i campioni casuali
semplici hanno la stessa probabilità di essere estratti; in ciò il rapporto tra la
dimensione del campione e quella della popolazione è chiamato frazione di
campionamento.

Consideriamo una popolazione di N unità supponendo di assegnare ad ognuna di


esse un numero intero progressivo da 1 a N, prendendo un recipiente contenente N
palline numerate da 1 a N otteniamo un campione casuale semplice di n unità
estraendo n palline i cui numeri indicheranno le unità della popolazione da inserire
nel campione; se dopo ogni estrazione la pallina viene reinserita nel recipiente una
stessa unità può essere estratta più volte e si parlerà di campionamento casuale
semplice con ripetizione, se al contrario la pallina viene reinserita nel recipiente si
avrà un campionamento casuale semplice senza ripetizione.
92)Descrivere le proprietà delle variabili casuali “osservazioni
campionarie”. Cosa sono le statistiche campionarie?
Consideriamo ora un campione casuale semplice con ripetizione di dimensione n e
siano X1, X2, ..., Xi, ..., Xn le variabili casuali che descrivono il risultato
dell’osservazione del carattere X nelle estrazioni; i valori che assumono queste
variabili casuali sono chiamati osservazioni o dati campionari, successivamente
useremo il termine osservazioni per identificare sia le variabili casuali che i valori che
assumono rispetto ad uno specifico campione.

La seguente formula è detta media campionaria in quanto è la media aritmetica delle


osservazioni

93)Cosa si intende per distribuzione campionaria di una statistica?


La distribuzione campionaria di una statistica basata su n osservazioni è la
distribuzione di frequenza dei valori che la statistica assume. Tale distribuzione è
generata teoricamente prendendo infiniti campioni di dimensione n e calcolando i
valori della statistica per ogni campione.
94)Qual é la distribuzione campionaria della media del campione?
Considerando gli N campioni estraibili dalla popolazione, per ognuno si può
calcolare la media campionaria che varia da campione a campione. L'insieme delle
medie campionarie di tutti i campioni possibili della popolazione è detta distribuzione
della media campionaria.

95)Qual è lo scopo dell’inferenza statistica? Di cosa si occupa?


L’inferenza statistica risolve il problema inverso rispetto al calcolo delle probabilità
cioè dalle caratteristiche del campione si risale a quelle della popolazione (processo
induttivo),si occupa di:
- stima puntuale dei parametri
- stime per intervallo
- verifica delle ipotesi
perchè la popolazione è tyroppo grande quindi si sceglie un campione
casuale

96)Cosa si intende per processo deduttivo e induttivo, oppure per


problema diretto e inverso?
Il calcolo delle probabilità risolve i problemi diretti: dalle caratteristiche della
popolazione si deduce il comportamento dei campioni (processo deduttivo).
L’inferenza statistica risolve il problema inverso: dalle caratteristiche del campione si
risale a quelle della popolazione (processo induttivo).
97)Quali sono le tre principali procedure inferenziali?
Procedure inferenziali: 1)stima puntuale dei parametri 2) stima per intervallo 3)
verifica delle ipotesi.
98)Cosa si intende per parametri della popolazione? Fare degli esempi di
parametri.
Si chiama parametro della popolazione ogni indice statistico calcolato sulla
popolazione. Sia allora θ il parametro (per esempio µ , π , σ2 ) della popolazione.
99)Che cos’è uno stimatore?
Si chiama stimatore di un parametro incognito della popolazione ogni statistica
campionaria utilizzata per assegnare un valore numerico ad esso. Sia θ ˆ = f (X1 , X2
, ... , Xn ) uno stimatore di θ.
100) Quali sono le proprietà che uno stimatore deve avere?
● Non distorsione o correttezza →Si chiama distorsione dello stimatore di un
parametro la differenza tra il suo valore atteso ed il parametro.
● Efficienza → L’efficienza di uno stimatore è inversamente proporzionale al
suo errore standard. Si dice efficiente quello stimatore di un parametro che a
parità di altre condizioni ha un errore standard non superiore a quello di un
qualunque altro stimatore corretto alternativo, quale che sia il valore del
parametro.
● Consistenza. Assicura che al crescere della dimensione del campione
casuale lo stimatore tende ad assumere valori sempre più vicini al parametro
che intende stimare, sino a coincidere con esso nei campioni di ampiezza
infinita.

101) In cosa consiste la stima puntuale di un parametro?


Per STIMA PUNTUALE DEI PARAMETRI s'intende l'insieme dei metodi inferenziali
che permettono di attribuire un valore ad un parametro della popolazione, utilizzando
i dati di un campione casuale osservato (x1, x2,…,xn) ed elaborandoli.
102) In cosa consiste la stima per intervallo di un parametro?
Una STIMA INTERVALLARE è il risultato di un procedimento che, attraverso le
informazione tratte dal campione osservato, genera un intervallo di valori che, con
un dato grado di fiducia, conterrà il parametro da stimare.
NO CON CERTO GRADO DI FIDUCIA CONTIAMO CHE SIA CONTENUTO
(CREDO)
FIDUCIA PERCHè SI PUò TROVARE UN TERMINE DI ERRORE
103) Da cosa dipende l’ampiezza dell’intervallo di confidenza?
L'ampiezza dell'intervallo dipende dalla dimensione campionaria n, al crescere della
quale l'ampiezza si riduce. CHE IN QUEL 95 NON C’è ERRPRE,
ALLORA L’ERRORE SI TROVA FUORI ALLA ZONA DI CONFIDENZA (CREDO)
104) Che cos’è il livello di fiducia di un intervallo di confidenza?
Il concetto di intervallo di confidenza (IC) viene introdotto quando si esegue una
misura o si calcola un rapporto fra misure non sull'intera popolazione, ma su un
campione estratto da quella stessa popolazione. E SI TROVA COSI Puoi trovare il
margine d'errore utilizzando la formula: Za/2 * σ/√(n). Za/2 = coefficiente di confidenza,
dove a = livello di confidenza, σ = deviazione standard, e n = dimensione del
campione. È un altro modo per dire che devi moltiplicare il valore critico per l'errore
standard.
105) Cosa si intende per verifica delle ipotesi statistiche?
Nella ricerca bisogna a volte decidere se un’affermazione è verosimile o va rifiutata,
un’informazione del genere è detta ipotesi statistica e per decidere se è verosimile o
va rifiutata di estrae un campione dalla popolazione e si verificano i risultati sono
concordanti con l’ipotesi o sono in contraddizione.
106) Come si imposta una verifica di ipotesi?
La verifica delle ipotesi (test statistico) è un procedimento con il quale si decide, alla
luce di un campione, se rifiutare o meno H0 in favore di H1. Si tratta di dividere lo
spazio campionario (Ω) in due sottoinsiemi: zona di accettazione (A) e zona di rifiuto
(R).
107) Che cos’è una statistica test?
È detto test statistico ogni regola di decisione con cui sulla base dei dati campionari,
si decide se rifiutare o accettare l’ipotesi nulla; per costruirlo dobbiamo partire dal
valore che ha la frequenza relativa dei successi nel campione, ottenere un valore di
F uguale o superiore a TOT confermerebbe l’ipotesi nulla mentre un valore inferiore
a TOT farebbe dubitare della veridicità dell’ipotesi nulla.
108) Cosa si intende per errore di prima e seconda specie?
Errore di prima specie: rifiutare H0 quando è vera.
Errore di seconda specie: accettare H0 quando è falsa
109) Che cos’è il livello di significatività di un test?
Si chiama livello di significatività di un test la probabilità dell’errore di prima specie
110) Quando un test si dice significativo?
Quando si rifiuta l’ipotesi nulla con un livello di significatività del α% si usa dire che il
test è significativo al α % .
111) Cosa in intende per significatività ex-post?
La significatività a posteriori (detta p - value) è il valore di α che corrisponde ad una
soglia critica uguale al valore assunto dalla statistica test.
112) Come si esegue la stima puntuale e per intervallo di una frequenza.
Consideriamo una popolazione la cui frequenza relativa di un attributo sia π, dove
per attributo intendiamo una prefissata modalità di un carattere qualitativo; la
quantità π è chiamata parametro della popolazione dato che ne descrive un aspetto
specifico, inoltre questa quantità può essere conosciuta solo attraverso
l’osservazione del campione; il problema che volgiamo risolvere è quello di
quantificare tale valore attraverso i dati forniti da un campione casuale estratto dalla
popolazione, ovvero dobbiamo stimare il valore di π la cui attribuzione di un unico
valore numerico è detta stima puntuale del parametro, quando invece attribuiamo un
intervallo di valori sarà una stima per intervallo. Per la stima puntuale bisogna prima
scegliere una statistica campionaria il cui valore sarà attribuito a π, a questo
proposito la frequenza relativa del campione estratto, se è sufficientemente grande
può essere

113) Come si esegue la verifica dell’ipotesi su una frequenza.


Nella ricerca bisogna a volte decidere se un’affermazione è verosimile o va rifiutata,
un’informazione del genere è detta ipotesi statistica e per decidere se è verosimile o
va rifiutata di estrae un campione dalla popolazione e si verificano i risultati sono
concordanti con l’ipotesi o sono in contraddizione; per capire facciamo un esempio:

un centro di assistenza per tossicodipendenti in condizioni normali assicura un tasso


di soggetti disintossicati di almeno il 60%. Dall’archivio vengono estratti casualmente
125 fascicoli relativi ad altrettanti casi seguiti nel corso dell’ultimo anno e dall’esame
di essi risulta che la percentuale dei successi è del 55%. Si può concludere che il
centro di assistenza sta lavorando al di sotto della norma? Indicando con π la
frequenza relativa dei casi trattati con successo si vuole verificare.

In questo esempio l’ipotesi statistica che ci interessa è la percentuale dei successi


nei casi trattati nell’ultimo anno non sia inferiore al 60% dato che è quello che ci si
aspetta dal centro in base ai progetti; il dato campionario però evidenzia uno
scostamento negativo del 5% mettendo così in dubbio l’ipotesi fatta, dobbiamo
quindi capire se 55% è causato dalla variabilità campionaria o se è indice di una
situazione fuori norma.

114) Come si stabilisce la dimensione del campione per fare inferenza su


una frequenza.
La dimensione dipende dal grado di precisione che desideriamo per le stime da
calcolare: per stime puntuali va specificato l’errore standard desiderato, per stime
per intervallo bisogna stabilire l’ampiezza accettabile.

115) Come si esegue la verifica dell’ipotesi secondo cui la differenza tra le


frequenze di uno stesso attributo in due diverse popolazioni è zero.
Si deve fare la verifica delle ipotesi, cioè poniamo all'inizio-
Ipotesi nulla: pigreco1-pigreco2= 0
Ipotesi alternativa: pigreco1-pigreco2 diversa da zero

116) Come si stabilisce la dimensione del campione per fare inferenza su


una media.
La media campionaria è semplicemente la media delle variabili del campione: Mn = (
X 1 + X 2 + ··· + Xn ) / n . La media campionaria è una funzione a valori reali di un
campione casuale, ed è pertanto una statistica.

Potrebbero piacerti anche