Statistica Riassunto

STATISTICA
LA STATISTICA DESCRITTIVA
Cosa è la statistica?
La statistica è la scienza che permette di raccogliere ed analizzare informazioni per giungere a
diverse conclusioni.
Essa si occupa di:
- Progettare (come vanno raccolti i dati, ossia in maniera totale o parziale? Diretta o
indiretta?);
- Descrivere (sintetizzarli, cioè elaborare i dati che poi vanno rappresentati con grafici);
- Inferire (formulare previsioni). -> dunque, nel processo statistico è necessario identificare
l’oggetto della ricerca, raccogliere dati, descriverli e fare inferenza.
L’analisi statistica si avvale del metodo descrittivo e di quello inferenziale, pertanto la statistica
descrittiva descrive i dati, mentre l’inferenza statistica si concentra sui risultati ottenuti da un
campione, per poi estenderli sulla popolazione.
L’unità statista è quell’elemento di base della popolazione su cui si vuole effettuare la rivelazione e
su di essa si osservano uno o più caratteri.
Il carattere o variabile è quella caratteristica dell’oggetto di studio (es. età, altezza se si studiano gli
studenti).
La modalità è il numero (per caratteri quantitativi) o l’attributo (per caratteri qualitativi) che l’unità
manifesta.
La frequenza è il numero di volte che ciascuna modalità si presenta.
Le variabili per l’appunto possono essere qualitative o quantitative.
- Le qualitative si distinguono in nominali e ordinali; quelle ordinali sono quelle che
presentano un ordine che può essere crescente o decrescente, mentre le nominali sono
quelle che non lo seguono, pertanto risultano sconnesse fra di loro. Fra queste è possibile
ritrovare caratteri dicotomici, cioè quelle che rispondono solo ad una domanda con due
risposte: si o no.
- Le quantitative si distinguono in continue (non numerabile), dove per l’appunto è possibile
fare una media (ad esempio queste persone in media vanno tre volte a settimana a lezione
(peso e altezza continui e se misuriamo è continua), o discrete (numerabile) quando il
valore cambia sempre e può essere sommato o moltiplicato, dunque può variare (es. i
gradi).
Una variabile discreta è una variabile quantitativa le cui modalità assumono un numero finito o
un'infinità numerabile di valori. Con il termine "numerabile" significa che i valori risultano da
un conteggio, come 0, 1, 2, 3, e così via. Una variabile continua è una variabile quantitativa le cui
modalità assumono un numero infinito di possibili valori che non sono numerabili.
Queste quantitative possono svilupparsi su scala ad intervalli, di rapporto o non rapporto:
1. Intervalli dipende da una distanza fra i valori, pertanto dove vi è addizione o
sottrazione;
2. Di rapporto si basano sulla moltiplicazione e divisione;
3. Di non rapporto sono quelle che hanno valori non collegati fra loro, di origine dunque
non convenzionale, come nel caso della temperatura -> cui il momento di origine è 0°,
ma se andiamo in F° abbiamo un altro valore convenzionale.
La statistica è il descrittore di un campione, mentre il parametro è il descrittore di una

popolazione.
Chi produce le statistiche?
La rilevazione può essere diretta (quando siamo noi) o indiretta quando ci rifacciamo a dei dati,
dati dall’amministrazione pubblica. Ma chi produce le statistiche? Il Sistema Statistico Nazionale,
SISTAN, viene istituito nel 1989 e altro non è che una rete di circa diecimila operatori pubblici e
privati, operanti in circa 3500 uffici, preposti, in base alle norme vigenti, a fornire le statistiche
ufficiali nazionali. La sua complessa articolazione richiede un’importante attività di coordinamento
dell’Istat che si avvale del Comitato di indirizzo e coordinamento dell’informazione statistica
(Comstat), organo collegiale, presieduto dal Presidente dell’Istat.
il coordinamento del Sistan è affidato all’Istituto nazionale di statistica (Istat), posto sotto la
vigilanza del Presidente del Consiglio, a cui spettano i seguenti compiti:
• Coordinare il Sistema Statistico Nazionale;
• Predisporre il Programma Statistico Nazionale (PSN);
• Predisporre nomenclature e metodologie ufficiali e vincolanti; • Diffondere i dati delle indagini
effettuate;
• Mantenere rapporti con enti statistici esteri ed internazionali.
Altri organismi ed enti; oltre all’Istat fanno parte del Sistan numerosi altri organismi ed enti:
• Amministrazioni centrali dello stato (Presidenza del Consiglio dei Ministri.
• Amministrazioni, enti pubblici e soggetti privati (CNR, CONI).
• Regioni.
• Province.
• Comuni.
• Camere di Commercio.
Altri enti pubblici di informazione statistica sono:
• ISAE: Istituto di Studi e Analisi Economica (www.isae.it)
• ISFOL: Istituto per lo Sviluppo della Formazione professionale dei Lavoratori (www.isfol.it)
• INEA: Istituto Nazionale di Economia Agraria (www.inea.it)
QUESTO TUTTO IN ITALIA.
Il sistema statistico europeo -> nell’Unione Europea, le statistiche ufficiali sono affidate
all’EUROSTAT, il cui compito è raccogliere ed elaborare i dati statistici riguardanti i paesi
comunitari e i principali partners commerciali. L’ufficio statistico dell’Unione Europea svolge, più
che funzioni di produzione, compiti di coordinamento e di definizione di standard comuni fra gli
uffici statistici dei paesi dell’Unione -> NON ELABORA.
Alcune fonti internazionali.
Fra i produttori di statistiche a livello internazionale ricordiamo:
• L’Organizzazione per la cooperazione e lo sviluppo economico (OCSE).
• L’Organizzazione delle Nazioni Unite (ONU) e gli enti ad esso collegati.
• L’Organizzazione per l’alimentazione e l’agricoltura (FAO).
• L’Ufficio Internazionale del Lavoro (BIT) per le statistiche del lavoro.
• L’Organizzazione Mondiale della Sanità (OMS) per le statistiche sanitarie.
• L’Organizzazione delle Nazioni Unite per l’educazione, la scienza e la cultura (UNESCO) per le
statistiche dell’istruzione.
Indagini internazionali periodiche su orientamenti valorali, atteggiamenti, opinione pubblica, ecc.
comprendono l’Eurobarometro e le ricerche condotte nell’ambito dell’International Social Survey
Program, le European Values Surveys e le World Values Surveys.
Dunque, per ottenere i dati possiamo rifarci ai censimenti, fonti esistenti, studi osservazionali o
disegno degli esprimenti.
Il campione statistico
Quando facciamo degli studi prendiamo un campione di una popolazione, proprio perché per
determinare le caratteristiche fondamentali di una popolazione statistica non è sempre necessario
analizzare tutta la popolazione, ma risulta sufficiente esaminare un CAMPIONE STATISTICO.
Il campione statistico è una parte di tutte le unità statistiche costituenti il collettivo o
popolazione con la caratteristica di dare un’immagine ridotta ma fedele delle caratteristiche del
collettivo.
Esistente un piano di campionamento che deve: definire la popolazione come obiettivo nella
rilevazione statistica; definire le unità campionarie; stabilire la dimensione del campione; scegliere
il campione; formulare un giudizio.
Per il campionamento probabilistico abbiamo:
- Campionamento casuale semplice -> se si vuole esaminare una popolazione composta da N
unità dalla quale si debba estrarre un campione di n unità distinte, il campione casuale
semplice è la tecnica che attribuisce la stessa probabilità di selezione a ogni insieme n unità
distinte della popolazione. La probabilità che ogni unità della popolazione ha di essere
scelta alla prima estrazione è 1/N. la selezione del campione può essere fatta in due modi:
• con reimmissione -> reinseriamo la pallina estratta;
• senza reimmissione -> togliamo la pallina estratta.
Nel campionamento con reimmissione ciascun elemento della popolazione è disponibile a
ogni estrazione e a ogni estrazione ogni unità ha sempre la probabilità 1/N di essere
estratta ES: durante una lotteria, un’urna contenente N biglietti con una numerazione
progressiva. Gli N biglietti sono venduti a K di individui. Alla prima estrazione si estrae il
numero 10 che dopo la registrazione viene reimmesso nell’urna. Alla seconda estrazione il
numero 10 può essere nuovamente estratto con probabilità 1/N. Ed il processo si ripete
nuovamente. Nel campionamento semplice senza reimmissione, un’unità, una volta
estratta, non viene rimessa nella popolazione. Come nell’esempio precedente, la
probabilità che il numero 10 venga estratto alla prima estrazione è 1/N, alla successiva
estrazione se il numero 10 è stato estratto non sarà più presente nella popolazione, e la
probabilità che un’altra unità venga estratta è 1/N-1.
- Campionamento stratificato -> la popolazione viene suddivisa in sottopopolazioni dette
“strati”, sulla base di alcune variabili chiave, per lo studio del fenomeno collettivo oggetto
di osservazione. Il campione si forma estraendo a caso un certo numero di unità da ogni
strato, che è al suo interno omogeneo.
ES. Se ci riferisce ad una popolazione costituita da 1000 famiglie, di cui sia nota la
distribuzione secondo le classi di reddito mensile e ci si prefigge di voler costruire un
campione di 50 unità, è possibile tener conto delle particolari caratteristiche del collettivo
di partenza per realizzare una rilevazione più efficiente di quella che si otterrebbe con una
scelta casuale semplice.
Il campionamento stratificato può avere:
• Frazione di campionamento costante;
• Frazione di campionamento variabile -> Nel primo caso occorre stabilire la numerosità
del campione per ogni strato con un criterio, scegliendo ad esempio la proporzione
sull’intera popolazione dello strato stesso o calcolando la frazione di campionamento n/N
costante per ogni strato, in modo che ciascuno di essi abbia lo stesso peso nel campione.
Nell’esempio abbiamo dei limiti inferiori e superiori, e vediamo che c’è omogeneità fra le
classi, tranne che per l’ultima, dunque, possiamo decidere se usare un campionamento
proporzionale:
n (numerosità): il totale delle frequenze, o usare un campionamento stratificato non
proporzionale: N (il campione che abbiam deciso di estrarre): il numero degli strati (nel
caso dell’esempio 5), per estrarre sempre lo stesso numero di unità.
Dunque quando ci sono strati non omogenei, in maniera tale che queste famiglie siano
considerate in maniera minore utilizzando quello proporzionale, con quello non andremo a
rappresentare gli strati tutti nella stessa maniera.
- Campionamento sistematico -> in questo tipo di campionamento si estrae a sorte soltanto
la prima unità da intervistare e poi, dopo aver fissato la numerosità campionaria N, si
intervista un individuo ogni intervallo k (k=N(campione popolazione)/n) che prende il nome
di passo di estrazione. In questo caso la popolazione deve essere finita e quindi si deve
disporre di una lista di campionamento.
ES. Immaginiamo di condurre un’indagine sugli hotel di Bari. La popolazione degli hotel è
140 ed il campione deve essere pari a 20. Il passo di campionamento sarà pari
k=N/n=140/20=7, quindi una volta selezionato il primo hotel da far entrare nel campione,
gli altri 19 hotel saranno selezionati dalla lista, con un passo pari a 7. Questo serve per non
prendere a caso elementi
- Campionamento a grappoli -> è utile quando non si dispone di liste complete delle
popolazioni di interesse. Per la selezione del campione la popolazione deve essere
suddivisa in un gran numero di grappoli come, ad esempio, i diversi isolati di una città. Si
seleziona poi un campione casuale di questi grappoli e si impiegano nello studio tutti i
soggetti contenuti nel grappolo.
Differenze: Un campione stratificato prende in considerazione per l’analisi ogni strato (gli
strati sono i differenti gruppi che vogliamo confrontare rispetto ad alcune loro
caratteristiche), mentre il campione a grappoli prende in considerazione un campione di
grappoli piuttosto che la loro totalità (i grappoli sono solo il mezzo che permette di
identificare più agevolmente gruppi di soggetti).
- Campionamento a più stadi -> questo è una via di mezzo ed è una combinazione degli altri
metodi finora descritti. Consideriamo le sezioni elettorali come grappoli e selezioniamo un
campione di una certa numerosità degli stessi grappoli.
ES. Per ciascuna sezione elettorale selezionata, consideriamo gli isolati residenziali come
grappoli e selezioniamo a caso un campione degli stessi. Per ciascun isolato selezionato,
selezioniamo casualmente in maniera sistematica un appartamento ogni dieci. In ciascun
appartamento selezionato, selezioniamo a caso un adulto e includiamo lo stesso nel nostro
campione. È una selezione, dunque la creazione di più grappoli.
Per il campionamento non-probabilistico abbiamo:
- Campionamento Accidentale -> quando non si definiscono i criteri per la selezione delle
unità da includere nel campione e si è costretti ad intervistare le persone che capitano si
sta costruendo un campione accidentale o a casaccio, per cui non è possibile applicare
tecniche statistiche induttive ed i risultati sono inaffidabili. I vantaggi sono risparmio di
tempo e di denaro.
- Campionamento per Quote -> è molto simile al campionamento stratificato proporzionale
in quanto il campione riflette la proporzione della popolazione complessiva. La principale
differenza è che la scelta delle persone da intervistare non è fatta in modo casuale, ma si
lascia agli intervistatori la libertà di scelta delle persone da intervistare in funzione delle
quote stabilite.
- Campionamento a Valanga -> consiste nell’individuare un primo gruppo di persone da
intervistare che possiedono le caratteristiche cercate ed infine questi soggetti individuano
altri soggetti con le stesse caratteristiche. È una tecnica di campionamento utile quando è
difficile individuare le unità di rilevazione. Ad esempio, pensiamo ad un’indagine sui
tossicodipendenti: il team di ricerca difficilmente troverà una lista di nomi da intervistare
per cui è impossibile applicare tecniche di campionamento probabilistico. Se il ricercatore
trova un tossicodipendente quest’ultimo ne presenterà altri. Questa tecnica si applica ai
fenomeni rari e prende il nome dal fatto che ad ogni stadio il campione coinvolge nuove
unità;
ATTENZIONE: la persona verrà inserita nel campionamento, ma in quello dei testimoni no.
- Campionamento tramite Testimoni Privilegiati -> consente di far ricorso a persone che, per
la particolare attività che svolgono, sono a conoscenza di informazioni e notizie su specifici
fenomeni; pertanto il loro coinvolgimento è fondamentale per stimare la dimensione e le
caratteristiche del fenomeno stesso.
Possiamo però avere degli errori nel campionamento quando i risultati di un campione non
sono rappresentativi della popolazione. Questo può essere dovuto ad un errore di
campionamento (sotto copertura-> quando la proporzione di un segmento della popolazione è
più bassa nel campione che nella popolazione; lista incompleta), nel momento in cui le
tecniche usate per selezionare gli individui da includere nel campione tendono a favorire una
parte della popolazione piuttosto che un’altra; errore legato ai non rispondenti (persone che
non desiderano rispondere all’indagine o che l’intervistatore non riesce a contattare); errore
legato ai rispondenti – magari le risposte sull’indagine non riflettano i veri sentimenti degli
intervistati - (errore intervistatore o nel questionario).
La variabile statistica
L’effetto dell’operazione di determinazione della modalità con cui ognuno dei caratteri si presenta
in ciascuna unità del collettivo è la distribuzione del collettivo secondo i caratteri considerati.
Distribuzione perché mediante essa si indica come le modalità dei caratteri si distribuiscono nelle
unità del collettivo -> modalità con cui si presenta ogni unità del collettivo
ES. distribuzione (in base al voto).
Una volta decisa l’unità statistica dobbiamo capire quali sono le variabili statistiche da prendere,
quindi quali quantitative o qualitative.
ES. Devo partire dalla domanda? Che voto avete preso all’esame di statistica? Poi costruisco la
tabella che può diventare una tabella di frequenza.
Esempio di variabile statistica
Consideriamo come si sono distribuiti secondo il voto dell’esame di statistica 28 studenti del 1°
anno del corso di laurea triennale in Scienze della Comunicazione.
A questo punto introduciamo la frequenza (assoluta) che rappresenta il numero delle volte in cui
una modalità si presenta all’interno della variabile statistica -> inseriamo i vari studenti e i voti che
abbiamo preso, e poi si inserisce la frequenza nel senso che da una parte inseriamo i voti in ordine
crescente e dall’altra parte indichiamo quanti studenti hanno preso quel voto, es. 18 = 1.
In una tabella: xi è il voto preso in considerazione (es. x1(18), x2(19) etc., fino a xs(ultimo voto)),
mentre ni è il numero delle frequenze assolute (quante volte si presenta un determinato voto).
Per ottenere le frequenze relative – la proporzione di osservazioni appartenenti a una determinata
categoria rispetto al totale delle osservazioni - (fi) facciamo il numero delle frequenze assolute
fratto il numero totale N -> ni/N (es. xi=20; ni=10; N=100 -> 10/100= 0,10); dopodichè per trovare
le frequenze percentuali, bi, basta fare ni/N x 100= 0,10 x 100 = 10 -> LA FREQUENZA RELATIVA È
LA PROPORZIONE.
Questo è però riguarda una variabile statistica discreta. E se fosse continua?
xi-xi+1 è la classe di modalità ni la frequenza come sempre, ed in questo caso le frequenze relative
yi sono date sempre da ni/N. Ma come si calcola il valore centrale? X’i= xi+xi+1/2. Dunque avremo:
es. xi= 18-23, ni=20, N=70 -> 20/70= 0,28; v.c= 18+23/2=20,5
Le medie
Dopo la rilevazione dei dati (totale o campionaria, diretta o indiretta – con ampiezza, spese e
strumenti), dobbiamo valutare i nostri dati -> Eseguita la rilevazione statistica si passa
all’elaborazione dei dati, seconda fase di un’indagine statistica. Fra le tante elaborazioni finalizzate
alla sintesi delle informazioni contenute nei dati, le misure di tendenza centrale più usate sono la
media aritmetica, la mediana e la moda.
Le medie algebriche sono quelle medie che prendono in considerazione tutti i valori della
distribuzione.
- Media aritmetica;
- Media geometrica;
- Media armonica;
- Media di potenza;
- Media quadratica.
La media aritmetica semplice è data dal rapporto tra la somma delle singole modalità e il numero
complessivo della popolazione, mentre la media aritmetica ponderata si ottiene dal rapporto tra il
prodotto delle singole modalità con le rispettive frequenze ed il numero complessivo della
popolazione.
ES. xi=24,25,26,27; ni(frequenze assolute)=10,13,18,20(tot 61) -> prodotto xi x ni= 24x10=240;
25x13=325 etc. TOT=1573
Ma con variabili continue?
ES.
10-20
20-30
30-40
40-50
Ni= 10,20,30,10(tot 70)
v.c= xi= xi+xi+1/2= 10+20/2=15 -> ora questo è possibile moltiplicarlo con il n. delle frequenze ni ->
15 x 10= 150
Quali sono le proprietà della media aritmetica?
1. La somma algebrica degli scarti è uguale a zero -> ipotizziamo media tra 26,27,28=27 -> 26-
27=-1; 27-27=0; 28-27=1 -> -1+0+1=0
2. La somma degli scarti al quadrato è un minimo
-> Consideriamo solo tre valori 20, 21, 22, la cui media è 21 (20-21)2+(21-21)2+(22-21)2=(-
1)2+(0)2+(1)2=2. Proviamo a sostituire un valore diverso dal valore medio, ossia lo zero. (20-
0)2+(21-0)2+(22-0)2=400+441+484=1325
3. La media aritmetica è interna, significa che è maggiore del più piccolo e minore del più
grande.
4. La media aritmetica è associativa, in quanto, suddividendo in due o più gruppi i valori della
variabile x, la media aritmetica della variabile è uguale alla media aritmetica delle medie
parziali dei diversi gruppi ponderati con il numero di elementi di ciascuno.
-> Media generale 20+21+22+23+24+25+26+27+28=24
Media parziale primo gruppo 20+21+22+23=86/4=21,5
Media parziale secondo gruppo 24+25+26+27+28=130/5=26
Verifica proprietà associativa 21,5x4+26x5=86+130=216/9=24
5. Per la media aritmetica vale la proprietà traslativa o uniforme. Se si aggiunge una quantità
h a ciascuno dei valori anche la media risulterà aumentata di h.
6. Gode inoltre della proprietà omogenea. Se si moltiplica ciascuno dei valori per una quantità
k anche la media risulterà moltiplicata per k.
7. Se le xi sono in progressione aritmetica e se N è un numero dispari la media aritmetica
coincide con il termine che occupa la posizione centrale nella graduatoria dei valori
ordinati.
Medie lasche: a differenza di quelle algebriche, prendono in considerazione solo alcuni valori della
distribuzione -> 1. Valore centrale (è il valore centrale); 2. mediana; 3. moda; 4. quartili.
1. V.c= x(1)+x(N)/2
2. Moda -> La Moda, o valore modale, è la modalità del carattere cui corrisponde la massima
frequenza o densità di frequenza (misure di tendenza centrale).
Per CARATTERI DISCRETI la moda si individua facilmente scorrendo lungo la colonna delle
frequenze.
Per CARATTERI CONTINUI se le classi di modalità hanno tutti uguale ampiezza, la moda cade nella
classe con maggiore frequenza (abbiamo il caso che la classe è uguale a tutti o può essere diversa,
in quanto ci sono classi non omogenee).
Se le classi di modalità hanno diversa ampiezza, la moda cade nella classe con maggiore densità di
frequenza.
ES. xi xl-> 0-5,5-25, 25-100, 100-200
fi -> 4,7,3,2
Prima cosa da fare xl-xi= 5-0=5; 25-5=20; 100-25=75; 200-100=100;
Seconda cosa da fare è trovare moda -> fi/xl-xi = 4/5= 0,80; 7/20= 0,35; 3/75= 0,040; 2/100= 0,013
3. Mediana: è un valore che bipartisce la distribuzione ordinata in senso crescente delle modalità
di un carattere, ossia la mediana è quel valore che assume la posizione centrale della
distribuzione.
Per i dati discreti, distinguiamo due formule, una per N pari -> Me= x(N/2)+(N+1/2)/2 ed una per N
dispari -> Me= x(N+1/2).
Mediana per dati discreti: la frequenza cumulata è data dalla somma cumulata delle N=Par; N/2 Vi
aiuta ad orientarvi sul valore modale che allora rappresenta la media ma dovete poi calcolare
esattamente il valore mediano con la formula.
 Es. quaderno.
Mediana per dati continui: la classe che contiene il valore mediano è quella a cui corrisponde una
frequenza cumulata superiore ad N/2. N/2 vi aiuta ad individuare la classe che contiene il valore
mediano -> formula: xi+xi+1-xi/ni x (N/2 – Ni-1)
 Es. quaderno.
ATTENZIONE: Quando sono continui trovare sempre N/2!!
4. Quartili: Dividendo la popolazione in 4 gruppi contenenti ciascuno un quarto di N, cioè il 25%
della popolazione, si identificano 3 modalità dette quartili di X. In altre parole, i quartili di X
sono le 3 modalità x0.25, x0.5 e x0.75 che nell’ordinamento occupano le posizioni 25%, 50% e
75% della distribuzione. La popolazione viene dunque divisa e per calcolare i quartili
ricorreremo alla formula della mediana e dunque, per il I quartile avremo ¼ N, per il II 2/4 N,
per il terzo ¾ N.
Sintesi in 5 numeri e box-plot

• Per un fenomeno almeno ordinale (qualitativo ordinale o quantitativo) la v.s. può essere
descritta dai seguenti 5 numeri:
• Minimo: x1;
• I quartile: x0.25;
• Mediana (II quartile): x0.5;
• III quartile: x0.75;
• Massimo: xk.
Costruendo un box-plot, uno per ciascun settore il confronto è immediato, semplice e ‘fotografico’
-> ci è subito chiara la differenza fra i vari settori.
Rappresentazioni grafiche -> dopo aver correttamente organizzato le informazioni grezze in tabella
e aver ottenuto una distribuzione di frequenze assolute, possiamo procedere con la
rappresentazione grafica.
- Grafici a nastri per caratteri qualitativi non ordinati;
- Grafici a barre per caratteri ordinati, caratteri quantitativi discreti;
- Grafici ad aree per caratteri quantitativi continui nel tempo;
- Istogrammi per caratteri quantitativi continui, suddivisi in classi;
- Grafici a torta per caratteri qualitativi non ordinati o ordinati ciclici;
- Grafici radar per caratteri ciclici;
- Cartogrammi per serie territoriali;
- Diagrammi cartesiani per serie storiche
 Quando noi creiamo un grafico dobbiamo essere sicuri che quel grafico vada bene per i
nostri dati. I più utilizzati sono i grafici a barre, ad aree, istogrammi, a torta, a radar,
cartogrammi.
Grafico a torta: molto utilizzato è anche il grafico a torta. Esso è costruito utilizzando un cerchio
suddiviso in vari spicchi, ciascuno dei quali costituisce una categoria.
Per il controllo visivo tra categorie che hanno frequenze relative simili, il grafico a barre risulta più
efficace del grafico a torta. Si usa solo per variabili qualitative.
ES. Vi sono le province messe in un ordine nominale. Gli stabilimenti balneari sono le frequenze.
Importante è stabilire una proporzione -> ni: N = xi° : 360; xi°=360° x ni/N= il più grande sta al più
piccolo come il piccolo sta al più grande Bari, 50: X1°=50 x 360/140=128°
Istogramma: è un grafico costituito da barre non distanziate, dove ogni barra possiede un’area
proporzionale alla frequenza della classe ed è per dati quantitativi continui.
Istogramma: è un grafico costituito da barre non distanziate, dove ogni barra possiede un’area
proporzionale alla frequenza della classe ed è per dati quantitativi continui.
Distinguiamo Istogramma:
1. con ampiezze delle classi modali uguali (es classi età 5-10,10-15, 15- 20);
2. con ampiezze delle classi diverse (Es classi età 5-8, 8-15, 15-30).
ES. Classi modali: 10-30, 30-50, 50-70, 70-90 e frequenza 6,7,4,3 -> prima ci calcoliamo l’ampiezza:
30-10; 50-30, etc… ed avremo un’ampiezza uguale per tutti, cioè 20.
Ma cosa accade se abbiamo classi di diversa ampiezza?
ES. 0-5, 5-15, 15-30, 30-35 -> calcoliamo l’ampiezza delle classi: 5-0=5, 15-5=10, 30-15=15, 35-
30=5-> l’ampiezza qui è diversa quindi dobbiamo calcolare la densità di frequenza hi=ni/di -> 17/5,
40/10, 37/15, 6/5; dopo aver fatto ciò inseriamo la nostra densità sullo schema: 3,4; 4,0; 2,5; 1,2.
La moda qui è 5-15, che risponde al valore hi di 4,0 -> è il valore che si presenta più
frequentemente.
Questo perché sappiamo che quando abbiamo dati discreti, per vedere il valore modale noi
semplicemente scorriamo sulle frequenze e vediamo qual è modalità si presenta con più
frequenza. Quando abbiamo una continua in primis vediamo se l’ampiezza è uguale o diversa -> se
è la stessa facciamo la stessa cosa, ma se abbiamo una distribuzione con diversa ampiezza, in
primis ci calcoliamo la densità di frequenza, poi possiamo scorrere su questa colonna è vedere
quella che si presenta più frequentemente.
La variabilità e i suoi indici: la variabilità è l’attitudine del fenomeno quantitativo ad assumere

diverse modalità, o meglio la tendenza di ogni singola osservazione ad assumere valori differenti
rispetto al valore medio.
Gli indici di variabilità misurano la variabilità di una distribuzione di frequenza:
1. Rispetto ad un centro rappresentativo (dispersione) e sono detti scostamenti medi e si
ottengono determinando gli scarti tra le modalità del carattere e una sua media;
2. Tra le unità statistiche a due a due (disuguaglianza) e sono detti differenze medie e si ottengono
determinando le differenze in valore assoluto delle modalità del carattere prese a due a due.
- Dispersione: per calcolare l’altezza prendo tutte le altezze e vedo prima le differenze e poi la
media;
- Disuguaglianza: studio le altezze a due alla volta.
Indici di variabilità assoluta: gli indici di v.a. sono espressi nella stessa unità di misura del
fenomeno osservato e sono:
1. Il campo di variazione;
2. La differenza interquartilica;
3. Gli scostamenti medi per la misura della dispersione intorno a valori caratteristici. (scarto
semplice medio e scarto quadratico medio);
4. Varianza;
5. Devianza;
6. La differenza media per la misura della disuguaglianza.
1. Campo di variazione (range): quanto varia la nostra distribuzione statistica? Si prende il

massimo valore della distribuzione e sottraendo il più piccolo: W=xmax-xmin
Voti di laurea: 82-77-90-71-62-68-74-84-94-88 -> W=94-62=32 -> abbiamo un range di 32 unità.
Pur essendo considerato un indice grossolano, è largamente usato in ambito industriale, nel
controllo della qualità, per conoscere se la variabilità di un prodotto che si ottiene con la
lavorazione in serie sia contenuta o meno.
2. La differenza interquartilica non è altro che la differenza fra il III e il I quartile. Serve per
delineare la parte centrale della distribuzione statistica: 𝑑𝑞 = 𝑄3 − 𝑄1
La differenza interquartilica è l’intervallo che contiene il 50% delle osservazioni centrali. È meno
sensibile del campo di variazione a influenze di carattere anomalo.
La caratteristica di questo indice è che a volte è nullo anche se i termini sono diversi tra loro.
3. Scostamenti medi (o scarti) sono i più importanti. Con questi indici ci proponiamo di risolvere il
problema di misurare di quanto le quantità rilevate differiscono in media dalla grandezza che si
è assunta a rappresentare l’intensità del carattere.
Se supponiamo di prendere la media come grandezza che rappresenta i valori osservati, è intuitivo
che la misura cercata possa essere data dalla quantità che sintetizza gli scarti tra le singole
quantità rilevate e la media.
Lo scarto semplice e quadratico medio sono largamente utilizzati per la misura della variabilità dei
caratteri demografici, antropometrici, biometrici, economici, ecc.
Il primo scarto è quello semplice medio (mean deviation): va sempre considerata una distribuzione
semplice e ponderata. Si identifica col delta -> sommatoria degli scarti valore assoluto fratto il
totale delle frequenze (n). Nella distribuzione ponderata non è altro che -> la sommatoria degli
scostamenti valore assoluto moltiplicato le frequenze fratto il totale della popolazione.
Quando noi abbiam una distribuzione statistica dove abbiamo modalità e frequenze, la prima cosa
che dobbiamo fare è calcolare la media; chiaramente dobbiamo stare attenti perché se è semplice
avremo quella semplice, se è ponderata, applicheremo la media ponderata.
Lo scarto quadratico medio è molto simile al precedente. Cambia il simbolo (sigma) è dato dalla
radice quadrata degli scostamenti al quadrato (non c’è più il valore assoluto) fratto N; chiaramente
al numeratore se non abbiamo le frequenze gli scostamenti al quadrato, se le avremo gli
scostamenti al quadrato per le frequenze assolute, tutto fratto N.
La varianza è il quadrato dello scarto quadrato medio -> la varianza è la somma delle deviazioni al
quadrato dalla media della popolazione diviso per il numero di osservazioni nella popolazione, N.
Questa si chiama sigma quadro.
La devianza non la utilizzeremo ed è il numeratore della varianza.
-> Differenza media di Gini -> quando il problema che interessa è quello di
misurare di quanto le diverse quantità rilevate differiscono tra loro, si può assumere ad indice di
disuguaglianza la media delle differenze tra ciascuna quantità e tutte le altre. È un indice di
disuguaglianza dato dalla media delle differenze tra ciascuna quantità e tutte le altre.
Si usano due modi per calcolarla -> risoluzione in linea o in tabella.
Abbiamo visto gli indici, media, moda, mediana, quartili e gli indici di variabilità assoluta
(scostamenti, varianza etc.).
Questi assoluti si distinguono da quelli relativi -> indici di variabilità relativi sono necessari per fare
il confronto tra variabilità di distribuzioni differenti, perché quelli assoluti, espressi nella stessa
unità di misura, non sono sempre adeguati per eseguire correttamente il confronto tra le
variabilità di distribuzioni differenti.
Coefficiente di variazione: CV= 𝜎/𝜇 x 100, dove il sigma è lo scostamento quadratico medio. È
utilissimo per confrontare fenomeni con diverso ordine di grandezza e diversa unità di misura e fra
fenomeni rilevati su popolazioni diverse.
Concentrazione: R -> R= ∑pi – qi/∑pi; si calcola per i caratteri che godono della proprietà della
trasferibilità (per calcolarla occorre ordinare i dati in senso crescente) -> la trasferibilità è un
fenomeno che possiamo trasferire fra le diverse unità (es. soldi o matricole, persone, coloro che
ascoltano radio etc.; tutto ciò che si può spostare, come i dipendenti – non si può spostare il peso
o l’altezza, da me o ad un altro). Per applicarlo è necessario ORDINARE LE MODALITÀ (come nella
mediana). Possiamo avere:
• equidistribuzione, quando ognuna delle n unità possiede 1/n dell’ammontare complessivo del
carattere;
• massima concentrazione, quando l’intero ammontare del carattere è posseduto da
una sola unità.
Pi in basso -> rappresentazione.
L’ultimo argomento della statistica descrittiva è l’analisi bivariata e relazione tra due variabili.
Fino ad ora abbiamo parlato di tecniche univariate, mentre ore passiamo a quelle bivariate.
Il primo passo per identificare il tipo di relazione esistente tra due variabili consiste nella loro
rappresentazione attraverso lo scatterplot, o diagramma a dispersione -> si mette sul grafico x e y.
Qui bisogna inserire due punti per formare una retta per poter individuare la relazione.
Quando interpretiamo un grafico a dispersione, il nostro obiettivo è saper distinguere tra i grafici
che evidenziano una relazione lineare da quelli che implicano o una relazione non lineare o
l’assenza di relazione tra le variabili (indipendenza o indifferenza statistica).
Si indica con il termine connessione una generica relazione statisticamente rilevabile in una coppia
di fenomeni osservati.
Se questa relazione è lineare, è chiamata correlazione.
Correlazione: per correlazione si intende una relazione tra due variabili tale che a ciascun valore
della prima variabile corrisponda con una certa regolarità un valore della seconda. Non si tratta
necessariamente di un rapporto di causa ed effetto, ma semplicemente della tendenza di una
variabile a variare in funzione di un’altra. Può capitare che all’aumentare di una variabile l’altra
aumenti o diminuisca, o viceversa, pertanto abbiamo una relazione concordate o discordate ->
concordante si comportano nella stessa maniera, discordante il contrario. Questa si calcola con la
correlazione.
La si calcola con il coefficiente di Pearson e la si rappresenta con il diagramma a dispersione o con
il diagramma a bolle.
-> vedere se vi è concordanza è la prima cosa da fare.

Regressione: se il grafico a dispersione e il coefficiente di
correlazione indicano che esiste una relazione lineare
tra le 2 variabili, dobbiamo trovare un’equazione
lineare che esprima questa relazione -> dobbiamo
trovare la retta che descriva questa relazione.
Un metodo per determinare la retta che descrive la
relazione esistente tra le variabili consiste nel
selezionare due punti dei dati che sembrano fornire un
buon adattamento e successivamente trovare
l’equazione della retta passante per questi due punti.
Si applica a coppie di fenomeni quantitativi (numerici) e
interpreta la dipendenza di Y da X: è una formula da applicare a X per approssimare Y.
Il modello di regressione può essere utilizzato per prevedere e simulare valori di Y non osservati,
ad esempio per prevedere valori di Y futuri oppure per simulare vari scenari di comportamento di
Y al variare di X.
Regressione nel caso di v.s. doppie in forma di serie di coppie di valori: la v.s. doppia data nella
forma di serie di N coppie di valori (xi, yi) si può tradurre graficamente in una nuvola di N punti,
ognuno rappresentativo di una coppia di valori.
Quando la nuvola assume una forma più o meno allungata si evince che tra i due caratteri esiste
un legame.
Si determina una funzione che esprime il legame tra X e Y: y*= a+bx.
Rappresentazione ->
Nella retta di regressione y*= 𝑎 + 𝑏x:

- a è l’intercetta ed esprime il valore teorico del carattere Y quando x=0.
- b è COEFFICIENTE DI REGRESSIONE ed esprime di quanto varia in media il carattere Y al variare di
un’unità del carattere X. Il calcolo dei due
parametri avviene con il metodo dei minimi
quadrati: si sceglie la retta per la quale la somma
dei quadrati degli scostamenti tra i valori
teorici e quelli osservati del carattere Y sia minima.
∗
∑i=1(𝑦i −𝑦i)2
-> Retta ai minimi quadrati, dove:
a è nella stessa unità di misura di Y;
b assume valori compresi tra - ∞ e + ∞;
Se b >0, Y aumenta in media all’aumentare di X;
Se b <0, Y diminuisce in media all’aumentare di X;
Se b=0, Y è indipendente da X.
LA PROBABILITÀ
La probabilità è una misura della possibilità che un fenomeno casuale possa verificarsi.
Abbiamo due fenomeni:
Fenomeno deterministico: se l’esperimento è condotto nelle stesse condizioni si trova lo stesso
risultato -> Esempi: Moto di un grave; traiettoria di una pallina in un biliardo.
Fenomeno non deterministico (sono quelli che ci interessano): anche se gli esperimenti sono
condotti nelle stesse condizioni si trovano risultati diversi -> Esempi: Risultato del lancio di una
moneta; traiettoria di 100 palline in un biliardo; vincita in una lotteria; numero di lanci di un dado
per ottenere un 6 -> la probabilità si occupa di fenomeni non deterministici!
La probabilità riguarda quindi quegli esperimenti che nel breve periodo conducono a risultati
casuali, ma che divengono prevedibili all’aumentare del numero dei tentativi.
All’aumentare del numero di ripetizioni di un esperimento probabilistico, la proporzione con la
quale uno specifico risultato si osserva tende a essere sempre più vicina alla probabilità di
ottenere lo specifico risultato.
I risultati di molteplici tentativi dello stesso esperimento producono regolarità statistiche che ci
inducono a fornire previsioni con un livello di accuratezza significativo (provare più volte per avere
più affidabilità).
Elementi della probabilità:
Spazio campionario S: insieme S di tutti i risultati dell’esperimento
Esempio:
• Nel caso del lancio di una moneta, S={Testa, Croce}
• Nel caso dei numeri di lanci di un dado necessari per avere 6, S=N (numeri naturali) -> quando
arriviamo a 6 abbiamo ottenuto il risultato dopo ad es. tre lanci.
Evento E: è il sottoinsieme E di S dato da un insieme di risultati derivanti da un esperimento
probabilistico e caratterizzati da una stessa proprietà
Esempio: • E={Testa} nel lancio di una moneta
Due tipi di definizioni -> definizione di probabilità frequentista o empirica: la probabilità di un
evento E è pari circa al numero di volte che l’evento E è stato osservato rapportato al numero di
ripetizioni dell’esperimento.
𝑃(𝐸) ≈ frequenza di 𝐸 fratto il numero di tentativi dell’esperimento -> vuol dire usare le frequenze
relative per approssimare le probabilità.
Esempio: un giocatore vuole stimare la probabilità di ottenere sette lanciando una coppia di dadi
non truccati. Lancia i dati 100 volte e conta il sette 15 volte. La probabilità di ottenere sette è pari a
15/100= 0,15.
-> definizione di probabilità classica: regola che a ogni evento E associa un numero reale compreso
tra 0 e 1. Se un evento si può verificare in N modi mutuamente esclusivi ed ugualmente probabili,
se m di questi possiede una caratteristica E, la probabilità di E è il rapporto tra il numero di casi
favorevoli e il totale dei casi possibili (tutti equiprobabili).
P(E)= casi favorevoli su i casi possibili -> m/N.
Esempio: 1) Nel caso del lancio di una moneta S={Testa, Croce}.
p(Testa)=1/2 (casi favorevoli 1, possibili 2);
2) Lanciamo due dadi e calcoliamo la probabilità che la somma dei punti sia 4. Per semplicità
scriviamo i numeri estratti come coppie: le coppie di 6 numeri sono 6 * 6= 36 = numero di casi
possibili; i casi favorevoli sono dati dalle coppie (1,3), (2,2) e (3,1) e sono quindi 3. Pertanto
p(somma 4 in 2 lanci)=3/36=1/12 -> ogni dato a 6 facce quindi cerchiamo tutte le coppie possibile
che però ci diano 4 come somma; quali sono i casi favorevoli? 1-3, 2-2, 3-1, quindi sono 3 casi -> 3
casi su tutti i casi possibili, cioè 36, semplificato 1/12.
Possiamo usare anche un diagramma ad albero per la probabilità.
Un evento può essere:
1. Certo: se accade con certezza (ad esempio, nel lancio di un dado, è un evento certo E=“esce un
numero minore di 7”);
2. Impossibile: se non può mai accadere (nell’esempio precedente, è impossibile l’evento E=“esce
un numero maggiore di 6”);
3. Casuale (o aleatorio): se può accadere oppure no (nell’esempio precedente, è casuale l’evento
E=“esce un numero minore di 3”).
La probabilità di un evento impossibile è 0;

La probabilità di un evento certo è 1, mentre la probabilità di un evento casuale (o aleatorio) è
compresa tra 0 e 1.
Regola additive:
-SOMMA LOGICA (O EVENTO UNIONE): Dati due eventi elementari E1 ed E2, entrambi sottoinsiemi
di U, si dice somma logica l’insieme unione E1 U E2.
Esempio -> Nel lancio di un dado, si considerino gli eventi elementari E1 =“esce un numero pari” =
{2,4,6} ed E2=“esce un multiplo di 3” = {3,6} La somma logica sarà l’evento: E1 U E2=“esce un
numero pari o un multiplo di 3”= ={2,3,4,6}.
Riconosciamo la somma logica quando nella descrizione dell’evento compare il
connettivo “o”.
Regola della moltiplicazione:
-PRODOTTO LOGICO (O EVENTO INTERSEZIONE): Dati due eventi elementari E1 ed E2, entrambi
sottoinsiemi di U, si dice prodotto logico l’insieme di intersezione E1 ∩ E2.
Esempio -> Nel lancio di un dado, si considerino gli eventi elementari E1=“esce un numero pari” =
{2,4,6} ed E2=“esce un multiplo di 3” = {3,6} Il prodotto logico sarà l’evento: E1∩ E2 =“esce un
numero pari e multiplo di 3”= {6}.
Riconosciamo la somma logica quando nella descrizione dell’evento compare il connettivo “e”.
Regola dell’addizione:
Per due qualsiasi eventi non disgiunti E e F, vale la relazione P(E o F)= P(E)+P(F)-P(E e F).
Supponiamo di voler calcolare la probabilità di estrarre da un mazzo di 52 carte un re (Evento E)
oppure di estrarre una carta di quadri (Evento F). Poiché gli eventi non sono disgiunti, poiché il
risultato «re di quadri» è presente in entrambi gli eventi, è necessario applicare la regola
dell’addizione. P(re o quadri)= P(re)+P(quadri)-P(re di quadri)= 4/52+13/52-1/52=16/52=4/13.
Regola della moltiplicazione: Se E e F sono eventi indipendenti, si ha: P(E eF) = P(E) * P(F)
Esempio: qual è la probabilità di ottenere testa in due lanci di una moneta non truccata? P(testa al
primo lancio e testa al secondo lancio)=1/2*1/2=1/4.
Eventi incompatibili e eventi compatibili: due eventi E1 ed E2 si dicono incompatibili se non

possono verificarsi contemporaneamente, cioè se E1∩ E2 =Ø. Viceversa, se E1∩ E2 ≠ Ø allora sono
compatibili.
Esempio: Nell’estrazione di una carta da un mazzo di 40, sono incompatibili gli eventi: E1 =“esce
una figura”; E2=“esce un 7”.
Eventi complementari: Sia S lo spazio campionario di un esperimento probabilistico e sia E un
evento, il complemento a E, 𝐸𝑐 , rappresenta tutti i risultati dello spazio campionario S che non
appartengono all’evento E -> quando abbiamo la probabilità che si verifica l’evento
complementare avremo 1 – e.
P(E o 𝐸𝑐)= 𝑃(𝐸) +𝑃(𝐸𝑐) =𝑃(𝑆) =1 -> Da cui si ottiene P(𝐸𝑐)=1 – P(E).
Esempio: risulta che il 54% degli italiani ha giocato alla lotteria, qual è la probabilità di estrarre
casualmente un italiano che non abbia giocato alla lotteria? P (non aver giocato alla lotteria)= 1-P=
1-0,54= 0,46.
C’è quindi il 46% di probabilità di estrarre casualmente un italiano che non abbia giocato alla
lotteria.
Eventi indipendenti e dipendenti: due eventi E e F si dicono indipendenti se la probabilità che
l’evento E accada non influenza la probabilità di accadimento dell’evento F. Al contrario si dicono
dipendenti se la probabilità che l’evento E accada influenza la probabilità di accadimento
dell’evento F -> se io lancio un dato ed esce 3 questo evento non influenza il fatto che dopo possa
uscire nuovamente 3, o 2, o 4, mentre se un italiano si laurea e prende uno stipendio di 23mila
euro, è dipendente perché se si è laureato ha maggiore probabilità di avere uno stipendio più alto.
Probabilità condizionata: la notazione P(F ǀ E) indica ‘la probabilità dell’evento F dato l’evento E’.
Questa è la probabilità che l’evento F accada dato che l’evento E si è verificato.
Esempio: nel lancio di un dato, qual è la probabilità che il risultato sia 3? Se lo rilanciamo una
seconda volta e ci dicono che il risultato è un numero dispari, qual è la probabilità che il risultato
sia 3? Nel primo caso S {1,2,3,4,5,6} e P(3)=1/6.Nel secondo caso S {1,3,5} e P(3 ǀ risultato
dispari)=1/3.Pertanto le probabilità condizionate riducono l’ampiezza dello spazio campionario.
Regola della probabilità condizionata: Se E e F sono due eventi qualsiasi, allora
P(F ǀ E)= P(E e F)/P(E) = N(E e F)/ N(E) -> dalla probabilità alla numerosità degli individui.
La probabilità che l’evento F accada, considerando che l’evento E è accaduto, si trova dividendo la
probabilità di E e F per la probabilità di E. In alternativa la probabilità di accadimento dell’evento F,
dato l’accadimento dell’evento E, si trova dividendo il numero di risultati possibili in E e F per il
numero di possibili risultati in E.
Es: Calcolare la probabilità che un individuo selezionato casualmente e che non sia mai stato
sposato sia un uomo. -> ci sono 55,3 milioni di persone mai state sposate di cui 30,3 uomini,
pertanto P(uomo ǀ mai sposato) = N(mai sposato/a e uomo)/N(mai sposato/a)= 30,3/55,3 = 0,548
Quindi c’è il 54,8 %di probabilità che un individuo selezionato casualmente sia uomo, dato che lui
o lei non sono mai stati sposati.
Indipendenza: due eventi sono indipendenti se il verificarsi di un evento E in un esperimento
probabilistico non influenza la probabilità dell’evento F. Adesso è possibile esprimere
l’indipendenza utilizzando le probabilità condizionate.
Due eventi E e F sono indipendenti se P(E ǀ F) = P(E) o, in modo equivalente, se P(F ǀ E) = P(F)
Esempio: si estrae una carta da un mazzo di 40. Qual è la probabilità che sia una figura e che sia di
cuori? La presenza del connettivo “e” ci fa pensare alla probabilità composta, quindi dobbiamo
chiederci se i due eventi sono dipendenti o indipendenti.
La probabilità del primo evento è 12/40, cioè 3/10. La probabilità che la carta sia di cuori non è
influenzata dal verificarsi dell’evento che la carta sia una figura, quindi vale 10/40 cioè 1/4. La
probabilità composta sarà allora 3/40, cioè 3/10*1/4.
Pertanto, questo è un caso di eventi indipendenti. La probabilità composta è data dal prodotto
delle probabilità dei singoli eventi: p(E1 ∩ E2) = p(E1)*p(E2).
Accenni di calcolo combinatorio.

Permutazione: la permutazione di r oggetti presi da un insieme di m oggetti è un ordinamento di r
oggetti distinti presi tra m oggetti. Il numero di permutazioni possibili di r oggetti che si possono
formare da un insieme di m oggetti è indicato con 𝑃𝑚,𝑟 (permutazione di m scelte su r) Es.
Elencare tutte le permutazioni possibili di 3 lettere prese da un insieme di 5 lettere. Per svolgere
questo esercizio utilizzeremo la regola delle permutazioni, dove 𝑃𝑚,𝑟=𝑚!/(𝑚−𝑟)! =5!/(5−3)!=
5∗4∗3∗2/2=60 -> ! sarebbe il fattoriale e indica che il valore va moltiplicato per tutti i valori
precedenti, quindi il 5 -> x4,x3,x2, il 2 è x1.
Esempio: in una corsa di cavalli lo scommettitore indica i due cavalli che secondo lui termineranno
al primo e al secondo posto specificandone l’ordine. Determinare il numero di scommesse di
questo tipo che si possono fare se alla corsa partecipano 12 cavalli.
Soluzione: scegliere l'ordine di arrivo di 2 cavalli in un insieme di 12 cavalli equivale a specificare
una permutazione di 2 oggetti in un insieme di 12 oggetti. Il primo oggetto è il cavallo da scegliere
per il primo posto e il secondo oggetto è il cavallo da scegliere per il secondo posto. La soluzione
sarà data da Pm,r= 12!/(12-2)! =12!/(12-2)!=12*11*10*9*8*7*6*5*4*3*2/10*9*8*7*6*5*4*3*2=
132.
Combinazione: una combinazione di r oggetti presi da un insieme di m oggetti è una scelta non
ordinata di r oggetti distinti presi da un insieme di m oggetti. Il numero delle combinazioni possibili
di r oggetti presi da un insieme di m oggetti è indicato con Cm.r (combinazione di m scelte su r)
Es: Elencare tutte le combinazioni possibili di 3 lettere prese da un insieme di 5 lettere.
Per svolgere questo esercizio utilizzeremo la regola delle combinazioni dove Cm,r=
m!/r!((m-r)!= 5!/3!/(5-3)! = 5*4*3*2/3*2*2 = 10
Esempio: nel tentativo di allargare la sua clientela, un negozio di cd pubblicizza una sensazionale
offerta: acquistando un cd al prezzo di listino se ne ricevono in regalo 4 a scelta da una lista di 69
cd. In quanti modi possibili un cliente può scegliere i 4 cd in omaggio?
Soluzione: ogni scelta di 4 cd da una lista di 69 rappresenta una combinazione di 4 oggetti presi da
un insieme di 69 oggetti.
La soluzione sarà data da Cm,r= 69!/4! (69-4)! =69!/4!65!= 864501
Variabili casuali: una variabile casuale X è una misura numerica dell’esito di un esperimento
casuale. Una variabile casuale è discreta quando assume un numero finito e numerabile di valori,
ed è continua quando assume un numero infinito di valori.
Poiché i valori di una variabile casuale sono determinati dal caso, i possibili valori di una variabile
casuale corrispondono a determinate probabilità. La distribuzione di una variabile casuale discreta
X fornisce i possibili valori assunti dalla variabile casuale e le corrispondenti probabilità.
Funzioni di probabilità discrete: si dice variabile casuale (o aleatoria, o stocastica) discreta una
quantità 𝑋 che può assumere i valori 𝑥1 𝑥2 𝑥3 .....................𝑥𝑛 al verificarsi degli eventi
incompatibili (eventi che si escludono a vicenda) e complementari (eventi che non possono
verificarsi contemporaneamente, ma uno dei due si verifica per forza)*
E1 E2 E3 ………. EN le cui probabilità sono p1 p2 p3 ……….. pn, pari a ∑=𝐸𝑛 𝑖 p𝑖= 1.
certamente si verifica.
*Gli eventi E1, E2, … En si dicono incompatibili se si escludono a vicenda; sono complementari se
due di essi non possono verificarsi contemporaneamente e uno fra tutti certamente si verifica.
Per indicare che ad ogni valore assunto dalla variabile viene associato un valore di probabilità si
scrive: 𝑝(𝑋=𝑥𝑖) =𝑝𝑖.
Si rappresenta poi la distribuzione in una tabella come la seguente:
All’insieme dei valori di probabilità 𝑝𝑖 associati a quelli 𝑥𝑖 assunti dalla variabile aleatoria si dà il
nome di distribuzione di probabilità della variabile 𝑿.
Possiamo rappresentare la distribuzione di probabilità di una variabile casuale discreta con un
diagramma cartesiano.
Esempio:
Lanciamo ripetutamente una moneta finché non esce testa. Abbiamo a disposizione tre tentativi:
𝐸1: se esce testa al primo tentativo si vincono € 10
𝐸2: se esce testa al secondo tentativo si vincono € 5
𝐸3: se esce testa al terzo tentativo si vincono € 2
𝐸4: se non esce testa si perde € 1
Indichiamo con 𝑋 ciò che si vince o si perde poiché l’esito del gioco non è noto a priori:
La Funzione di ripartizione: la funzione di ripartizione è detta anche funzione di distribuzione o

funzione di probabilità cumulativa. Si definisce in analogia con le frequenze cumulate della
statistica descrittiva.
Sommando le probabilità 𝑝(𝑥𝑖) dalla prima fino all’i-esima, si ottiene la probabilità che
la variabile 𝑋 assuma valori minori o uguali a 𝑥𝑖.
P(X ≤ x) dove x è un numero (reale) qualunque.
La funzione che si ottiene al variare di 𝑖 da 1 a 𝑁 si chiama funzione di ripartizione:
F(𝑥𝑖) =𝑝(𝑋≤𝑥𝑖) =𝑝1+𝑝2+⋯+𝑝𝑖=∑𝑝𝑘. -> sommatoria di tutte le probabilità, quindi, ad
esempio, abbiamo x= 0,1,2, le probabilità P rispettive sono P= 0.25, 0.50, 0.25 -> avremo
0.25+0.50= 0.75+0.25= 1.
Funzione di ripartizione della v.c. X: numero di teste nel lancio di due monete.
Esempio: lanciamo un dado regolare -> la variabile aleatoria 𝑋 è il numero che compare sulla
faccia superiore. La variabile può avere valore 1, 2, 3, 4, 5, 6 e la probabilità di ciascuno di questi
valori è 1/6.
-> andiamo a sommare i valori.

Alla prima avremo 1/6, poi sommeremo 1/6+1/6=1/3, ed aggiungeremo via via -> sommare,
dunque, è la somma cumulata delle probabilità = come le frequenze cumulate.
Ciò che ci serve sapere è che il grafico per rappresentare la ripartizione è un grafico a gradini, e che
i valori che possono assumere i valori si mantiene tra 0 e 1.
I valori di sintesi (valore medio e scarto quadratico medio):
Poiché p1+p2+p3+…pn=1, risulta che cioè 𝐸(𝑥) è la media

ponderata di tutti i valori che 𝑋 può assumere in un numero molto grande di prove. Per questo
motivo 𝐸 𝑥 viene anche chiamato valor medio.Si fa la sommatoria dei valori delle variabili fratto la
sommatoria delle probabilità = è una media: adesso abbiamo le xi, dunque le variabili e le pi che
sono la sommatoria delle probabilità.
La varianza: data una variabile aleatoria 𝑋 e posto 𝜇 = 𝐸(𝑥), si chiama varianza di 𝑿, e si indica con
il simbolo 𝑉(𝑋) oppure 𝜎2(𝑋), il valore atteso del quadrato della differenza fra la variabile 𝑋 ed il
suo valore atteso:

Come la statistica descrittiva, ma adesso non ci sono le frequenze assolute, ma le pi.
Alla radice quadrata della varianza si dà il nome di scarto quadratico medio o deviazione standard,
e si indica con il simbolo 𝜎(𝑋):
𝜎(𝑋) = √(radice quadrata)𝑉(𝑋).
Si dimostra che la varianza può essere calcolata con la formula:
Se consideriamo la variabile aleatoria 𝑋2 che assume
valori 𝑥2 con probabilità 𝑝i, la formula diventa:
-> questa formula è importante.

Es. calcoliamo il valore medio e la varianza della variabile casuale X definita dalla tabella: x-> 1,2,3;
p-> 0.2, 0.3, 0.5.
Il valore atteso di Xquadro; eleviamo al quadrato la tabella di partenza: x2= 1,4,9; p=0.2, 0.3, 0.5;
dopo avere elevato al quadrato le x facciamo: 𝐸(𝑋2) =1∙0,2 + 4∙0,3 +9∙0,5 =5,9.
𝑉(𝑋) = [𝐸(𝑋2)] – [𝐸(𝑋)]2 = 5,9 − 5,29 (1x0,2 + 2x0,3 + 3x0,5= 2,3 x 2,3 -quadrato- = 5,29) = 0,61.
Distribuzione di Bernoulli: particolari distribuzioni di probabilità discrete -> la binomiale (unica che
studieremo): chiamiamo esperimento di Bernoulli un esperimento aleatorio che può avere solo
due possibili esiti; quello che interessa viene detto successo, l’altro insuccesso. La probabilità 𝑝
dell’evento successo, viene detta parametro dell’esperimento aleatorio. La variabile aleatoria 𝑋
che conta il numero di successi nella ripetizione di 𝑛 volte dell’esperimento viene detta binomiale.
Sia 𝑋 una variabile aleatoria binomiale di parametro 𝑝. La probabilità che su 𝑛 ripetizioni si
verifichino 𝑥 successi è uguale a: ,essendo q= 1-p.

Possiamo quindi scrivere la funzione distribuzione di probabilità nel seguente modo:
 si sviluppa come la combinazione, quindi avremo n!/x!(n-x)! -> lo stesso, che poi moltiplica
la probabilità di x per q(che va da n a x, con x= 0,1,2,…,n.
Essa prende il nome di distribuzione binomiale di ordine 𝒏 e parametro 𝒑, o anche distribuzione di

Bernoulli e viene indicata con 𝐵 𝑛, 𝑝. Per questa distribuzione si ha che:
Possiamo quindi scrivere la funzione distribuzione di probabilità nel seguente modo:
Esempio: La prova di ammissione ad un corso di storia dell’arte è composta da 10 domande a

risposta multipla (4 possibili risposte di cui una sola esatta).
Per essere ammessi al corso bisogna rispondere esattamente ad almeno 6 domande. Qual è la
probabilità di ottenere la sufficienza rispondendo a caso?
La probabilità che sia stata scelta a caso la risposta esatta ad una domanda è 1/4, perché abbiamo
dieci domande di cui solo 1 su 4 sarà quella giusta.
Il numero delle risposte esatte è una variabile 𝑋 a distribuzione binomiale con 𝑛 = 10, 𝑝 = 1/4, 𝑞 =
1−𝑝 = ¾.
Otteniamo la sufficienza se 𝑋 = 6 o 𝑋 = 7 o 𝑋 = 8 o 𝑋 = 9 o 𝑋 = 10.
L’evento è quindi unione di cinque eventi disgiunti e quindi la sua probabilità sarà ottenuta dalla
somma di tali probabilità:
La probabilità di essere ammessi al corso rispondendo a caso alle domande è quindi: 𝑝6 + 𝑝7 + 𝑝8

+ 𝑝9+𝑝10 = 0,019727706 ... ~2%.
Es. quaderno.

Statistica Riassunto

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Statistica Riassunto

Caricato da

Copyright:

Formati disponibili

STATISTICA

La statistica è il descrittore di un campione, mentre il parametro è il descrittore di una

Sintesi in 5 numeri e box-plot

La variabilità e i suoi indici: la variabilità è l’attitudine del fenomeno quantitativo ad assumere

1. Campo di variazione (range): quanto varia la nostra distribuzione statistica? Si prende il

-> vedere se vi è concordanza è la prima cosa da fare.

Nella retta di regressione y*= 𝑎 + 𝑏x:

Possiamo usare anche un diagramma ad albero per la probabilità.

Un evento può essere:

La probabilità di un evento impossibile è 0;

Eventi incompatibili e eventi compatibili: due eventi E1 ed E2 si dicono incompatibili se non

Accenni di calcolo combinatorio.

La Funzione di ripartizione: la funzione di ripartizione è detta anche funzione di distribuzione o

-> andiamo a sommare i valori.

Poiché p1+p2+p3+…pn=1, risulta che cioè 𝐸(𝑥) è la media

suo valore atteso:

-> questa formula è importante.

verifichino 𝑥 successi è uguale a: ,essendo q= 1-p.

Essa prende il nome di distribuzione binomiale di ordine 𝒏 e parametro 𝒑, o anche distribuzione di

Possiamo quindi scrivere la funzione distribuzione di probabilità nel seguente modo:

Esempio: La prova di ammissione ad un corso di storia dell’arte è composta da 10 domande a

La probabilità di essere ammessi al corso rispondendo a caso alle domande è quindi: 𝑝6 + 𝑝7 + 𝑝8

Potrebbero piacerti anche