Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Capitolo 1
Branca della matema,ca applicata, che si occupa di collezionare ed analizzare da# al fine di
estrarre un informazione
I da, sono grezzià Da essi nascono informazioni fruibili
La sta&s&ca ci aiuta a fare questo passaggio
I da, vengono immagazzina, nei data set…ovvero matrici con righe e colonne di numero
differente in base agli aspe> individua, e le variabili
è Categoriche (es. stato civile, diriEo al voto, colore degli occhi… in ogni caso non è
un numero)
l livelli di misurazione
• Da# nominali: hanno il livello di misurazione più debole, la cui codifica numerica
(della risposta) è scelta per sola convenienza e non implica un rango tra le risposte.
I valori assun, dalle variabili nominali riguardano e,cheEe di categorie o classi (es.
maschio/femmina; Si/No
I dati in forma grezza non sono generalmente facili da usare nel processo decisionale, quindi
qualche organizzazione si rende necessaria: utilizziamo Tabelle e Grafici .
Variabili Categoriche
Distribuzione di frequenze
La distribuzione delle frequenze rela#ve si o>ene poi, dividendo ciascuna frequenza per il
numero complessivo di osservazioni
La distribuzione delle frequenze percentuali, invece, mol,plicando i risulta, delle freq.
rela,ve per il 100%
Diagrammi a barre: u,lizzato per individuare con maggiore aEenzione la frequenza di ogni
categoria
Il grafico per serie storiche rappresenta una serie di da, rilevan, in istan, di tempo
differen,.
Considerando l’Asse Orizzontale come asse temporale, e sull’Asse Ver,cale poniamo le
quan,tà numeriche oggeEo della misurazione, oEeniamo un punto sul piano cartesiano
per ogni osservazione.
Il grafico si oEerrà congiungendo i vari pun, con una spezzata.
Distribuzioni di frequenze
Distribuzione delle frequenze cumulateà si oEene sommando alla frequenza della classe
corrente le frequenze di tuJe le classi preceden>.
Distribuzione delle frequenze rela5ve cumulate à si cumulano le frequenze rela>ve
Distribuzione delle frequenze percentuali cumulate à si cumulano le frequenze percentuali
Istogramma
§ Grafico composto da reJangoli ver>cali adiacen>, costrui> su una linea orizzontale sulla
quale sono delimitate le stesse classi di intervallo individuate nella distribuzione di
frequenze.
Ogiva
DeJa anche curva delle frequenze cumulate, è una spezzata che rappresenta la distribuzione delle
frequenze percentuali cumulate.
InfaE unisce i pun> che rappresentano le percentuali cumulate di osservazioni, con valori minori
del limite superiore di ciascuna classe
Asimmetria: una distribuzione si dice asimmetrica o obliqua, quando le osservazioni non sono
distribuite in modo simmetrico rispeJo al valore centrale della distribuzione .
è Una distribuzione obliqua a destra (deJa con asimmetria posi>va) ha una coda che si
estende verso destra, nella direzione dei valori posi>vi.
è Una distribuzione obliqua a sinistra (deJa con asimmetria nega>va) ha una coda che si
estende verso sinistra, nella direzione dei valori nega>vi
Diagramma ramo-foglia
È un metodo di analisi esplora>va dei da> alterna>vo all’istogramma.
I da> vengono raggruppa> secondo le loro cifre più significa5ve (i rami), mentre le cifre meno
significa5ve di ogni osservazione (le foglie) sono elencate a destra di ogni ramo, separatamente e
in ordine non decrescente
è Si associa un punto del piano cartesiano a ogni coppia di valori che cos,tuiscono
un’osservazione congiunta delle due variabili.
Una tabella con r righe e c colonne viene indicata come tabella r*c
Quando le 2 variabili sono entrambe qualita,ve si parla di tabella di con#ngenza
Capitolo 3
Una misura di tendenza centrale che viene subito in mente è la Media, ci sono poi
mediana e moda
Media
Mediana
Quindi…
Posizione 0.50 (n+1) della sequenza ordinata
Moda
La moda viene u,lizzata sopraEuEo per i da, categorici, ma anche per da,
numerici, e non è influenzata da alcun valore estremo.
è La media delle distribuzioni unimodali oblique a destra è più grande della mediana,
è La media delle distribuzioni unimodali oblique a sinistra è più minore della mediana.
Percen4li e Quar4li
Determinazione
è I Quar#li sono misure descri>ve che separano gli insiemi di da2 molto numerosi
quaFro quar2
La variabilità è un principio fondamentale nel controllo sta,s,co della qualità, essa indica il
faEo che non esisteranno mai 2 ogge> estremamente uguali.
Anche se 2 insiemi di da, possono avere la stessa media, le singole osservazioni del primo
insieme possono ad esempio variare di più dalla media di quanto non lo facciano le
osservazioni del secondo insieme.
Campo di variazione
È la differenza tra il massimo e il minimo dei valori osserva#, la più semplice misura di
variabilità.
Più grande è la variabilità dei da, rispeEo al centro della distribuzione, più sarà grande il
campo di variazione
Differenza Interquar$le
Misura la variabilità del 50% centrale dei da, : in una sequenza di osservazioni ordinate in
modo non decrescente è la differenza tra l’osservazione Q3 (terzo quar,le o 75esimo
percen,le) e l’osservazione Q1 (primo quar,le o 25esimo percen,le).
Differenza Interquar,le = Q3 – Q1
Varianza : misura statistica che indica la distanza di un insieme di numeri dal loro valore medio
è Varianza della popolazione: σ2
È la somma delle differenze, al quadrato, tra ciascuna osservazione e la media della
popolazione, divisa per la dimensione della popolazione N
2
è Varianza campionaria s
È la somma delle differenze, al quadrato, tra ciascuna osservazione e la media del
campione, divisa per la dimensione del campione n, meno 1
Coefficiente di Variazione:
è una misura di variabilità rela#va che esprime lo scarto quadra2co medio come
percentuale della media (purché essa non sia nulla)
Anch’esso va rapportato sia alla popolazione che al singolo campione:
Teorema di Chebychev
Chebychev riuscì a determinare per ogni insieme di da,, indipendentemente dalla forma
della distribuzione, degli intervalli che contengono una percentuale minima di osservazioni
Per ogni popolazione con media µ , scarto quadratico medio σ e k > 1, la percentuale di
osservazioni che appartengono all’intervallo ( µ - k σ ; µ + k σ) :
2
almeno [1 - (1/k )] 100%
k rappresenta il fattore moltiplicativo dello scarto quadratico medio
Z-Score
è un valore standardizzato che indica il numero di deviazioni standard che
separano il dato dalla media della distribuzione.
Covarianza (Cov)
Un valore positivo indica una relazione diretta o positiva e un valore negativo indica
una relazione inversa o negativa.
Ovvero una misura standardizzata della relazione lineare tra due variabili
È più utile della covarianza in quanto fornisce sia la direzione sia l’intensità della
relazione
Si calcola dividendo la covarianza per il prodotto degli scarti quadratici medi delle
due variabili.
I modelli economici usano specifiche relazioni funzionali per indicare l’effetto su una
variabile dipendente, Y, risultante dai cambiamenti nella variabile indipendente, X.
Si deve cercare di trovare la migliore fra tutte le possibili equazioni lineari, determinando in modo
appropriato i coefficienti:
Capitolo 4 : Probabilità
Dimostreremo come i modelli probabilistici siano gli strumenti utilizzati per fare inferenza sulle caratteristiche
non note della popolazione. Il nostro obiettivo, in questo e nei prossimi due capitoli, sarà quello di capire le
probabilità e i modi per poterle determinare e utilizzare.
Esperimento aleatorio
Un esperimento aleatorio (o esperimento casuale) è un processo che porta a due o più risulta.
senza che si possa prevedere quale di ques. si realizzerà.
Esempi di esperimento casuale sono: lancio di una moneta; numero di appal> che una società può
aggiudicarsi (da 0 a 5); L'acquisto o meno di un ar>colo da parte di una persona che entra in un
negozio…
In ognuno degli esperimen> casuali elenca> precedentemente possiamo specificare tu6 i possibili
risulta., defini> even! elementari, ma non sappiamo in an>cipo quale si verificherà.
(Ad esempio, non sappiamo in an>cipo se la persona che entra in un negozio comprerà o non
comprerà un determinato ar>colo)
Spazio campionario
I possibili risulta> di un esperimento casuale sono chiama> even5 elementari e
l’insieme di tu9 gli even* elementari è chiamato spazio campionario
(o spazio degli even> elementari).
Per indicare lo spazio campionario si userà la leJera S
Evento
Un evento, E, è un qualsiasi soCoinsieme di even5 elementari di uno spazio campionario.
Un evento si verifica quando il risultato dell'esperimento casuale e uno degli even> elementari che
lo cos>tuiscono.
L'evento impossibile rappresenta l'assenza di even> elementari ed è indicato con 0 (simbolo
dell'insieme vuoto in algebra).
L'evento certo è rappresentato da tuE gli even> elementari ed è lo stesso S
Intersezione di even$
Siano A e B due even> dello spazio campionario S. La loro intersezione, indicata con A ^ B, è
l'insieme di tu6 gli even. elementari di S che appartengono sia ad A sia a B.
L'intersezione A ^ B si verifica se e solo se si verificano sia A sia B.
Si userà il termine probabilità congiunta di A e B per indicare la probabilità dell’intersezione di A e
B.
Più in generale, da> K even> E1, E2,..., Ek, la loro intersezione, E1 ^ E2 ^ ... Ek, è l'insieme di tuE gli
even> elementari che appartengono a ogni Ei (i = 1,2, … , K).
È possibile che l’intersezione di due even> non presen> even> elementari comuni e sia pertanto
l’evento impossibile
Unione di even$
siano A e B due even> dello spazio campionario S. La loro unione, indicata con A U B, è l'insieme di
tu6 gli even. elementari di S che appartengono ad almeno uno dei due even..
L'unione A U B si verifica se e solo se A o B o entrambi si verificano.
Più in generale, da> K even> E1, E2, ..., Ek, la loro unione, E1 U E2 U ... U Ek, è l'insieme di tuE gli
even> elementari che appartengono ad almeno uno dei K even>.
Even$ colle1vamente esaus$vi
Da> K even> E1, E2, … , Ek dello spazio campionario S, se la loro unione,
E1 U E 2 U ... U Ek = S, ques> K even> sono deE colleFvamente esaus5vi.
èTre concetti che saranno importanti per lo sviluppo successivo della teoria della probabilità: l'evento intersezione,
l'evento unione e l'evento complementare.
La Probabilità
§ La probabilità esprime quindi il livello individuale di fiducia del verificarsi di un certo evento.
Le probabilità soggeEve sono usate in alcuni processi decisionali di >po ges>onale.
§ Le probabilità soggeEve sono personali. Non si richiede che persone diverse giungano alle
stesse probabilità per lo stesso evento. Nell' esempio della quotazione azionaria la
maggioranza delle persone giungerebbe alla conclusione che la probabilità appropriata per
un aumento della quotazione è 0.50, tuJavia una persona con più informazioni sul >tolo
potrebbe pensarla diversamente.
4.Definizione Assioma/ca
È necessario sviluppare una struJura per calcolare e trasformare numericamente le
probabilità… stabiliamo quindi 3 regole (o assiomi) che le probabilità dovranno soddisfare
e dimostreremo che queste richieste sono “ragionevoli”
• Questo perché, spesso, il verificarsi di un evento dipende dal faEo che altri even, si
siano o meno verifica,.
Siano A e B due even, dis,n,, usando questa regola, la probabilità della loro
intersezione può essere derivata dalla probabilità condizionata
Indipendenza sta$s$ca
Probabilità bivariate
Due insiemi di even,, considera, congiuntamente, sono chiama, bivaria,, e le
rela,ve probabilità sono deEe probabilità bivariate
Even! indipenden!:
Siano A e B una coppia di even,, ognuno oEenuto dall’unione di even, mutuamente
esclusivi e colle>vamente esaus,vi indica, con A1, A2, …, Ah e B1, B2, …, Bk
Se ogni evento Ai è sta2s2camente indipendente da ogni evento Bj, allora A e B sono
even# indipenden#
Odds
Sono usa, per comunicare informazioni probabilis,che
in determinate situazioni
Overinvolment Ra4o
È il rapporto tra le probabilità condizionate di un evento, ad esempio vedere una
pubblicità, che si verifica soEo due condizioni mutuamente esclusive e complementari,
come ad esempio l’acquisto o meno di un prodoEo.
Teorema di Bayes
Siano da, K even, E1, E2, …, Ek mutuamente esclusivi e colle>vamente esaus,vi e sia A
un qualunque altro evento, La probabilità condizionata di Ei, dato A, può essere espressa
nel modo seguente :
Capitolo 5. Distribuzioni di probabilità e variabili aleatorie discrete
è È un indice legato alla covarianza, e fornisce una misura dell’intensità della relazione
lineare tra due variabili aleatorie, con valori limita5 tra -1 e +1:
1. Un coefficiente di correlazione uguale a O indica che non c'è una relazione lineare tra due
variabili aleatorie: può tuJavia esistere una relazione di altra natura, ad esempio
quadra>ca. Se le due variabili sono indipenden> il coefficiente di correlazione è uguale a 0.
2. Un coefficiente di correlazione posi>vo indica che, se una variabile aleatoria assume valori
eleva> (bassi), allora l'altra variabile ha una probabilità maggiore di assumere valori eleva>
(bassi) e si dice che le variabili sono correlate posi>vamente (o che esiste una correlazione
direJa). La dipendenza lineare perfeJa posi>va è indicata da un coefficiente di correlazione
uguale a + 1.
3. Un coefficiente di correlazione nega>vo indica che, se una variabile aleatoria assume valori
eleva> (bassi), allora l'altra variabile ha una probabilità maggiore di assumere valori bassi
(eleva>) e si dice che le variabili sono correlate nega>vamente (o che esiste una
correlazione inversa). La dipendenza lineare perfeJa nega>va è indicata da un coefficiente
di correlazione uguale a - 1.
Combinazioni lineari di variabili aleatorie discrete
Valore a<eso di funzioni variabili aleatorie congiunte