Statistica Riassunto

STATISTICA AURORA PUGLIA- UNITA’ 1
LA STATISTICA ATTRAVERSO LE SUE APPICAZIONI

La Statistica, oggi più che mai, è diventata una scienza indispensabile per la lettura e l’interpretazione
della realtà. Fornisce la metodologia e gli strumenti per una corretta impostazione di una ricerca o
un’indagine, ma anche per leggere criticamente e interpretare correttamente le informazioni fornite
da media e pubblicazioni specializzate. È necessario conoscere e comprendere il percorso di una
ricerca o di un’indagine per acquisire queste competenze. Condurre uno studio non è mai un percorso
lineare e privo di ostacoli quanto, piuttosto, una salita con false partenze e vicoli ciechi.
Riprendendo uno schema illustrato da Keppel possiamo articolare il processo in 6 passi. Passi o
fasi che non si sviluppano in modo sequenziale ma, riprendendo un’idea di John Dewey, secondo un
modello circolare che parte dalla percezione dell’esistenza di un problema e della scelta di una
strategia per affrontarlo fino alla valutazione finale che sarà origine o elemento per eventuali indagini
successive.
1. Scelta del problema o del quesito di ricerca: Affrontare uno studio significa porsi quesiti e
cercarne le risposte. La scelta del problema e degli obiettivi dello studio è la fase che concede più
spazi di libertà.
2. Rassegna della letteratura teorica ed empirica disponibile sull'argomento: Dopo aver scelto il
tema e gli obiettivi dello studio, è fondamentale svolgere una rassegna bibliografica degli
studi che hanno affrontato lo stesso problema o di analoghi. Questi studi potranno essere di tipo
teorico o sperimentale. Da entrambi i tipi si possono ricavare informazioni utili per lo studio che si
sta affrontando. Una buona rassegna bibliografica è un passo tanto importante quanto spesso
disatteso. Se in passato condurre una ricerca bibliografica comportava parecchi sacrifici, oggi,
nell’era del digitale, le cose vanno meglio e si può condurre una ricerca e scaricare articoli da
internet attraverso l’utilizzo delle banche dati elettroniche.
3. Definizione delle ipotesi di ricerca: in questa fase diviene fondamentale formulare le ipotesi da
mettere alla prova nello studio. È importante sottolineare che quando un ricercatore conduce una
ricerca molto raramente rileva i dati su tutti i soggetti della popolazione di riferimento ma su un
gruppo più ristretto numericamente, un campione. Spieghiamo con un esempio i due termini:
vogliamo valutare l’utilizzo dei mezzi di comunicazione dei quindicenni italiani. La popolazione di
riferimento è rappresentata dai quindicenni italiani, ma intervistarli tutti sarebbe dispendioso e
difficilmente realizzabile, si preferisce svolgere l’indagine, somministrando un questionario ad un
gruppo di circa 5000 ragazzi (anziché i circa 500.000 che compongono la popolazione), ovvero un
campione, scelti in modo tale da essere un campione rappresentativo della popolazione (ogni
soggetto deve avere la stessa possibilità di essere incluso nel campione) ed estendere poi il risultato
ottenuto all’intera popolazione. È importante, quindi, comprendere che gli studi vengono spesso
condotti sui campioni ma servono per trarre conclusioni sulle popolazioni. Gli exit pool elettorali
sono un altro esempio. Quando, quindi, un ricercatore formula un’ipotesi, egli la formula pensando
alla popolazione e la verifica sul campione.
4. Identificazione del Piano Sperimentale o di rilevazione e Realizzazione dell’esperimento: in
questa fase occorre scegliere quali siano le condizioni più adeguate per condurre lo studio e come
misurare le variabili. Ciò implica la definizione delle variabili d’interesse e la scelta delle modalità di
misurazione delle variabili stesse.
RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

Inoltre, occorre valutare in modo accurato il possibile intervento di variabili di disturbo che possono
compromettere la validità dello studio. Lo sperimentatore, sia durante la fase di progettazione sia
durante la fase di realizzazione dello studio, dovrà cercare di minimizzare l’effetto di tutte le possibili
fonti di errore, cercando di salvaguardare la validità delle sue conclusioni. Una volta definito il Piano
Sperimentale, provvederà alla raccolta dati, alla loro codifica e tabulazione in fogli elettronici che
costituiranno la base dati. È, qui, in questa fase che si entra nel vivo del metodo statistico.
5. Descrizione dei dati mediante statistiche descrittive e verifica delle ipotesi mediante
statistiche inferenziali: Dopo l’immissione dati, bisogna procedere con il controllo della loro qualità
onde evitare di condurre analisi statistiche su una base dati (o matrice dei dati) con errori di
immissione. Questa raccomandazione, è spesso disattesa e non è insolito che i ricercatori si ritrovino
a dover compiere delle analisi più volte, per la presenza di errori nei dati. Dopo aver controllato la
qualità dei dati, si procede, con software più o meno evoluti, al computo delle statistiche e al loro
utilizzo per sintetizzare e descrivere i dati, interpretarli e verificare le ipotesi di lavoro.
6. Preparazione di un rapporto finale: La fase conclusiva di uno studio è la stesura di un resoconto

scritto da comunicare e rendere pubblico. Un buon resoconto deve sempre riportare tutte quelle
informazioni sufficienti a consentire al lettore di condurre a sua volta uno studio identico, quindi:
●rendere trasparente per altri il percorso d’indagine compiuto; ●comunicare i risultati più importanti
ottenuti attraverso l’analisi dei dati; ●effettuare un confronto con i risultati ottenuti da altri studi noti
sullo stesso argomento.
ESEMPIO: una delle raccomandazioni mediche che appaiono sui pacchetti di sigarette dice che
il fumo in gravidanza può provocare danni al feto, nascita prematura, e peso, alla nascita, inferiore
alla norma. Su che cosa si basano tali raccomandazioni? Per studiare gli effetti del fumo, tra il 1960
e il 1967, fu condotto uno studio sulle donne in gravidanza della città di San Francisco. Allo studio
parteciparono 15.000 famiglie. Insieme all’informazione sulle abitudini al fumo della madre, alla
nascita del bambino, venne misurato il peso di 1236 maschi, nati tra il 1960 e il 1961, e che erano
sopravvissuti almeno 28 giorni (oltre ad una serie di altre variabili). Da questa ricerca si sono ottenuti
interessanti risultati sugli effetti del fumo, per esempio, confrontando il peso di neonati provenienti
da madri fumatrici e non fumatrici.
I TERMINI DELLA STATISTICA
FENOMENO COLLETTIVO ED UNITA’ STATISTICA

-I fenomeni collettivi sono quei fenomeni riferibili ad una moltitudine di oggetti in cui interessi
studiare l’insieme degli oggetti nel suo complesso e non i singoli individui. Un esempio può riferirsi
alle scienze naturali dove interessi studiare il comportamento di una specie (e non quello di ogni
singolo individuo della specie), oppure alle vendite di un determinato bene in un periodo fissato, il
reddito dei lavoratori di un certo settore industriale in un certo anno e così via.
-Nel corso di uno studio statistico, si parla di popolazione riferendosi ad un insieme di elementi ben
definiti, che chiameremo individui o unità statistiche, considerati omogenei rispetto ad una o più
caratteristiche legate al fenomeno che si intende studiare: gli “anziani” sono una popolazione
omogenea rispetto all’età, definita generalmente da un limite inferiore (età≥60 anni).
Popolazione statistica ha diversi sinonimi come universo o collettivo. Per poter studiare un fenomeno
collettivo è necessario, in prima analisi, stabilire quali siano gli elementi che costituiscono la
popolazione di interesse.

ESEMPIO: Se vogliamo studiare il fenomeno collettivo “vendite di iPod” in un certo periodo ed in
un certo luogo, esamineremo come popolazione statistica il collettivo degli iPod in quel periodo, nel
luogo prescelto: ogni iPod venduto rappresenta un’unità statistica.
CARATTERE E MODALITA’
Ogni fenomeno collettivo viene studiato mediante l’osservazione di una o più caratteristiche delle
unità statistiche della popolazione di interesse, ognuna delle quali è denotata carattere o variabile,
per sottolineare il fatto che può presentarsi in modo diverso nelle diverse unità statistiche. Ciascun
carattere è presente in ogni unità statistica con una ben determinata modalità.
ESEMPIO: Si consideri un gruppo di atleti iscritti ad una federazione calcistica. Per ogni calciatore
è possibile rilevare una serie di informazioni: età; data di nascita; luogo di nascita; nazionalità;
altezza; peso; pressione arteriosa; frequenza cardiaca; flusso espiratorio forzato ecc.  Tali
informazioni costituiscono i caratteri di ogni unità statistica (calciatore) considerata. Se un calciatore
proviene dal Brasile ed un altro dall’Estonia, si dice che il carattere luogo di nascita presenta nel
primo calciatore modalità “Brasile”, nel secondo “Estonia”. Se i due sono alti entrambi 182, il
carattere altezza si presenta con la stessa modalità “182”.
I caratteri rilevati in ciascuna unità statistica sono generalmente di natura assai diversa. Alcune volte
esprimono delle informazioni qualitative relative ad attributi o qualifiche (come il sesso, il colore dei
capelli, il luogo di nascita) e sono detti qualitativi e vengono in genere contraddistinti mediante
attributi che specificano le proprietà dell’unità a cui si riferiscono. Altre volte esprimono la misura di
qualche grandezza, come il reddito, il peso, l’altezza, ecc., e sono caratteri quantitativi perché hanno
la peculiarità di essere espressi da numeri e risultano da un processo di misurazione che è possibile
sommare e sottrarre fra loro.
-Per tradurre in cifre i caratteri quantitativi occorre definire un processo di misurazione, cioè
occorre stabilire una scala e un’unità di misura da utilizzare per i confronti sulle unità statistiche di
interesse (se si vuole misurare il peso dei neonati, si dovrà decidere se esprimerlo in chilogrammi, in
ettogrammi). È importante sottolineare che ogni misura non è mai esatta, ma è sempre affetta
da un certo margine di errore. Se, nel misurare il peso, si ottiene il valore 2,52, vuol dire
semplicemente che il rilevatore ha osservato una misura che è più vicina a 2,52 anziché a 2,51 o 2,53:
il peso x è un qualche valore compreso in un intervallo centrato su 2,52: 2,52 − a < x < 2,52 + a dove
A è il “margine di errore”.
A volte le misure consistono in semplici conteggi. Si procede in tal modo per la misurazione relativa
al numero delle foglie di una pianta, al numero dei denti, dei vani degli alloggi, degli aerei arrivati in
ritardo un determinato giorno in un certo aeroporto, ecc. Tali caratteri vengono detti quantitativi
discreti.
Altre volte i caratteri quantitativi sono continui, come l’estensione di un certo territorio, la densità
di un gas, la velocità di un veicolo e la loro misura può essere espressa con diversi gradi di precisione,
una volta fissata un’unità di misura, tenendo conto dei sottomultipli, come nel caso citato dei neonati.
-I caratteri qualitativi si distinguono in sconnessi e ordinati. Il sesso di un neonato è un carattere
sconnesso in quanto non esiste alcun ordine tra le modalità maschio e femmina. In tal caso le modalità
del carattere possono soltanto essere confrontate per vedere se sono uguali o meno. Si può, invece,
considerare carattere qualitativo ordinato l’ordine di nascita, ovvero primogenito, o il titolo di
studio di uno dei genitori.
VARIABILI DI STATO E DI FLUSSO

Si definisce variabile di stato una variabile rilevabile in un certo istante di tempo prefissato. Una
variabile è di flusso se per la sua rilevazione è necessario prendere in considerazione due istanti di
tempo per poter valutare le unità statistiche entrate nella popolazione di interesse nell’intervallo
temporale così determinato.
ESEMPIO: Il totale delle camere di albergo di una certa regione è una variabile di stato, perché è
una fotografia della situazione alberghiera nel territorio; mentre il numero dei nuovi posti letto in una
certa regione si può rilevare solo rapportandolo al periodo di tempo in cui tali posti sono stati creati,
quindi, sono una variabile di flusso. Analogamente la popolazione presente sul territorio italiano in
un certo giorno è un collettivo di stato, le presenze alberghiere in un certo giorno (o mese o anno),
sono un collettivo di flusso.
POPOLAZIONE E CAMPIONE
Lo studio statistico può riguardare il fenomeno nella sua globalità, cioè considerare l’insieme di tutti
i suoi componenti, ovvero l’universo o popolazione, oppure solo una sua parte che è detta
campione.
La popolazione può essere limitata o illimitata a seconda che sia costituita da un numero finito o
teoricamente infinito di osservazioni. Nel primo caso è possibile (ma spesso non fattibile) rilevare i
dati su ogni singola osservazione (censimento), ma nella maggior parte delle indagini si rilevano i
dati su un campione (popolazione illimitata).
ESEMPI:
1. Popolazione “limitata” - Una compagnia di assicurazione vuole studiare il fenomeno
collettivo “danni subiti dalle imbarcazioni di carico assicurate”. La definizione dell’oggetto dello
studio identifica la popolazione statistica di interesse che è costituita dalle tutte le imbarcazioni
assicurate (popolazione limitata), ognuna costituisce un’unità statistica. Si ipotizza che il numero di
danni possa dipendere dal tipo di imbarcazione (5 possibili), dall’anno di costruzione e dal tempo di
servizio svolto dall’imbarcazione, quindi, occorre rilevare tutti questi caratteri per ogni unità
statistica. I caratteri considerati sono di tipologie diverse: • Il tipo di imbarcazione è un carattere
qualitativo sconnesso (le possibili modalità possono essere identificate dalle lettere A, B, C, D, E); •
L’anno di costruzione è un carattere qualitativo ordinato e si distinguono 4 diversi periodi (1990-
94, 1995-99, 2000-04, 2005-09); • La durata del servizio è un carattere quantitativo continuo (e può
essere misurata in anni, mesi, giorni). • Il numero di danni è un carattere quantitativo discreto.
2. Popolazione “illimitata” - Una casa produttrice di insetticidi vuole valutarne l’efficacia su
alcuni insetti. Si prende in considerazione un campione che fa parte del numero infinito di
osservazioni possibili (popolazione illimitata). Il campione è costituito dal lotto di terreno su cui si
effettua la sperimentazione. L’unità statistica è rappresentata dalle foglie di ciascuna pianta che
vengono analizzate prima e dopo il trattamento con l’insetticida. I caratteri osservati sono: •Le varie
specie di insetti che si possono trovare sul lotto (mosca del melo, minatrice, ecc.) carattere
qualitativo sconnesso. •La quantità di sostanza, espressa in litri, carattere quantitativo continuo reso
discreto. •I tempi di osservazione è una variabile discreta che assume valore 0 prima della
somministrazione, 1 (dopo 3 giorni), 2 (dopo 6 giorni). •L’effetto è una variabile discreta (e
rappresenta la differenza tra il numero di insetti presenti sotto ciascuna foglia selezionata ai vari tempi
di osservazione).
STATISTICA DESCRITTIVA ED INFERENZIALE

La statistica descrittiva è quella parte della statistica che fornisce criteri, metodi, indici e tecniche
grafiche per sintetizzare e rendere interpretabile e divulgabile il dato raccolto. La statistica
inferenziale è quella branca della statistica che interviene quando dall’osservazione di un fenomeno
sul campione (e dalle ipotesi fatte su un piccolo numero di dati) si vuole risalire alla conoscenza del
fenomeno sull’intera popolazione e alla formulazione di una teoria da utilizzare nelle applicazioni
“fino a prova contraria”.
Le tecniche di statistica descrittiva trovano applicazione sia nel caso in cui vengano raccolti dati
riguardo a tutti gli individui costituenti la popolazione oggetto di studio (come nel censimento), sia
nel caso in cui si raccolgano informazioni solo su campione. Nella statistica inferenziale, come è
facile intuire, non è il campione in sé che interessa bensì la sua capacità di fornire informazioni sulla
popolazione che rappresenta.
In altre parole, la Statistica inferenziale è quella tendente ad interpretare le osservazioni in termini
di modelli teorici che spiegano, nelle linee generali, il meccanismo secondo il quale si producono i
dati esaminati. Sono proprio tali modelli che permettono di generalizzare in modo induttivo i risultati,
ottenuti da campionamento, dall’insieme dei dati osservati alla popolazione di riferimento.
In realtà, la distinzione tra statistica descrittiva e inferenza statistica non ha molto senso perché
la ricerca statistica su qualsiasi fenomeno collettivo è sempre di natura induttiva avendo sempre come
scopo lo studio di un fenomeno complesso a partire da osservazioni comunque particolari o parziali.
STUDI OSSERVAZIONALI E STUDI SPERIMENTALI

I dati raccolti secondo uno schema sperimentale predisposto ad hoc si dicono dati sperimentali;
quelli generati secondo un processo di rilevazione non predisposto dallo sperimentatore sono i dati
osservazionali.
La differenza tra dati osservazionali e sperimentali sta nel fatto che i primi sono prodotti attraverso
un processo che non è stato pianificato da chi li utilizza; i secondi si.
ESEMPI: -Rientrano tra gli studi osservazionali quelli epidemiologici, nei quali vengono presi in
considerazione dati aggregati (popolazioni, comunità, gruppi) derivati, generalmente, da statistiche
correnti con i quali si ricavano informazioni generali sulla diffusione delle malattie e/o dei fattori di
rischio in una popolazione. Un'altra tipologia di studi osservazionali sono gli studi caso-controllo,
con essi si ottengono, in tempi relativamente brevi, informazioni attendibili sui fattori di rischio di
una malattia. Il disegno dello studio prevede che si considerino sempre due gruppi di soggetti: uno di
malati che costituiscono i casi e uno di soggetti aventi le stesse caratteristiche dei primi, dai quali
differiscono solo per la malattia (i controlli), dal confronto è possibile dedurre informazioni su
caratteristiche che possono essere legate alla malattia.
-Tra gli studi sperimentali troviamo, per esempio, le sperimentazioni cliniche e gli studi sul campo.
Con le prime si valuta, seguendo un protocollo ben preciso e regolamentato da norme, l’efficacia di
due o più trattamenti farmacologici o di altro tipo. Negli studi sul campo, invece, si eseguono
interventi preventivi su soggetti a rischio di contrarre una determinata malattia e se ne verifica
l’effetto. Sono inoltre studi sperimentali tutte le rilevazioni a campione per le indagini di mercato,
gli exit poll ecc.
Spesso gli studi osservazionali permettono di formulare quelle ipotesi da sottoporre a verifica
mediante opportune sperimentazioni. Basti pensare alle osservazioni sull’oscillazione dei lampadari
del duomo di Pisa da parte di Galileo che suggerirono la legge di isocronia delle piccoli oscillazioni,
verificata poi da Galileo stesso mediante esperimenti pianificati e condotti in laboratorio.
LE FASI DI UN’INDAGINE STATISTICA

Entrando nello specifico dell’indagine statistica concentreremo l’attenzione su alcune delle fasi
precedentemente elencate, operando un’ulteriore specificazione del percorso, ovviamente si tratta di
un’ipotesi di schematizzazione, nella realtà, i confini tra le varie fasi o sottofasi non sono sempre ben
definiti. Esse sono: pianificazione; rilevazione; elaborazione; presentazione e interpretazione.
LA PIANIFICAZIONE DELLA RICERCA
La pianificazione consiste nella definizione del fenomeno e degli obiettivi dell’indagine,
nell’individuazione del collettivo, delle unità statistiche, nella scelta dei caratteri del collettivo e nella
definizione delle relative modalità (per i caratteri qualitativi) o dei processi di misura (per i caratteri
quantitativi).
ESEMPIO: Si vuole studiare il fenomeno ‘’vendita di televisori nel 2014’’ per individuare i gusti.
Ogni televisore è un’unità statistica. L’unità di rilevazione è il rivenditore. I caratteri di interesse
sono: marca e tipologia (qualitativi sconnessi), dimensione (quantitativo continuo convenzionalmente
espresso in pollici).
Occorre, sempre, pianificare la rilevazione nei minimi dettagli in modo tale che non vi siano
ambiguità di nessun genere. E’ necessario tener conto dei seguenti punti:
a) definire con precisione popolazione, unità di rilevazione e unità statistica, ovvero indicare con
chiarezza una regola che consenta di stabilire se un’unità è o non è un elemento della popolazione di
interesse;
b) stabilire i caratteri quantitativi e qualitativi e definire le relative modalità di interesse e scale di
misura;
c) indicare i mezzi tecnici per raccogliere le informazioni (schede di rilevazione, questionari, ecc.);
d) fissare l’estensione della rilevazione in ordine a tempo, spazio, disponibilità dei mezzi tecnici e
finanziari.
Per quanto riguarda il punto a), la popolazione di riferimento viene determinata nella fase di
definizione degli obiettivi. L’unità statistica e l’unità di rilevazione possono non coincidere. Questo
avviene se l’unità di rilevazione è costituita da più unità elementari, su ciascuna delle quali interessa
raccogliere informazioni (es. nel censimento, l’unità di rilevazione è la famiglia, infatti, in sede di
raccolta delle informazioni, ad ogni famiglia viene fornito un modulo in cui si richiedono notizie su
ciascun componente del nucleo familiare/ unità statistica). Anche nel caso dell’indagine sui televisori,
è verosimile che l’unità di rilevazione sia diversa dall’unità statistica. Dal punto di vista tecnico, lo
strumento di rilevazione è una semplice scheda (cartacea o elettronica) come questa.
LA RILEVAZIONE DEI DATI

La rilevazione è il complesso di operazioni attraverso cui si acquisiscono le informazioni su le
caratteristiche (o caratteri) di interesse per ciascuna unità statistica del collettivo considerato; da
questa fase scaturiscono i dati statistici elementari o grezzi, che entrano a far parte della tabella, che
costituisce la matrice dei dati.
Supponiamo di aver riempito le schede relative ai televisori, la matrice dei dati è una tabella in cui
a ogni riga corrisponde un’unità statistica e su ogni colonna è registrata la modalità o la misura di uno
dei caratteri rilevati. La prima colonna contiene le informazioni che identificano l’unità statistica.
Per agevolare l’archiviazione e le elaborazioni i

caratteri qualitativi, vengono generalmente
codificati attraverso una relazione biunivoca tra le
loro modalità e un opportuno insieme numerico.
ESEMPIO: Se consideriamo la tabella dei dati sui televisori venduti, possiamo porre, ad esempio, le
seguenti corrispondenze: MarcaSony = 1, Samsung = 2 // Tipo CRT = 1, LCD = 2, Plasma=3;
In questo modo la tabella unità/caratteri contiene solo valori numerici (anche il rivenditore può essere
codificato).
L’ELABORAZIONE DEI DATI

L’elaborazione è quel complesso di operazioni attraverso le quali i dati grezzi vengono prima
codificati e poi sintetizzati nei dati derivati più facilmente interpretabili. In alcuni casi è indispensabile
l’elaborazione dei dati elementari come nelle consultazioni elettorali. Quando si svolge una
consultazione elettorale, il risultato è ottenuto mediante lo spoglio di tutte le schede, cioè attraverso
il conteggio dei voti e il successivo calcolo delle percentuali attribuite a ciascun partito. Senza non si
potrebbe stabilire l’esito.
LA PRESENTAZIONE DEI RISULTATI
La presentazione è l’esposizione di grafici, tabelle, ecc., dove sono stati sintetizzati i dati rilevati. Le
tabelle e i grafici mostrati in TV con i risultati elettorali rappresentano un esempio di presentazione
di dati statistici.
L’INTERPRETAZIONE DEI RISULTATI
L’interpretazione è la spiegazione dei risultati, con le osservazioni finali e l’eventuale collegamento
con altre indagini. Riprendiamo in esame i dati relativi ad una consultazione elettorale: questi
vengono presentati su tabelle e grafici e confrontati con i risultati ottenuti in consultazioni precedenti.
Ottenendo, poi, i commenti dei rappresentanti dei Partiti e degli studiosi di politica (politologi), che
non sono altro che interpretazioni.
PRINCIPALI MODALITA’ DI RILEVAZIONE DEI DATI STATISTICI

Le rilevazioni statistiche possono essere continue, quando si svolgono senza interruzioni (quelle
relative alle nascite, ai matrimoni, ai decessi, nonché quelle effettuate dai rilevatori sismici,
meteorologici ecc.).
Sono periodiche le rilevazioni effettuate ad intervalli regolari di tempo, come censimento della
popolazione o delle imprese (ogni 10 anni), i prezzi al consumo nelle città per il calcolo dell’aumento
del costo della vita (ogni mese) ecc. Vengono dette occasionali le rilevazioni effettuate in circostanze
particolari (sondaggi).
Lo strumento di rilevazione varia a seconda dello scopo della rilevazione e del tipo di caratteri da
rilevare:
-Tra i metodi di acquisizione dei dati da popolazioni le cui unità sono connesse all’organizzazione
umana (per esempio: imprese, scuole, aziende agricole, ecc.), particolare rilievo assume l’intervista.
Essa consiste nel rivolgere alcune domande ad alcune unità che compongono la popolazione di
interesse e nel registrare le risposte. Per porre un’intervista le domande vengono raccolte in un
apposito modello detto questionario.
-La struttura del questionario viene opportunamente progettata in relazione alla tecnica di intervista
utilizzata: diretta, auto compilazione, intervista telefonica, ecc. La scelta della tecnica di intervista è
legata agli obiettivi della ricerca, alle caratteristiche della popolazione di riferimento, alle risorse
disponibili ecc.
-Un’altra tipologia di rilevazione è la consultazione di registri, ruoli, archivi, ecc., predisposti in

precedenza, da cui le informazioni sono generalmente estratte attraverso schede di rilevazione.
Attraverso di esse si rilevano alcuni caratteri predeterminati delle unità che formano il collettivo, per
mezzo di “domande” prefissate e fornendo, in molti casi, per ogni risposta, la scelta tra una pre-
individuata rosa di risposte.
LE PRINCIPALI FONTI DI DATI SUL TURISMO

La gestione delle informazioni relative al turismo è affidata ad organismi istituzionali quali: l’ISTAT
(Istituto Italiano di Statistica), l’EUROSTAT (Ufficio di Statistica dell’Unione Europea) e il WTO
(World Tourism Organization). Essi hanno il compito di effettuare indagini e ricerche statistiche
insieme ad Enti, imprese, pa, erogatori di servizi che raccolgono informazioni sul turismo che possono
essere utilizzate come statistiche. Le definizioni principali utilizzate nelle statistiche del turismo sono
valide a livello mondiale. Esse fanno riferimento allo spostamento sul territorio (luoghi diversi da
quelli abitualmente frequentati), alla durata dello spostamento (superiore a 24h e inferiore ad un
anno), il motivo principale dello spostamento (che deve essere diverso dal trasferimento di
residenza e dall’esercizio di un’attività lavorativa; si escludono i movimenti migratori, legati al lavoro
e i trasferimenti di diplomatici e militari, rifugiati, nomadi ecc.).
Una delle principali indagini sull’attività alberghiera si svolge in tre periodi dell’anno: Pasqua,
settimana di Ferragosto e periodo Natale-Epifania. L’indagine è effettuata su un campione di
2.000 alberghi e l’indagine relativa alla “domanda” turistica è effettuata sulla base di un campione:
14.000 famiglie.
Tra le principali Pubblicazioni dell’Istat/Sistan sul turismo ricordiamo le Statistiche: ●sull’offerta
turistica italiana; ● relative alla bilancia dei pagamenti turistica; ●sulla domanda turistica dei viaggi
degli italiani.
LE DISTRIBUZIONI STATISTICHE
ELABORAZIONE DEI DATI E PRESENTAZIONE DEI RISULTATI
Una volta imparato ad impostare un’indagine statistica e a predisporre gli strumenti di rilevazione dei
dati, occorre sintetizzare i dati raccolti, organizzati nella
matrice dei dati grezzi o tavola unità/variabili, mediante
opportune elaborazioni e presentarli in modo chiaro mediante
tabelle, indici statistici e grafici.
ESEMPIO: Ripartiamo dall’indagine sui televisori. I
caratteri, oggetto di indagine, sono: marca televisore, tipo di
televisore, dimensione, angolo di visuale.
Ipotizziamo di aver rilevato i dati su 4 rivenditori nel corso
del 2014, che hanno compilato in totale 30 schede,
riportiamo i dati nella nostra matrice dei dati. Ogni riga
rappresenta un televisore venduto (istanza), identificato da un
numero progressivo da 1 a 30, nelle diverse colonne (campi) si riportano i caratteri di interesse
opportunamente codificati e la lunghezza di ciascun campo del record (lunghezza di ciascun campo
è di quanti numeri è composta la codificazione).
Come si può osservare nella tabella, l’analisi della matrice dei

dati, pur limitata a solo 30 unità e 5 variabili, non rende agevole
la comprensione del fenomeno. È necessario organizzare gli
stessi sotto forma di tabelle.
Fissiamo l’attenzione su uno dei caratteri, in altre parole su una

delle colonne della matrice dei dati. Vogliamo vedere come si
comporta il campione rispetto a tale carattere.
Cominciamo con il considerare il carattere “tipo” (quarta colonna). Quando si considera

l’analisi su una sola colonna della matrice dei dati si dice che stiamo effettuando un’analisi
statistica univariata.
Ci chiediamo: quanti televisori sono stati venduti nel 2014? Di questi, quanti LCD e quanti
tradizionali? Considerando la quarta colonna della tabella e contando il numero di 1 (CRT), 2 LCD)
e 3 (al plasma) che compaiono, otteniamo la seguente tabella:
In altri termini, abbiamo assunto che le unità statistiche della prima
colonna, cui è associata la modalità 1 (rispettivamente 2 o 3) appartengano
allo stesso insieme e in seguito abbiamo contato il numero di elementi di
questo insieme. Nella costruzione di una tabella del tipo mostrato si
definisce frequenza assoluta (si indica con ni) corrispondente ad una certa
modalità il numero di unità statistiche che presenta tale modalità.
In tal modo nell’esempio si è proceduto per la modalità CRT, LCD e plasma. La tabella che mostra
su due colonne affiancate, l’elencazione delle modalità di un carattere e le rispettive frequenze
assolute, si chiama distribuzione di frequenza (assoluta) del carattere considerato, nel nostro
esempio il carattere tipo.
Ad esempio, possiamo vedere che nel corso del 2014, sono stati
acquistati 14 televisori LCD e solo sei televisori tradizionali.
Dividendo ogni frequenza assoluta per il totale delle unità
statistiche considerate (nel nostro caso 30) si ottiene la
distribuzione di frequenza relativa (si indica con i fi), che
possiamo rappresentare nella tabella di fianco.

La distribuzione di frequenza relativa è spesso fornita in forma percentuale. Tale rappresentazione si
ottiene moltiplicando per 100 tutti i valori delle frequenze relative: CRT (tradizionale) 20%, LCD
46,67%, PLASMA 33,33%, TOTALE 100%
Riassumendo diamo la seguente definizione:
●Si definisce frequenza assoluta, corrispondente a una certa modalità del carattere, il numero di
unità statistiche che presenta tale modalità del carattere.
●Si definisce frequenza relativa, corrispondente a una certa modalità del carattere, la proporzione
tra il numero di unità statistiche che presenta tale modalità e il totale delle unità statistiche considerate.
●Si definisce frequenza percentuale, corrispondente a una certa modalità del carattere, la
proporzione tra il numero di unità statistiche che presenta tale modalità e il totale delle unità statistiche
prese in esame moltiplicata per 100.
Prendendo in considerazione il carattere marca, allo stesso modo otteniamo la seguente
tabella.
Nelle tabelle riportate sopra abbiamo costruito alcuni esempi di distribuzione Statistica univariata.
Possiamo ora dare una definizione formale rigorosa: Una distribuzione statistica univariata è una
coppia di insiemi di cui il primo è l’insieme delle modalità o dei valori assumibili dal carattere
considerato, il secondo, in corrispondenza con il primo, è l’insieme costituito dalle frequenze che
ogni valore o modalità presenta nella matrice dei dati considerata. Le frequenze possono essere
rappresentate in forma assoluta, relativa o percentuale. La distribuzione statistica fornisce un modello
più compatto di rappresentazione dei dati che risultano, pertanto, più organizzati e quindi più leggibili.
Proviamo ora a considerare il carattere
“dimensione” espressa in pollici. La tabella
associata a tale carattere riportata a fianco, come si
può vedere, di non è di facile lettura, perché troppo
analitica. Per renderla più leggibile è necessario
procedere con il raggruppamento dei dati in classi.
Scegliamo di costruire le classi chiuse sia a sinistra sia
a destra, vuol dire che gli estremi della distribuzione
sono compresi nella classe. Ad esempio, nella classe
43|__|46 sono state inserite le frequenze relative ai
televisori che vanno da 43 pollici a 46 pollici.
Tuttavia, si possono costruire classi aperte o chiuse
(nel primo caso gli estremi inferiore e superiore sono
esclusi dalla classe, nel secondo caso sono compresi). Si possono costruire anche classi aperte
(chiuse) a sinistra e chiuse (o aperte) a destra. Per indicare se la classe è chiusa si utilizza una
barra verticale.

OSSERVAZIONE
Raggruppare i dati provoca una perdita d’informazione, non risultano più distinti tra loro i valori
che cadono all’interno di una stessa classe. La perdita di informazione è maggiore quanto più grande
è l’ampiezza della classe. La tabella per dati raggruppati, però, è molto più leggibile ed è più facile
darne una descrizione sintetica.
Ci chiediamo ora: quanti televisori sono stati venduti di dimensione
minore di 38 pollici, oppure, maggiore di 51? Per rispondere alla
prima domanda occorre sommare le frequenze minori di 38, nella
tabella avremo: 5 + 2 + 4 = 11 televisori, nel secondo caso, avremo 4
televisori. Operando sulla tabella otteniamo la nuova tabella delle
frequenze assolute cumulate e percentuali (si indicano,
rispettivamente, con Ni e Fi).
Si dice distribuzione di frequenza cumulata di un carattere, la distribuzione che associa ad ogni
valore, la frequenza (assoluta, relativa o percentuale) dei valori osservati minori o uguali.
Operativamente, la frequenza cumulata, indicata con Ni, è la somma delle frequenze corrispondenti
a tutti i valori minori o uguali del valore considerato.
In modo analogo alle frequenze, anche le frequenze cumulate possono essere relative oltre che
percentuali, la distribuzione che si ottiene si chiama funzione di ripartizione empirica.
RAPPRESENTAZIONI GRAFICHE
Una volta effettuata l’analisi di frequenza è necessario rappresentare graficamente i risultati.
IL DIAGRAMMA A BARRE
Un diagramma a barre consiste in una successione di colonne, segmenti verticali o rettangoli che
indicano le modalità del carattere la cui altezza è uguale o proporzionale alla frequenza
(assoluta/relativa/percentuale) della modalità corrispondente. Tale grafico è particolarmente adatto a
rappresentare le distribuzioni di caratteri qualitativi. Si può usare, nello stesso tempo, per
rappresentare la distribuzione di un carattere quantitativo discreto. Se il carattere è ordinato bisogna
disporre le colonne seguendo lo stesso ordine delle modalità del carattere se, invece, il carattere è
sconnesso è opportuno disporre le colonne a partire dalla più grande e finendo con la più piccola, o
viceversa.
Spesso si confonde il diagramma a barre con l’istogramma che invece può essere utilizzato solo se si
hanno caratteri quantitativi raggruppati in classi.

L’ORTOGRAMMA
Nell’ortogramma un punto in un piano è individuato con un segmento e
con l’ampiezza di un angolo. Dato un punto O (fig. accanto) chiamato
origine delle coordinate polari, ed una semiretta di origine O, detta asse
polare, ogni punto A del piano è definito dal valore del segmento OA, detto
raggio vettore e dall’ampiezza dell’angolo α
detta anomalia. Ogni dato statistico può, pertanto, essere rappresentato
per mezzo di due elementi: lunghezza del raggio e ampiezza
dell’angolo. L’ortogramma è particolarmente indicato per
rappresentare fenomeni ciclici. Si divide l’angolo giro nel numero
delle modalità atte a rappresentare il fenomeno statistico (giorni
settimana, stagioni, mesi ecc.) si misurano sui raggi vettore le intensità
del fenomeno o le frequenze corrispondenti alle modalità considerate.
Si possono unire poi i punti su ciascun raggio con segmenti o curve
chiuse. Il grafico sottostante è costruito con i dati mensili dei
matrimoni celebrati in Italia nel 2006.
DIAGRAMMI A SETTORI CIRCOLARI O A TORTA

I diagrammi circolari sono idonei per rappresentare sia fenomeni
qualitativi che quantitativi se il numero delle modalità del carattere
non è troppo elevato. Si deve dividere l’angolo giro, che si fa
uguale all’intero fenomeno, nelle sue diverse modalità, in
proporzione alle intensità o frequenze relative di ciascuna modalità
del fenomeno. Ne deriva che i vari settori circolari ottenuti dalle
ripartizioni sono proporzionali alle intensità o frequenze delle
modalità del fenomeno considerato.
L’ISTOGRAMMA
Nel caso di caratteri quantitativi continui non ha più senso parlare della
frequenza di un singolo valore, poiché non è possibile osservare con
esattezza quel dato valore. Il carattere viene raggruppato, pertanto, per
classi di ampiezza e ne viene data una rappresentazione grafica
attraverso l’istogramma: in ascissa si riportano le classi, adiacenti e
rispettando la loro ampiezza, l’area di ogni rettangolo è rappresentata
dalla frequenza assoluta o relativa. L’altezza di ogni istogramma deve
essere uguale alla densità di frequenza (data dal rapporto tra frequenza assoluta o relativa e ampiezza
della classe). È ovvio che qualora le classi abbiano la stessa ampiezza (caso più comune), per l’altezza
degli istogrammi si può usare indifferentemente la frequenza relativa o assoluta senza il rischio di
errori di rappresentazione.

Consideriamo i dati riportati nella tabella qui a fianco riferiti al voto all’esame di statistica di 30
studenti. Le classi utilizzate sono aperte a destra e chiuse a
sinistra (lo studente con un voto pari a 24 si troverà nella classe
24-27 e non 20-24). Come si può osservare, si tratta di classi di
ampiezza diversa. La classe 28 e oltre viene riferita
all’intervallo 28-30, essendo 30 il massimo voto. Per prima
cosa, sarà necessario calcolare l’ampiezza di ciascuna classe
per poter individuare la base di ciascun rettangolo. Una volta
calcolata l’ampiezza si potrà misurare la densità (altezza) di
ciascuna classe, dividendo la frequenza di ogni classe per
l’ampiezza della classe stessa.
Dal momento che l’occhio percepisce meglio l’andamento di
un fenomeno se è rappresentato con una linea, si possono
considerare i punti medi della base superiore di ciascun
rettangolo di un istogramma o di un diagramma a barre e unirli
con una spezzata, ottenendo così la spezzata delle frequenze
o poligonale di frequenza.
IL CARTOGRAMMA
I cartogrammi sono utilizzati quando si deve rappresentare un fenomeno secondo una ripartizione
territoriale. In questo caso si preferisce utilizzare una carta geografica. L’andamento del fenomeno è
evidenziato mediante diverse colorazioni delle aree territoriali secondo una scala di graduazione
opportunamente riportata sul cartogramma.
L’IDEOGRAMMA
Gli ideogrammi sono rappresentazioni grafiche effettuate
con figure reali schematizzate che traducono, in modo
visivo, la natura del fenomeno considerato. Sono facili da
comprendere ma difettano in precisione. I simboli
rappresentativi dell’intensità o frequenza delle modalità del
fenomeno sono tali che la loro dimensione è proporzionale
all’intensità o frequenza delle modalità stesse. Si possono, inoltre, avere più figure ripetute, tutte di
uguale dimensione, alle quali attribuire un determinato valore. Nel grafico è rappresentata la stima
del numero di personal computer nel 2099 in ciascun continente.

STATISTICA AURORA PUGLIA- UNITA’ 2- INDICI DI POSIZIONE
VALORI SINTETICI
INTRODUZIONE
Gli indici statistici descrittivi hanno lo scopo di mettere in luce particolari aspetti di una
distribuzione statistica e sono ritenuti utili per la soluzione di determinati problemi. Vengono
utilizzati come sintesi dell’informazione fornita dalla distribuzione, di cui sono considerati valori
rappresentativi.
Un valore rappresentativo di un’intera distribuzione, per esempio un valore attorno a cui i dati si
“addensano”, viene denominato indice di posizione. La conoscenza di un indice di posizione non
può sostituire, in ogni circostanza, quella dell’intera distribuzione. Poiché distribuzioni diverse
possono dare luogo ad uno stesso indice di posizione, è opportuno disporre almeno di un ulteriore
indicatore il quale misuri la complessiva distanza dei valori della distribuzione; esso viene
denominato indice di dispersione.
Osserviamo i due diagrammi a

barre riportati in alto, entrambe
le distribuzioni rappresentate
hanno media uguale a 6, ma
dispersione diversa: la prima a
sinistra risulta meno dispersa
rispetto alla seconda.
INDICI DI POSIZIONE
Gli indici di posizione sono anche detti medie e si distinguono in medie analitiche e di posizione.
Le medie analitiche si possono applicare soltanto a caratteri quantitativi e sono calcolate mediante
operazioni algebriche a partire dalle misure osservate. Le medie di posizione richiedono operazioni
quali l’ordinamento ed il confronto dei dati ed esse possono essere applicate sia a caratteri qualitativi
ordinati che a caratteri quantitativi.
La moda è l’unico indice che può essere utilizzato anche per caratteri qualitativi sconnessi.
Sono medie analitiche: media aritmetica, media armonica e media geometrica. Sono medie di
posizione: mediana, quartili e moda.
LE MEDIE ANALITICHE
MEDIA ARITMETICA
La media aritmetica, o semplicemente media, fornisce una misura dell’intensità complessiva del
fenomeno ripartita in maniera esatta fra tutte le osservazioni. La media aritmetica di n misure: valori
o dove il simbolo ∑ (detto sommatoria) indica la somma dei termini xi,

attribuendo ad i, successivamente, tutti i valori compresi tra 1 ed n.

x1, x2, x3 ,……, xk è il numero reale M che si ottiene dividendo la loro somma per il numero n dei
dati stessi. Si può anche scrivere:
Esempio: La media aritmetica dei seguenti valori: 7, 13, 21, 40, 100 è data dalla somma di detti
termini (x), divisa per il loro numero (n), cioè: M = 36,2
o, in formula più compatta

M= (7X5)+(13X5)+(21X5)+
+(40X5)+(100X5)/25=36,2
Più in generale, se in una distribuzione il valore xi compare con la frequenza ni (i= 1,2, …, k) dove
k rappresenta il numero delle modalità del carattere, in modo che risulti n1 + n2 + n3 +... + nk = n ,
si può applicare la seguente formula:
MEDIA ARITMETICA PONDERATA

La media aritmetica calcolata utilizzando le frequenze si chiama media aritmetica ponderata dei k
valori x1, x2, x3 ,……, xk di pesi rispettivi n1 , n2 , n3 ,……., nk.
Se i dati sono organizzati in classi, per calcolare la media è necessario cercare il valore centrale di
ciascuna classe, operando prima la semisomma dei due estremi e poi procedendo come nel caso della
distribuzione di frequenza. Il ricorso al valore centrale della classe equivale ad ipotizzare che la
frequenza del carattere sia concentrata su tale valore. Ad esempio, se 1.500 individui appartengono
alla classe di età 0- 14, ai fini del calcolo della media significa che si attribuisce agli individui un’età
pari a 7 (semisomma delle età 0 e 14).
ESEMPIO: Riprendiamo la nostra indagine sui televisori venduti e calcoliamo la media aritmetica
della variabile “dimensione del televisore” a partire dalla distribuzione per classi.
MODALITA’: le classi sono divise in base ai pollici del

televisori acquistati (es. la prima classe 14-26 sono i
televisori dai 14 al 26 pollici):
FREQUENZA ASSOLUTA (ni): è la quantità di televisori
venduti (es. nella prima riga capiamo che i televisori
acquistati da 14 a 26 pollici sono stati 5);
VALORE CENTRALE (xi): è il valore medio tra i due estremi
della classe (es nella prima classe 14-26 si fa 14+26=40 e
poi 40/2=20)

La dimensione media dei televisori venduti è pari a 39 pollici.
Ovviamente se si calcola la media aritmetica a partire dalla
distribuzione semplice (cfr. tabella qui accanto) si ottiene, in
generale, un valore diverso da quello che si è ottenuto con la
distribuzione per classi. Nel nostro caso la dimensione media
risulta pari a 39,63 pollici. Si conferma quanto avevamo
sottolineato sulla perdita di informazione nel passaggio dal dato
semplice alla distribuzione per classi.
SCARTO DALLA MEDIA

Dati i valori x1, x2, x3 ,……, xk e la loro media aritmetica M, si definiscono scarti dalla media le
differenze: x1-M; x2-M; x3-M … xn-M.
La media aritmetica, comunque calcolata, gode delle seguenti proprietà:
-La media aritmetica è sempre compresa tra gli estremi della distribuzione: X1 ≤ M ≤ xn
-La media aritmetica è tale che la somma degli scarti da essa è nulla, ossia: , infatti si ha:
-Dati due insiemi di misure: x1, x2, x3, ……, xk e y1, y2, y3, ……, yn la media aritmetica delle somme
x1 + y1, x2 + y2, x3 + y3, ……, xn+ yn è uguale alla somma delle medie aritmetiche dei due insiemi di
misure, come si ricava banalmente.

-Fra le varie somme che si ottengono addizionando i quadrati degli scarti fra i termini di una
successione ed un valore qualsiasi è minima quella in cui coincide con la media aritmetica M,
dei termini della distribuzione.

La proprietà della media aritmetica (per cui la somma degli scarti dalla media è nulla) rende
necessario, per misurare poi la dispersione del fenomeno, ricorrere alla proprietà su indicata, la quale
garantisce che il risultato ottenuto, utilizzando la media aritmetica, sarà il più piccolo possibile. È
proprio questa proprietà che è alla base della costruzione degli indici di dispersione più diffusi in
statistica: varianza e deviazione standard.
MEDIA ARMONICA
Data la distribuzione di n valori x1, x2, x3, ……, xk non nulli, di un carattere quantitativo, si dice
media armonica di tali valori, il reciproco della media aritmetica dei reciproci dei valori dati.
La media armonica non gode di alcuna delle proprietà che caratterizzano la media aritmetica. Essa
viene utilizzata quando i termini di un fenomeno sono il reciproco di un altro di cui si conoscono già
i dati. Un esempio tipico è il potere d’acquisto della moneta che è uguale al reciproco del prezzo della
merce, quindi, per trovare il potere d’acquisto medio si calcola la media armonica dei prezzi.

ESEMPI: ●Un bene ha, su vari mercati, i seguenti prezzi: 9,5 10 12 13,5 15. Calcoliamo il potere
d’acquisto medio rispetto a 1 euro. I relativi poteri d’acquisto riferiti a 1 euro sono: 0,105 (1/9,5)
0,100 (1/10) 0,083 0,074 0,067 e la loro media aritmetica semplice è:
il cui reciproco è 1,16 che ci fornisce il prezzo medio nei 5
mercati, applicando direttamente la media armonica:

●Un altro caso in cui viene utilizzata la media armonica è la velocità media che si calcola come
media armonica delle velocità registrate, in quanto il reciproco della velocità è uguale al tempo
occorso per un’unità di spazio. Dobbiamo determinare la velocità media impiegata per percorrere la
distanza di km 500 da tre auto, conoscendo i tempi impiegati da ciascun veicolo: Prima auto (5h
20m 10’), seconda (5h 00m 5’) e terza (4h 58m 30’). Calcoliamo la media armonica dei tempi
impiegati, ottenendo il tempo medio.
Dalla formula della velocità
MEDIA GEOMETRICA
Dati n valori positivi x1, x2, x3, ……, xk che rappresentano le misure di un carattere quantitativo, si
dice media geometrica semplice la radice n-esima aritmetica del loro prodotto:
Come considerato per la media aritmetica, nel caso in cui le misure siano fornite mediante
distribuzione di frequenza in cui il valore xi compare con la frequenza ni (i =1, 2, ..., k), avremo
che: se x1è presente n1 volte, dovendo eseguire un prodotto, si dovrà moltiplicare x1 n1 volte,
questo coincide con l’elevare alla n1 il valore 1x, questa proprietà vale per tutti i termini.
Essendo n= n1+ n2+ … nk.

L’impiego della media geometrica dipende dalla natura del problema, essa è più adatta quando si
richiede un indice che consenta una equiripartizione del prodotto dei termini. In generale la usiamo
nel caso in cui i dati rappresentano un fenomeno che abbia una tendenza ad aumentare o diminuire in
progressione geometrica.
La media geometrica dei reciproci è uguale al reciproco della media geometrica.
Esempio: Si sono rilevati i prezzi al consumo delle mele verdi in quattro città. Calcolare il prezzo
medio tramite la media geometrica 

LE MEDIE DI POSIZIONE
MODA
Nel modo comune di dire ‘’quest’anno va di moda” significa indicare qual è la tendenza comune alla
maggioranza degli individui. In statistica la moda di una serie di n dati è il valore che presenta la
maggior frequenza. Nel caso di dati raggruppati in classi è la classe k che presenta la maggiore
frequenza. Può essere calcolata sia per dati qualitativi che
quantitativi. Può accadere che nessuna classe o nessun valore sia più
frequente di altri, come pure che due classi abbiano frequenza più
elevata (comportamento bimodale).
Esempio: Riprendiamo l’indagine sui televisori e calcoliamo la
moda della distribuzione “tipo”. Come si può facilmente notare il
valore di massima frequenza appartiene alla modalità LCD con 14
televisori venduti. La moda è il tipo LCD che ha avuto le vendite maggiori.
MEDIANA
La mediana, detta anche valore centrale o mediano, di una serie di n dati ordinati è rappresentata
dal valore centrale (se n è dispari) o dalla media aritmetica dei due valori centrali (se n è pari).
La mediana ha il compito di separare le osservazioni in due parti esattamente uguali (un 50% di valore
inferiore e un 50% di valore superiore alla mediana stessa).
Se la distribuzione è semplice basta disporre i termini in ordine crescente o decrescente e individuare:
●se n è dispari il valore centrale: 20, 25, 32, 33, 50 (32 è la mediana)
●se n è pari non esiste un valore centrale: 15, 21, 25, 32, 33, 40 (nella distribuzione riportata in alto,
composta da 6 termini, non abbiamo un termine centrale, bensì due: 25 e 32, la mediana si ottiene
calcolando la media aritmetica dei due termini 25+32/2=28,5
Osservazione:
In generale ●se n è dispari la mediana è rappresentata dal termine che occupa il posto;
●se n è pari la mediana è rappresentata dalla media aritmetica dei termini che si trovano a
Nel caso di distribuzione di frequenza è opportuno ricorrere alle frequenze cumulate- ESEMPIO:
Calcolare la mediana dei voti all’esame di statistica di 25 studenti riportati nella seguente
tabella.
Essendo n = 25, la mediana si troverà a = 13° posto, dall’esame delle
frequenze cumulate si può osservare che il tredicesimo studente si trova tra quelli
che hanno preso 20. Quindi il valore mediano è pari a 20.
QUARTILI, PERCENTILI
In un insieme di n dati ordinati la mediana è stata definita come il valore che separa l’insieme in due
parti uguali. Estendendo tale concetto, possiamo definire i valori che separano l’insieme in 4, 10 o
100 parti uguali: parleremo rispettivamente di quartili (Q1, Q2 e Q3) e percentili (P1, P2, …, P99).

In generale tali indici possono essere chiamati quantili.
La mediana è un unico valore, i quartili sono 3, i percentili 99. La mediana coincide con il 2°
quartile (e quindi con il 50° percentile).
ESEMPIO: Data la seguente distribuzione di 5 termini: 1, 1, 2, 3, 4.
Per poter determinare i quartili occorre portare la distribuzione ad un numero di termini divisibile
per 4, moltiplico ciascun termine per 4 ne ottengo una simile di 20 termini:
▪Il 1° quartile, essendo n pari, sarà la semisomma tra , cioè tra il 5° e 6° termine.
▪Il 2° quartile, essendo n pari, sarà la semisomma tra: , cioè tra il 10° e 11° termine.
▪Il 3° quartile, essendo n pari, sarà la semisomma tra: , cioè tra il 15° e 16° termine.
Cioè: Q1 =1, Q2 = 2 e Q3 = 3
INIDICI DI DISPERSIONE
È opportuno completare la descrizione del collettivo, utilizzando indici che permettano di valutare la
variabilità delle osservazioni. I principali indici di dispersione (o di variabilità) sono: campo di
variazione, varianza, deviazione standard, scarto semplice medio e coefficiente di variazione.
Tali indici sono utilizzati per sintetizzare di quanto la distribuzione statistica sia addensata attorno ad
una misura di localizzazione.
IL CAMPO DI VARIAZIONE
Il campo di variazione (range) è dato semplicemente dalla differenza tra il valore più grande e quello
più piccolo del campione.

Esempio: Due aziende (A e B) producono succhi di frutta in bottiglie della capacità di 1 litro. Si
prendono a caso in esame 5 bottiglie dei succhi A e B e si rileva, il contenuto di ciascuna
bottiglia:
Come si vede, la media dei due campioni

è del tutto identica e vale esattamente 1 litro. Il semplice calcolo del campo di variazione [che vale:
CV(A) =1.06 − 0.94 = 0.12 CV(B) =1.14 − 0.88 = 0.26] permette di dire che, in base ai campioni
raccolti, il contenuto effettivo delle bottiglie del campione B presenta una maggiore variabilità di
quello di A.
LO SCARTO INTERQUARTILE
Lo scarto interquartile è dato dal valore assoluto della differenza tra il 3° e il 1° quartile: .
Esso delimita la zona centrale della distribuzione che contiene il 50% delle osservazioni. Anche noto
come campo di variazione interquartile è un’altra misura di variabilità non influenzata dai valori
estremi.

Il grafico, denominato Box-plot, rappresenta in modo compatto la
distribuzione statistica attraverso alcuni indici sintetici:
●Indici di posizione (misurati con la mediana ed i quartili):
rappresentati nel grafico con una linea all’interno del box
(mediana) ed i due estremi del box stesso (primo e terzo quartile).
●Indice di variabilità (misurato con la differenza interquartile):
rappresentato dalla base del rettangolo (box).
Sono inoltre, riportati: il valore minimo della distribuzione (primo segmento verticale) e il valore
massimo (ultimo segmento verticale). La dimensione dell’altezza (o base se messo in verticale) del
rettangolo non rappresenta alcuna informazione, come pure la posizione del Box-Plot.
ES.: Supponiamo di voler confrontare il peso alla nascita (in once) di neonati da madri fumatrici e non.
Il box-plot è un ottimo strumento per

visualizzare le diff. tra i due gruppi.
Nella tabella sono riportati i pesi

relativi ai neonati provenienti da
madri fumatrici e non; i neonati di
madri fumatrici hanno mediamente
un peso alla nascita inferiore rispetto
a quello delle madri non fumatrici.
Tutti e tre gli indici di posizione (Q1,
Q2 e Q3) sono minori nel gruppo dei
neonati provenienti da madri
Osservazione: Anche se il campo di variazione è un indice di variabilità
fumatrici.piuttosto elementare,
La variabilità dei pesi, in molti
processi produttivi è l’unico indice utilizzato come elemento di controllo
misurata del interquartile
con lo scarto processo stesso.
Indipendentemente dalla variabilità che caratterizza le unità risulta
prodotte,
maggiore rispettoproduttivo
il processo ai neonati disarà
ritenuto soddisfacente solo se le misure ricadranno madri all’interno del range prefissato.
non fumatrici.
Se, però, si vuole tenere conto anche dei valori intermedi occorre utilizzare qualche altro strumento.
La p0rima cosa che viene in mente è di “misurare” quanto i singoli valori differiscano dalla media
della distribuzione. Supponiamo che la media in questione sia la media aritmetica (ma può essere un
altro valor medio qualsiasi). Possiamo calcolare gli scarti dalla media cioè le differenze fra ciascun
valore osservato e la media aritmetica. Poiché la media è compresa fra il valore più piccolo e quello
più grande, alcuni scarti sono positivi e altri negativi.
Esempio: Calcoliamo gli scarti dalla media aritmetica per i dati delle due aziende produttrici di
succhi di frutta. Per calcolare gli scarti basta sottrarre ad ogni valore riportato in tabella il valore
della media. Considerando questa tabella:
Si ottiene questa:
E osserviamo che il valore assoluto dei singoli scarti risulta maggiore per i gruppi in cui le misure
mostrano maggiore variabilità e che, comunque, la somma degli scarti risulta sempre nulla (per una
nota proprietà della media aritmetica).
LA VARIANZA
Quanto detto finora indica che la variabilità e gli scarti sono fra loro legati e che, quindi, si può pensare
di misurare la variabilità di un fenomeno statistico considerando e sintetizzando la distribuzione degli
scarti. Posto ciò, resta il fatto che tale sintesi non può essere fatta calcolando semplicemente la media
degli scarti, dato che questa è nulla in quanto scarti positivi e scarti negativi si vanno a compensare:
anziché considerare la media degli scarti consideriamo la media degli scarti al quadrato (perché
elevando al quadrato ciascuno scarto diviene positivo). Questo indice si chiama varianza.
La varianza è un indice usato per misurare la dispersione o variabilità, cioè l’addensamento maggiore
(poca dispersione o variabilità) o minore (molta dispersione) dei dati attorno alla media aritmetica.
Le proprietà della varianza:
▪La varianza è sempre positiva.
▪La varianza è uguale a zero solo se la variabilità è nulla. In questo caso, si ha: x1 = x2 = .... = xn = M
e, quindi tutti gli addendi che figurano al numeratore della precedente relazione sono uguali a zero;
viceversa, se la varianza è uguale a zero, essendo il numeratore somma di termini tutti non negativi,
è necessario che questi siano tutti nulli.
▪La varianza è tanto più elevata quanto più elevata è la variabilità. Se la variabilità è più elevata, i
termini al numeratore tenderanno ad essere più grandi.
Esempio: Calcoliamo la varianza dei due campioni di bottiglie di succo di frutta:
Come si può facilmente osservare tali indici non sono più espressi in litri, avendo elevato ogni scarto
al quadrato. Si conferma la maggior variabilità del campione B.
Nel caso, invece, di una distribuzione di frequenza per calcolare la varianza è necessario
moltiplicare ciascuno scarto per la relativa frequenza. Esempio: Calcoliamo la varianza per il
carattere: voto conseguito all’esame di statistica dei 25
studenti considerati. Per calcolare la varianza facciamo
riferimento alla formula nel caso
di distribuzione di frequenza.
Il valore medio risulta, dalla
formula sopracitata:
M: 530/25= 21,2

LO SCARTO QUADRATICO MEDIO
Per misurare il grado di variabilità di una distribuzione, è preferibile, calcolare la radice quadrata
(positiva) della varianza. Infatti, lo scarto quadratico medio, o scostamento quadratico medio o
scarto standard si ottiene dal calcolo della radice quadrata della varianza: .
Utilizzando lo scarto standard ci si riconduce ad un indice di variabilità espresso nella stessa unità
di misura della variabile considerata. Come per la varianza, maggiore è la variabilità dei valori di un
insieme di dati e maggiore è la deviazione standard, la quale assume valore nullo solo nel caso in cui
tutti i valori siano uguali.
Osserviamo che si potrebbero, in teoria, definire altri indici di dispersione. Il motivo della scelta
privilegiata della deviazione standard è nella proprietà di minimo della media quadratica, relativa alle
variabili scarto, rispetto alla media aritmetica, la quale rende particolarmente significativo ed utile σ
come indice di dispersione.
Esempio: Calcoliamo lo scarto quadratico medio o deviazione standard dei due campioni A e B.
σ(A) = √0,0018= 0.04234 // σ2(B) =√0,00916= 0.0957
GLI SCOSTAMENTI SEMPLICI MEDI
Altre misure di variabilità sono gli scarti semplici medi che si ottengono come media aritmetica
delle differenze, in valore assoluto, tra i valori osservati x1, x2, x3, ……, xn di una variabile x e un
indice di posizione.
A seconda della media scelta si può ottenere uno specifico scarto semplice medio:
-Se, esempio, come media scegliamo la media aritmetica M, si ha lo scarto semplice medio dalla
media aritmetica
-Come la deviazione standard, anche questo indice di dispersione è omogeneo e si annulla solo
quando tutte le unità presentano la stessa modalità. Se invece di considerare le differenze dalla media
aritmetica consideriamo quelle dalla mediana otteniamo lo scarto semplice medio dalla mediana
Questo è ancora un indice omogeneo e, inoltre, gode di una proprietà di minimo

analoga a quella di cui gode σ rispetto alla media.
Proprietà: la somma degli scarti in valore assoluto dalla mediana è un minimo

IL COEFFICIENTE DI VARIAZIONE
Tutti gli indici presentati, non consentono di effettuare confronti essendo legati all’unità di misura
attraverso la quale è espresso il fenomeno. Chiaramente la variabilità delle misure non dipende
dall’unità di misura utilizzata, così per rendere più facilmente confrontabili le misure della
dispersione si costruisce il coefficiente di variazione.
Il coefficiente di variazione che si indica con CV, è il rapporto tra il valore dello scarto quadratico
medio e il valore della media. L’indice ottenuto è un numero puro indipendente dall’unità di misura
utilizzata.

Esempio- In un collettivo in cui sono state rilevate le stature e i pesi, risulta:
Quale delle due distribuzioni è più dispersa? Risulta più variabile il peso o
la statura? Calcoliamo il coefficiente di variazione nei due gruppi:
Come si può notare, c’è una maggiore variabilità per la variabile peso rispetto all’altezza (quasi
il triplo).
LA FORMA DI UNA DISTRIBUZIONE

Gli indici di posizione e di variabilità di una distribuzione di frequenza non esauriscono le
informazioni contenute nei dati. Un altro aspetto da prendere in considerazione è la forma.
Quando si parla di forma ci si riferisce, in particolare a due aspetti: ▪La simmetria o meno di una
distribuzione rispetto al centro di gravità o media aritmetica; ▪Il grado di appiattimento della
distribuzione, attorno al suo centro di gravità, rispetto ad una distribuzione particolare che viene
chiamata distribuzione normale e che vedremo in dettaglio più avanti.
Per avere un’idea della simmetria di una distribuzione basta guardare la curva riportata al centro, in
una distribuzione di questo tipo media aritmetica, mediana e moda coincidono.
-Si ha una forma simile al grafico a destra
quando c’è un’asimmetria positiva o una coda
destra, esistono cioè un maggior addensamento
dei dati in corrispondenza di valori inferiori alla
media.
-Nel caso rappresentato dal primo grafico, al
contrario, abbiamo una coda a sinistra o
un’asimmetria negativa dovuta alla presenza di
un maggior addensamento dei dati per valori
superiori alla media aritmetica.
Il maggiore o minore addensamento dei dati

attorno al valore centrale fa assumere alla
curva una forma più o meno appuntita.
RIEPILOGO FORMULE

STATISTICA AURORA PUGLIA- UNITA’ 3- RAPPORTI STATISTICI
I valori relativi ad un fenomeno, ottenuti con i vari strumenti finora trattati, hanno un carattere
assoluto e, pur avendo un alto grado di efficacia nel descrivere il fenomeno stesso, ne esprimono
soltanto misure assolute di intensità e frequenza. Se questi valori assoluti vengono confrontati con
altri non statistici relativi allo stesso fenomeno otteniamo dei valori relativi che sono di grande utilità
per lo studio comparativo.
La costruzione dei rapporti statistici permette di effettuare confronti territoriali o temporali tra
fenomeni.
I rapporti statistici si possono dividere in due classi:

▪rapporti che si semplificano se l’operazione di divisione dà luogo ad un concetto analogo a quello
espresso da uno dei due termini della frazione;
▪rapporti che si risolvono se dà luogo ad un concetto diverso da quello espresso.
1.RAPPORTI CHE SI SEMPLIFICANO

RAPPORTI DI COMPOSIZIONE
È quello che si stabilisce tra le intensità/frequenze di un carattere/modalità di un fenomeno e le
intensità/frequenze del complesso dei caratteri/modalità dello stesso fenomeno.
ESEMPIO:
esprime il numero di arrivi in alberghi a

5* rispetto a cento turisti arrivati in Italia in un determinato periodo.
Detto rapporto è di composizione in quanto si sono messe a confronto le frequenze di una modalità
del carattere al totale del fenomeno. È il rapporto che si calcola più frequentemente e dà l’idea della
parte rispetto al tutto.
RAPPORTI DI UNITÀ
A differenza dei rapporti di composizione, dove il confronto è fra una parte del fenomeno e tutto il
fenomeno stesso, nel rapporto di unità il confronto viene istituito fra due dati ottenuti dalla
scomposizione di un dato statistico in relazione alle sue modalità.
ESEMPIO: Qui sono riportati gli arrivi e le presenze in Italia e in due regioni, distinti in italiani
e stranieri.

Risulta molto utile calcolare i rapporti di
unità che si ottengono nel seguente
modo:
(in Friuli gli arrivi di

stranieri sono il 79,9% rispetto agli
italiani)
(In Italia le presenze di

stranieri sono il 68% rispetto agli italiani)
RAPPORTI DI FREQUENZA O DENSITÀ

In questi rapporti si confronta un dato statistico e una grandezza non statistica. In generale il fenomeno
non statistico è una misura di spazio o di tempo.
Nelle statistiche del turismo è un rapporto di frequenza il numero di esercizi ricettivi / superficie
molto utile per confrontare l’offerta alberghiera.
Se la grandezza non statistica, assunta come base del rapporto, è di natura temporale, il rapporto
prende il nome di rapporto di frequenza.
ESEMPIO- In Italia nel 2007 si sono immatricolate 12.500 autovetture. Il rapporto di frequenza
mensile dell’anno è dato da: = 1042 autovetture.
I rapporti di frequenza, sotto certi aspetti, sono riconducibili alle medie aritmetiche.
RAPPORTI DI DERIVAZIONE
Nei rapporti di derivazione si mettono a confronto due fenomeni: l’uno derivato o causato dall’altro.
La derivazione si può definire generica o specifica.
●Nella deviazione generica il fenomeno che si trova al denominatore ha una dipendenza generica
con il fenomeno al numeratore. E‘ un rapporto di derivazione generica il tasso di natalità (la relazione
è generica in quanto non tutta la popolazione al denominatore è in grado di procreare).
●La derivazione è invece specifica quando la relazione fra i due termini è molto stretta, ossia la
dipendenza è in concreto come, ad esempio, il rapporto tra il numero dei nati in un determinato anno
e quello della popolazione femminile in età feconda (in quanto al denominatore sono state escluse
tutte le frequenze che non sono legate da un nesso di causalità con la grandezza al numeratore.)

ESEMPIO:
Nella tabella sono riportati i nati vivi e la popolazione residente

italiana nelle quattro ripartizioni geografiche dal 2001 al 2005.
A partire da questi dati è possibile costruire i tassi di natalità che,
si configurano come quozienti di derivazione generica, poiché
al denominatore è presente l’intera popolazione dell’anno
considerato, indipendentemente dal fatto che abbia procreato i
nati che sono indicati al numeratore.
L’indice ottenuto viene moltiplicato per 1000 e ci fornisce il
numero di nati nell’anno considerato per 1000 abitanti.
LA PRIMA PERCENTALE E’ 8,87 (2001 NORD) PERCHE’

224.173 (NATI NORD 2001) DIVISO 25.544.133
(POPOLAZIONE RESIDENTE NORD 2002) FA 0,00878 CHE
MOLTIPLICATO PER 1000 ABITANTI FA 8,78
2.RAPPORTI CHE SI RISOLVONO

RAPPORTI DI DURATA
In questi rapporti si confronta la consistenza di un fenomeno collettivo e le variazioni quantitative
che una parte del fenomeno stesso subisce in un intervallo di tempo. Il rapporto di durata si calcola
rapportando la somma dei termini statici a quella dei termini dinamici, il risultato ottenuto esprime
un concetto diverso rispetto ai termini messi a confronto. Sono rapporti di durata: in campo aziendale
la permanenza media delle scorte di magazzino, in campo turistico la permanenza media ecc.
ESEMPIO- In una località turistica, a inizio della stagione vi sono 3.000 presenze. Durante la
stagione si registrano 32.000 arrivi e 30.500 partenze. Determinare la permanenza media di
ogni turista.
A fine stagione rimangono: 3.000+ 32.000- 30.500= 4.500 turisti
La consistenza stagionale media delle persone è 3750
il flusso delle persone che arrivano e partono è 31250
il tempo medio di permanenza è uguale a 0,12 (stagioni)
Se consideriamo la stagione di tre mesi si ha un tempo medio di 0,36 mesi, cioè 11 giorni circa.
RAPPORTI DI RIPETIZIONE
Il rapporto di ripetizione è il reciproco del rapporto di durata, esso rappresenta il numero medio di
volte in cui il fenomeno si è ripetuto nel periodo di tempo considerato.
ESEMPIO: La giacenza di una certa merce presso un grande magazzino risulta, all’inizio
dell’anno, di 20.000 unità; durante l’anno si sono vendute 2.500 unità di quella merce e se ne
sono acquistate 4.000. Calcolare il rapporto di ripetizione.

Consistenza finale: 20.000+4.000-2.5000 21.500 unità
Consistenza media: 20750
Flusso medio: 3250
Rapporto di ripetizione: 0,1566
Ciò significa che in 10 anni lo stock di merce si rinnova 1,57 volte. Calcolando il reciproco otteniamo
il rapporto di durata: 6,385. La merce rimane in magazzino in media 6 anni e 140
giorni.
NUMERI INDICE
I numeri indice sono degli indicatori utilizzati per mettere in luce particolari aspetti di un fenomeno
legati, principalmente, al suo andamento nel tempo o nello spazio.
ESEMPIO: Nella tabella sono riportati, per alcuni anni, i dati relativi alle presenze in una
località.
-Se indichiamo con A0 le presenze al primo anno rilevato (2001), con A1 quelle
dell’anno successivo e così via, possiamo costruire i numeri indice a base fissa
(2001), riportando a 100 il valore osservato nel primo anno ed esprimendo gli
altri rispetto al valore di tale anno assunto come unità di misura.
In pratica, occorre calcolare:  (2005-

100.8).
Come si vede immediatamente, i numeri indice hanno riproporzionato i valori, rendendoli
commisurati al valore di base (quello del 2001) e si può dire così che nel 2004 il numero di presenze
risulta pari al 116.9% del valore iniziale del periodo considerato. Si rileva, quindi, un incremento
del 17% rispetto al 2001. Osserviamo che i numeri indice sono valori adimensionali, non dipendendo
cioè, dall’unità di misura.
-Oltre che a base fissa è possibile costruire indici a base mobile. In questo caso il confronto è
dinamico e consente di studiare la variazione di un fenomeno, rapportando un istante considerato a
quello immediatamente precedente.
Facendo ancora riferimento ai dati della prima tabella, in tal caso, si può definire:
  ciò si commentare come

segue: se si pone uguale a 100 il valore dell’indice relativo al primo istante considerato, il valore del
secondo istante è il 107% di quello del primo, quello del terzo istante è l’84.1% di quello del secondo
e quello del quarto è il 130.4% di quello del terzo. Si può anche dire che durante il primo periodo

considerato si è avuto un incremento pari al 7% del valore iniziale di periodo, durante il secondo una
diminuzione pari al 16% rispetto al periodo precedente e durante il terzo un incremento pari a 30.4%
del valore precedente.
Definizione: Data una distribuzione di valori A0, A1, A3, …., An, relativi a misure di un carattere di
un determinato fenomeno, si chiama indice a base fissa (scelto A0 come base) ciascuno dei seguenti
valori:
Si chiama indice a base mobile ciascuno dei seguenti valori:
Osserviamo ancora che il valore dell’indice a base mobile si ottiene dal valore dell’indice a base
fissa con un cambiamento di base che riporta sempre all’inizio del periodo via via considerato. Ad
esempio:
Invece, per passare da numeri indice a base mobile a numeri indice a base fissa basta moltiplicare
ciascun indice per quello precedente fino ad arrivare all’indice con base quella che è stata scelta come
fissa. Scegliamo come base l’anno 1 avremo:

Statistica Riassunto

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Statistica Riassunto

Caricato da

Copyright:

Formati disponibili

STATISTICA AURORA PUGLIA- UNITA’ 1

LA STATISTICA ATTRAVERSO LE SUE APPICAZIONI

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

6. Preparazione di un rapporto finale: La fase conclusiva di uno studio è la stesura di un resoconto

I TERMINI DELLA STATISTICA

FENOMENO COLLETTIVO ED UNITA’ STATISTICA

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

VARIABILI DI STATO E DI FLUSSO

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

STATISTICA DESCRITTIVA ED INFERENZIALE

STUDI OSSERVAZIONALI E STUDI SPERIMENTALI

LE FASI DI UN’INDAGINE STATISTICA

LA RILEVAZIONE DEI DATI

Per agevolare l’archiviazione e le elaborazioni i

L’ELABORAZIONE DEI DATI

PRINCIPALI MODALITA’ DI RILEVAZIONE DEI DATI STATISTICI

-Un’altra tipologia di rilevazione è la consultazione di registri, ruoli, archivi, ecc., predisposti in

LE PRINCIPALI FONTI DI DATI SUL TURISMO

Come si può osservare nella tabella, l’analisi della matrice dei

Fissiamo l’attenzione su uno dei caratteri, in altre parole su una

Cominciamo con il considerare il carattere “tipo” (quarta colonna). Quando si considera

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

DIAGRAMMI A SETTORI CIRCOLARI O A TORTA

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

Osserviamo i due diagrammi a

o dove il simbolo ∑ (detto sommatoria) indica la somma dei termini xi,

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

o, in formula più compatta

MEDIA ARITMETICA PONDERATA

MODALITA’: le classi sono divise in base ai pollici del

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

SCARTO DALLA MEDIA

misure, come si ricava banalmente.

dei termini della distribuzione.

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

il cui reciproco è 1,16 che ci fornisce il prezzo medio nei 5

mercati, applicando direttamente la media armonica:

impiegati, ottenendo il tempo medio.

Dalla formula della velocità

Essendo n= n1+ n2+ … nk.

medio tramite la media geometrica 

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

più piccolo del campione.

Come si vede, la media dei due campioni

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

Il box-plot è un ottimo strumento per

Nella tabella sono riportati i pesi

della media. Considerando questa tabella:

Esempio: Calcoliamo la varianza dei due campioni di bottiglie di succo di frutta:

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

Questo è ancora un indice omogeneo e, inoltre, gode di una proprietà di minimo

Proprietà: la somma degli scarti in valore assoluto dalla mediana è un minimo

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

LA FORMA DI UNA DISTRIBUZIONE

Il maggiore o minore addensamento dei dati

RIASSUNTI STATISTICA - AURORA PUGLIA – MATRICOLA 0268950

I rapporti statistici si possono dividere in due classi:

1.RAPPORTI CHE SI SEMPLIFICANO

esprime il numero di arrivi in alberghi a