Il 0% ha trovato utile questo documento (0 voti)
27 visualizzazioni32 pagine

Statistica Descrittiva

Caricato da

Iris Ballaj
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
27 visualizzazioni32 pagine

Statistica Descrittiva

Caricato da

Iris Ballaj
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd

Statistica descrittiva

Organizzare i dati per le analisi


• E’ importante che ogni serie di dati da
utilizzare venga preventivamente organizzata
e adeguatamente definita e strutturata.

• Queste operazioni generano un blocco di dati


che si definisce matrice dei dati grezzi o
tabella delle unità/variabili.
Organizzare i dati per le analisi
Peso (in kg) DM • In questa tabella ogni riga
56 No riportata le informazioni
No
relative ad un
63
individuo/oggetto osservato
65 Si
(unità).
71 No
73 No
Si • Ogni colonna corrisponde
79
No
ad una sua diversa
84
caratteristica (variabile).
91 Si
Dati mancanti
• Se la percentuale di dati mancanti
sul totale non è troppo alta (non
supera il 10%), l’analisi procede Genere fr
semplicemente escludendo le M 50
unità statistiche ad esse F 34
corrispondenti.
Dati mancanti 6
(missing case)
• Se, invece, la percentuale è più Totale 80
elevata si deve o ricostruire le
informazioni mancanti, o ampliare
lo studio in modo da ridurne
l’impatto dei dati mancanti sulla
totalità delle osservazioni.
Codifica
• Per le variabili qualitative è necessario rappresentare le
modalità di ogni categoria in un modo standard usando un
sistema di codifica.

• E’ comune, in una analisi statistica, usare un sistema di


codifica numerico, infatti, usare lettere piuttosto che numeri
può causare problemi con alcuni software statistici. In questo
caso i numeri sono da considerarsi come delle etichette, non
vi è un ordine, non è possibile sommarli, ad esempio:

• Per descrivere la sopravvivenza si è usata la codifica:

1=vivo; 0=morto; 1=malato; 0=sano;


Organizzare i dati per le analisi
Peso (in kg) DM Peso (in kg) DM
56 No 56 0
63 No 63 0
69 Si 65 1
71 No 71 0
73 No 73 0
79 Si 79 1
84 No 84 0
91 Si 91 1

0- l'assenza di DM
1- la presenza di DM
Organizzare i dati per le analisi
Peso (in kg) DM

56 0
63 0
Peso (in DM
65 1 kg) si no
71 0
50-70 1 2
73 0
70-90 1 3
79 1
>90 1 0
84 0
91 1
Organizzare i dati per le analisi
• È importante che i dati siano organizzati nel
miglior modo possibile, cosi le informazioni
saranno
• chiare,
• complete e
• facilmente comprensibili.
Organizzare i dati per le analisi
Peso (in kg) DM Peso DM
56 No (in kg) Totale
si no
63 No
Si 50-70 1 2 3
65
71 No 70-90 1 3 4
73 No
>90 1 0 1
79 Si
84 No
Totale 3 5 8
91 Si
Distribuzione di frequenza
• La distribuzione fornisce un modo compatto per
rappresentare i dati che dunque risultano più
organizzati e più leggibili.

• Nella tabella, ad ogni modalità della variabile è


associata la sua frequenza.

• Nella distribuzione relativa o percentuale non


compare il numero di unità statistiche considerate,
occorre allora fornire tale dato nella descrizione della
rilevazione poiché l’informazione data dalle
frequenze percentuali calcolate su un campione di
10000 unità è ben diversa da quella ottenuta su un
campione di 50 unità.
• il livello di malnutrizione è stato riscontrato
nel 50% dei bambini africani (fascia di età 0-1
anni)
• il livello di malnutrizione è stato riscontrato
nel 2,5% dei bambini albanesi (fascia di età 0-
1 anni)
• Ma per essere corretti nelle nostre conclusioni dobbiamo
sapere qual è stato il numero di osservazioni eseguite?

• Nella popolazione africana sono stati analizzati 50 bambini


(n=50), di cui 25erano malnutriti (25/50 = 0,5 = 50%),

• Nella popolazione albanese sono stati analizzati 1000 bambini


e solo 25 di loro erano malnutriti (25/1000 = 0,025 = 2,5%)
Grafici
• I dati possono essere sintetizati ed ilustrati attraverso
l’uso di grafici.
• I grafici devone essere realizati in tale modo da
comunicare al primo sguardol’anadamento generale
di una serie di dati.
• Come le tabelle, i grafici devone essere definiti con
chiarezza, ed è necessario indicare le unita di
missura.
Grafico

• Un grafico è la rappresentazione figurato dei dati numerici


attraverso
– punti,
– linee,
– figure geometriche,
– mappe già pronte o
– simboli.
• Il grafico rende il fenomeno più leggibile.
• Ogni grafico ha tre elementi essenziali:
– titolo;
– scala,
– leggenda.
Rappresentazione grafica di variabili qualitative

Per le variabili qualitative nominali o ordinate il grafico più appropriato


per descrivere la distribuzione di frequenza assoluta è il diagramma a
barre.

Le diverse modalità sono presenti lungo l’asse orizzontale, l’altezza


della barra rappresenta la frequenza assoluta delle osservazioni in
quella classe. Le barre hanno tutte la stessa ampiezza e sono separate
l’una dall’altra in modo da non implicare alcuna continuità.

Mentre per la distribuzione relativa e percentuale di variabili qualitative


nominali si utilizza principalmente il grafico a torta.
Rappresentazione grafica di variabili qualitative
Nr di paz nel’ QSUT 2011-2016

326334
294153
243687 9.9 %
a) bar-diagram
100891
73121 83238

Viti 2011 Viti 2012 Viti 2013 Viti 2014 Viti 2015 Viti 2016

Siguracioni shëndetër në pt, QSUT


2016

Pa sigurime
b) Diagrame a torta (pie-
34%
chart). Me
sigurime
66%

10/17/2023 E. Petrela
Rappresentazione non adeguata di una
variabile quantitativa

non fumatrici fumatrici


1
1
2
2
11 12
13123 4 5
10 1112
13
12 3 4 3
10 3
1%
1%
4% 0%0%
1%2%4% 6 2%
1%
0%
1%2% 5% 4
8%
10% 4 9 6% 5
10% 12% 5
5
6 6
9
19% 7 7
7 8 8
8 6
22% 19%
9 19% 9
10 10
8 11 7 11
28% 23%
12 12
13
13

La variabile ha molte categorie,


Le categorie (13) sono espresse solo in numeri, senza spiegare cosa indicano
Rappresentazione diagramma a barre
affiancate
• Il diagramma a barre è eccellente per illustrare
le differenze tra le due distribuzioni.
Diagramma di dispersione (scatter-diagram)

•È tipico per presentare la correlazione tra due fenomeni.

•Il diagramma a punti è presentato sotto forma di un insieme


di punti.

•Questo grafico viene utilizzato per i dati quantitativi

•Questo grafico sarà discusso nel capitolo sulla correlazione,


ma in anticipo possiamo dire che nella correlazione tra due
fenomeni, la rappresentazione grafica è un insieme di punti a
forma di palla di recby, che è orientato in base ai valori ottenuti
dal coefficiente di correlazione.
Scatter-diagram

Correlazione tra peso ed l’alteza

56
55
54
53
52
51
50
49 Mashkull
48
Femer
47
46
100 110 120 130 140 150
Istogrammi
Istogramma della variabile peso
• In realtà i grafici più
appropriati per variabili
quantitative sono gli
istogrammi:
• le barre sono consecutive;
• L’asse orizzontale indica i
limiti reali dei diversi
intervali;
• L’asse verticale illustra la
frequenze assoluta o
relativa delle osservazione
in ciascun intervallo.

10/17/2023 E. Petrela
La relazione tra la media, mediana e moda
pendenza destra

Moda > Mediana > Media

10/17/2023 E. Petrela
Distribuzione normale

Moda = Mediana = Media


10/17/2023 E. Petrela
La relazione tra la media, mediana e moda
pendenza sinistra

Moda > Mediana > Media

10/17/2023 E. Petrela
Box-plott, diagrami a scatola

Ekstremiteti
Estremità superiore
i sipërm

Quartile superiore (75%)

Mediana (50%)

Quartile inferiore (25%)

Estremità inferiore
10/17/2023 E. Petrela
Nome Cosa mostra Posizione

Quartile superiore (Qs) Percentili 75 ¾ (n+1)

Quartile inferiore (Qp) Percentili 25 ¼ (n+1)

Range interquartile (RI) Qs-Qp ½ (n+1

Estremità superiore Il valore più grande =N

Estremità inferiore Il valore più piccolo N =1


Diagrammi a mappe

La base per la costruzione di questo grafico sono le mappe


(Carte geografice) politiche già pronte dei paesi in esame.

Sono grafici che mostrano la dinamica del fenomeno.

Per questo, vengono utilizzati colori diversi o intensità diverse


dello stesso colore (spiegate nella legenda).

Solitamente, nei casi in cui si utilizzano intensità diverse dello


stesso colore, il colore con l'intensità più forte corrisponde ai
casi con maggiore frequenza di occurenza del fenomeno, che
deve essere spiegato nella legenda.
Diagrammi a mappe (Hartograme)

10/17/2023 E. Petrela
Funzione di ripartizione (Fz) empirica
• Fz è la funzione F(x) che associa ad ogni numerale reale x la
frequenza relativa cumulata, ovvero la proporzione di unità (o
classi) con modalità inferiori od uguali a quella considerata.

• Esempio (next slide):


• la proporzione di maschi con livello di zinco sierico inferiore a
80 µg/dl è 0.578 (il 58% dei maschi ha livello di zinco <90
µg/dl)
• la proporzione di femmine con livello di zinco sierico inferiore
a 80 µg/dl è 0.522 (il 52% dei femmine ha livello di zinco <90
µg/dl)
Esempio:
Funzione di ripartizione (Fz) empirica
Maschi Femmine
masci
Frequenza femmine livello
livello Frequenza Fz fr FR Fz
assoluta sierico di zinco
sierico di relativa ripartizione
fumatrici
zinco
50-59 6 0.013 0.013 50-59 1 0.003 0.003
60-69 35 0.076 0.089 60-69 29 0.073 0.076
70-79 110 0.238 0.327 70-79 76 0.191 0.267
80-89 116 0.251 0.578 80-89 101 0.254 0.522
90-99 91 0.197 0.775 90-99 85 0.214 0.736
100-109 63 0.136 0.911 100-109 76 0.191 0.927
110-119 30 0.065 0.976 110-119 22 0.055 0.983
120-129 5 0.011 0.987 120-129 3 0.008 0.990
130-139 2 0.004 0.991 130-139 2 0.005 0.995
140-149 2 0.004 0.996 140-149 1 0.003 0.998
150-159 2 0.004 1.000 150-159 1 0.003 1.000
Totale 462 1.000 Totale 392 1
Fz di ripartizione empirica
1.2

0.8

0.6

0.4
maschi
0.2 femine

0
50-59 60-69 70-79 80-89 90-99 100-109 110-119 120-129 130-139 140-149

I confronti sono facilitati utilizzando queste due curve, perché presentano analoghi ordini di
grandezza dato che abbiamo relativizzato ( massimo=1, minimo=0).
Grafici e variabili
Tipo di

Variabile Grafici Frequenze


Torta assolute,
Grafico a barre relative,
Qualitativa Sconnessa percentuali
Torta
assolute,
Grafico a barre
relative,
Qualitativa Ordinate percentuali
Per classi:
Istogramma assolute, assolute,
Quantitativa Continua Fz di ripartizione relative, relative,
cumulate, cumulate,
FRc FRc
assolute,
Istogramma relative,
Quantitativa Discreta Fz di ripartizione cumulate,
FRc

Potrebbero piacerti anche