Statistica 17-11

Caricato da

Elisa Brignola

Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.

Formati disponibili

Scarica in formato DOCX, PDF, TXT o leggi online su Scribd

Il 0% ha trovato utile questo documento (0 voti)

127 visualizzazioni9 pagine

Statistica 17-11

Caricato da

Elisa Brignola

Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.

Formati disponibili

Scarica in formato DOCX, PDF, TXT o leggi online su Scribd

Nona lezione statistica (17/11)

- Riprendi la spiegazione della deviazione standard (nb: altro non è che la radice quadrata della
varianza)
- Esercizio: nella tabella ci sono i livelli di Hb in un campione di 70 donne. Bisogna determinare
la varianza e deviazione standard della distribuzione, raggruppati in intervalli di classe.

Bisogna raggruppare i dati in intervalli di ampiezza 1g/100ml

(quindi 9-10, 10-11, 11-12... in questo caso in ogni intervallo si
esclude il secondo valore estremo, quindi ad esempio tra 9-10 si
considerano i numeri tra 9 e 9.99 e così via e si riprende il 10
nella classe successiva).

Vado poi a contare la frequenza in ogni classe con una frequenza totale di 70.
Trovo poi la media (o punto centrale) di ogni singola classe (perché al momento devo ragionare
sulla classe, per diminuire i calcoli da fare) e infine trovo il valore medio; si calcola con media
x frequenza: 9,5 x 4 = 38 ; 10,5x14 = 247 ecc. Faccio poi la somma di tutti i valori / frequenza
totale = 841/70 = 12,01.
Trovo poi la devianza che si calcola con: (media - valore medio)2 x frequenza /(n-1 visto che 70
è un valore piccolo)  131,49 : 69 = 1,90. Da qui calcolo la deviazione standard che non è
altro che a radice quadrata di 1,90  1,38.
In questo calcolo, nonostante sia più rapido, mi sono persa delle informazioni: facendo invece
media e frequenza di ogni singolo valore, esce un risultato diverso (11,9)!!!!. In questi calcoli
non si arrotonda mai per eccesso/difetto.
Nb: sigma ^ 2 è un altro modo per etichettare la varianza.
18/11
- Coefficiente di variazione (CV) = ci permette di misurare la variabilità, indipendentemente
dalla grandezza e dalla scala di misura delle osservazioni:

dev standard
CV = media aritmetica

La variabilità guarda alle differenze tra le unità sperimentali. È però evidente che il significato
pratico dipende dal livello del fenomeno considerato; quindi può essere interessante disporre di
variabilità “aggiustata” in qualche maniera per tener conto del livello del fenomeno.
Esempio  analizziamo due gruppi con valori medi molto distanti. Abbiamo:
 3 neonati con 3,4 e 5kg (con 4kg di media e 1kg di deviazione standard)
 3 bambini di un anno pesano 10, 11 e 12 kg (con 11kg di media e 1kg di deviazione
standard)
La deviazione standard è uguale nei due insiemi (= 1kg), ma il buon senso ci suggerisce che la
variabilità del peso sia maggiore nei neonati. Perché? Calcoliamo il coefficiente di variazione:
dev standard / media = 25,0%, mentre se la calcoliamo nei bambini di 1 anno, il CV è molto
più piccolo nei neonati (9,1%). Quindi la variabilità relativa è maggiore nei neonati e
diminuisce con l’età.

Altro esempio possono essere 4 neonati con 4kg di media e 1 kg di deviazione standard (CV =
0,25 e quindi 25%) e tre adulti con media 67kg e deviazione standard di 1kg (CV = 1%);
tradotto significa che c’è più variabilità nei neonati anche perché hanno una curva di crescita
molto più vasta rispetto all’adulto (i bambini devono ancora crescere: per un adulto 1kg di
deviazione standard è praticamente nullo, ma nei neonati 1kg di deviazione standard è
tantissimo).

E ancora: in 91 ragazze matricole dell’AA 2021/2022 abbiamo:

1) Media del peso = 55.1kg con deviazione standard = 5,7kg
2) Media della statura = 166,1cm con deviazione standard = 6.1cm
È maggiore la variabilità del peso o statura? Qui troviamo due variabili diverse con diverse
unità di misura; applichiamo quindi la formula:
1) 5.7 / 55.1 = 0,103 = 10,3%
2) 6,1 / 166,1 = 0,037 = 3,7%
In conclusione la variabilità del peso è maggiore rispetto a quello della statura.
Statistiche descrittive per popolazioni
- Le principali statistiche per descrivere gli eventi nelle popolazioni sono:
1) Proporzione = è il rapporto in cui il numeratore (più piccolo) è contenuto nel
denominatore (più grande); possiamo trovare ad esempio:
- Percentuale  in un campione di 500 soggetti, 150 sono donne:
% donne = 150/500 = 30%.
- Prevalenza  in un campione da 500, 25 soggetti sono asmatici:
Prevalenza = 25/500 = 5%.
- Incidenza cumulativa  su 500 soggetti sani seguiti per un anno, 3 si sono
ammalati d’asma:
Incidenza (*1000) = 3/500 = 0,006 x1000 (oppure direttamente 6)
2) Tasso = indica il rapporto tra il numero di eventi e l’esperienza-tempo che li ha
generati. Troviamo ad esempio:
- Tasso di mortalità  in una popolazione stazionaria di 10000 abitanti si
verificano 200 decessi per leucemia in 10 anni:
Tasso(*1000) = [200 / (10000x10)] x 1000 = 2x1000 py,
- Tasso di incidenza  in una coorte di 150 pazienti seguiti per 2 anni, 20
hanno una recidiva nel primo anno e 10 alla fine del follow-up:
Tasso di recidiva (%) = 30 / (20 x 1y) + (130x2y) = 7.1 x 100y
Nb: visto che consideriamo la recidiva, la differenza è che i 20 li devo
togliere al secondo anno, perché hanno avuto la recidiva nel primo anno;
quindi 150-20 = 130.
3) Rapporto = sono il quoziente tra due quantità o frequenze che possono avere unità
di misura differente. Troviamo ad esempio:
- Rapporto  sessi alla nascita:
1057 M / 1000 F = 1,057 (si può scrivere anche rapporto 1:1)
- Densità di popolazione qui abbiamo elementi differenti:
25000abitanti / 23km2 = 1087
- Esiste un indicatore legato al “rischio”, gli odds ratio che si calcolano con la
probabilità che un evento si realizzi / probabilità che un evento non si realizzi
(vi do l’esempio, ma la prof non li vuole sapere).
Se una morte neonatale si verifica in 20 neonati su 100 nati pretermine, il
rischio di mortalità perinatale è 20 / 100 = 0,20 e cioè 20%. L’odds di
mortalità perinatale invece è il numero di neonati che muoiono (20) contro i
neonati che sopravvivono (100-20 = 80)  20 / 80 = 0,25 = 25% [detto in
altre parole possiamo dire “in rapporto 1 a 4”].

Di base però sono tutti QUOZIENTI (quindi con numeratore e denominatore)

19/11
RAPPRESENTAZIONE GRAFICA
- È un primo approccio di facile e chiara lettura della lettura dell’analisi statistica. Un grafico
deve fornire al lettore un’informazione diretta e facile da interpretare. Il grafico sarebbe la
rappresentazione di un fenomeno tramite disegno. C’è un fattore importante da considerare: la
scelta del grafico giusto, poiché c’è il rischio di non riuscire a rappresentare correttamente i
dati. Cosa si prende in considerazione?
1) Natura del fenomeno che si vuole rappresentare,
2) Tipo di carattere che descrive il fenomeno
3) Numero di caratteri coinvolti nel fenomeno.

- Grafico a torta  viene utilizzato per rappresentare un’unica variabile qualitativa; gli spicchi
sono tanti quanti le modalità della variabile qualitativa. È preferibile utilizzarlo quando le
modalità non sono molte e possiamo decidere se inserire le frequenze assolute o relative o
percentuali. Gli spicchi ricoprono un’area del cerchio pari alla frequenza percentuale.
Esempio:

- Grafico a barre  può sintetizzare una o due variabili qualitative; nel caso sintetizzi una sola
variabile, le barre sono tante quanto le modalità della variabile. Nell’asse delle ordinate
possiamo decidere di inserire le frequenze assolute, relative o percentuali (le altezze dei
rettangoli quindi dipendono dalle frequenze assolute/relative/percentuali delle categorie). Qusto
grafico può essere utilizzato in presenza di molte modalità.
Esempio:
Un altro tipo di grafico a barre è quello per due variabili qualitative  sintetizza una tabella
di contingenza. La variabile di exposure viene messa sull’asse orizzontale mentre la variabile di
outcome definisce i rettangoli per ciascun gruppo identificato dalla variabile di exposure.
Ad esempio, si vuole rappresentare la percezione del dolore in base al sesso del neonato:

Altre rappresentazioni del grafico a barre = ognuno ha il proprio vantaggio (ad esempio in
quello a destra riusciamo a capire le unità intervistate):
- Box-plot = è l’unico grafico che permette di rappresentare tutti i valori come mediana o quartili
e soprattutto i valori fuori soglia (detti anche outlier). Questi grafici ci aiutano a capire come e
dove sono posizionate le osservazioni.
Esempio:

Nel caso in cui volessimo valutare la relazione di una variabile qualitativa e un’altra potremmo
creare tanti grafici box-plot quante sono le modalità della variabile qualitativa:

- Scatterplot  sintetizza due variabili quantitative; la variabile di exposure viene messa in

ascissa, mentre quella di out come nell’ordinata. I punti rappresentati sono le singole unità
statistiche. Grazie a questo grafico possiamo vedere come varia l’outcome in base all’exposure.
Esempio:
Come possiamo osservare graficamente come varia il peso in funzione all’altezza?

- Istogramma  la variabile viene suddivisa in classi di ampiezza costante o variabile e viene

posta sull’asse delle ascisse. L’ordinata (cioè l’altezza del rettangolo) è uguale:
 Alla frequenza (il numero delle osservazioni che ricadono in quell’intervallo) se le
classi hanno ampiezza costante
 Al rapporto della frequenza / ampiezza della base se gli intervalli non hanno
ampiezza costante. Questo rapporto viene chiamato densità e in caso di classi di
ampiezza non costante è necessario utilizzare le densità in ordinata, mentre per classi
di egual misura è indifferente.
Poligono di frequenza

Stringendo sempre più gli intervalli, otterremo la distribuzione della variabile. L’istogramma ci
aiuta a vedere graficamente la “forma” della distribuzione

- Attenzione agli errori e distorsioni che portano ad un’analisi incorretta dei dati:
 Il titolo è incompleto o poco chiaro,
 Non segnare i riferimenti identificativi delle variabili (quindi ascisse e ordinate),
 Assenza del riferimento delle unità di misura utilizzate,
 Non segnalare i valori significativi,
 Dimensione del grafico inadatta allo spazio utilizzato,
 Unità grafiche inadatte (usare un grafico a torta per confrontare tanti elementi),
 Mancato rispetto delle unità grafiche.
Esempio: elaborazione OASI nelle regioni della disposizione dei posti letto per 1000 abitanti
(del 2019):
Il grafico (istogramma) ci fa vedere nell’ultimo rettangolo la media in Italia dei posti letto
disponibili e sono 3,51; vengono poi segnati per ogni regione. A lato sono segnate le specialità.
Il grafico ci dice che il Piemonte è quello che ha più posti letto disponibili (3,83), mentre la
Campania è quella che ne ha meno (3.00).
Da questo grafico vediamo anche che le riabilitazioni (viola) sono maggiori in Lombardia,
Piemonte, Lazio e Veneto rispetto alle altre.
Questo grafico in altre parole è ben fatto, non presenta errori o distorsioni e ci descrive quindi
in maniera corretta i dati.

Potrebbero piacerti anche

Traduzione Rengo 1
Nessuna valutazione finora
Traduzione Rengo 1
11 pagine
La Variabilita
Nessuna valutazione finora
La Variabilita
16 pagine
Riassunto Statistica
Nessuna valutazione finora
Riassunto Statistica
4 pagine
Statistica
Nessuna valutazione finora
Statistica
19 pagine
Statistica Appunti Lezione Libro
Nessuna valutazione finora
Statistica Appunti Lezione Libro
57 pagine
Statistica Parte 1
Nessuna valutazione finora
Statistica Parte 1
22 pagine
Statistica Descrittiva
Nessuna valutazione finora
Statistica Descrittiva
32 pagine
Lezione 2 Statistica Descrittiva
Nessuna valutazione finora
Lezione 2 Statistica Descrittiva
82 pagine
STATISTICA Completa
Nessuna valutazione finora
STATISTICA Completa
69 pagine
Statistica: Corso AK Prof. Tarantola A.A. 2014/15
Nessuna valutazione finora
Statistica: Corso AK Prof. Tarantola A.A. 2014/15
45 pagine
Appunti Di Statistica
Nessuna valutazione finora
Appunti Di Statistica
19 pagine
Statistica I
Nessuna valutazione finora
Statistica I
22 pagine
Dispense Prof. Ricci - Probabilità e Statistica
Nessuna valutazione finora
Dispense Prof. Ricci - Probabilità e Statistica
81 pagine
Statistica Libro Molto Dispersivo Ma Con Esercizi Utili A Imparare Le Tecniche Statistiche
Nessuna valutazione finora
Statistica Libro Molto Dispersivo Ma Con Esercizi Utili A Imparare Le Tecniche Statistiche
57 pagine
Elementi Di Statistica
Nessuna valutazione finora
Elementi Di Statistica
50 pagine
Appunti SPSS
Nessuna valutazione finora
Appunti SPSS
4 pagine
Lezione 1 e 2
Nessuna valutazione finora
Lezione 1 e 2
43 pagine
Riassuntone Statistica
Nessuna valutazione finora
Riassuntone Statistica
55 pagine
Appunti Per Esame Psico, Storia
Nessuna valutazione finora
Appunti Per Esame Psico, Storia
26 pagine
Docsity Riassunto Introduzione Alla Statistica Mcgraw Hill
Nessuna valutazione finora
Docsity Riassunto Introduzione Alla Statistica Mcgraw Hill
9 pagine
Lezioni Statistica v1
Nessuna valutazione finora
Lezioni Statistica v1
66 pagine
Statistica
Nessuna valutazione finora
Statistica
54 pagine
Apri Statistica Medica
Nessuna valutazione finora
Apri Statistica Medica
60 pagine
STATISTICA
Nessuna valutazione finora
STATISTICA
5 pagine
Formule Statistica
Nessuna valutazione finora
Formule Statistica
46 pagine
Statistica Univariata
Nessuna valutazione finora
Statistica Univariata
33 pagine
CDL Psicologia Unicusano, Corso Di Psicometria: Statistica
Nessuna valutazione finora
CDL Psicologia Unicusano, Corso Di Psicometria: Statistica
3 pagine
Statistica Domande
Nessuna valutazione finora
Statistica Domande
10 pagine
Statistica 2° Semestre - Appunti
Nessuna valutazione finora
Statistica 2° Semestre - Appunti
36 pagine
Ri Assunto
Nessuna valutazione finora
Ri Assunto
32 pagine
3.misure Di Tendenza Centrale
Nessuna valutazione finora
3.misure Di Tendenza Centrale
78 pagine
Riassunto Statistica
Nessuna valutazione finora
Riassunto Statistica
2 pagine
Pedagogia Sperimentale
Nessuna valutazione finora
Pedagogia Sperimentale
2 pagine
L Essenziale Di Biostatistica
Nessuna valutazione finora
L Essenziale Di Biostatistica
32 pagine
Dispensa Psicometria I
Nessuna valutazione finora
Dispensa Psicometria I
56 pagine
STEAD
Nessuna valutazione finora
STEAD
15 pagine
Statistica Matematica
Nessuna valutazione finora
Statistica Matematica
4 pagine
Statistica 2022 - 1 - Popolazione e Campione
Nessuna valutazione finora
Statistica 2022 - 1 - Popolazione e Campione
15 pagine
Statistica Università
Nessuna valutazione finora
Statistica Università
23 pagine
Statistica Appunti
Nessuna valutazione finora
Statistica Appunti
10 pagine
Misure Di Tendenza Centrale 1
Nessuna valutazione finora
Misure Di Tendenza Centrale 1
65 pagine
Compendio
Nessuna valutazione finora
Compendio
44 pagine
Analisi Dei Dati
Nessuna valutazione finora
Analisi Dei Dati
43 pagine
Terminologia Statistica
Nessuna valutazione finora
Terminologia Statistica
28 pagine
Dispensa Corso Statistic A 2011 Villani
Nessuna valutazione finora
Dispensa Corso Statistic A 2011 Villani
43 pagine
Statistica 2022 - 2 - Variabili e Distribuzioni
Nessuna valutazione finora
Statistica 2022 - 2 - Variabili e Distribuzioni
10 pagine
Inferenza Statistica
Nessuna valutazione finora
Inferenza Statistica
5 pagine
Gestione Dei Dati
Nessuna valutazione finora
Gestione Dei Dati
16 pagine
Lezione 2
Nessuna valutazione finora
Lezione 2
5 pagine
Algebra 1 SASSO 559-608 Statistica
Nessuna valutazione finora
Algebra 1 SASSO 559-608 Statistica
49 pagine
MBarchittaLez1 2anno2021 22statistica
Nessuna valutazione finora
MBarchittaLez1 2anno2021 22statistica
47 pagine
Statistica
Nessuna valutazione finora
Statistica
52 pagine
Appunti Statistica
Nessuna valutazione finora
Appunti Statistica
5 pagine
1.a Sintesi Di Un Insieme Di Dati - Rappresentazioni Tabellari e Grafiche
Nessuna valutazione finora
1.a Sintesi Di Un Insieme Di Dati - Rappresentazioni Tabellari e Grafiche
58 pagine
La Statistica: 0. Introduzione
Nessuna valutazione finora
La Statistica: 0. Introduzione
7 pagine
Statistica22 23
Nessuna valutazione finora
Statistica22 23
113 pagine
Filament Winding
Nessuna valutazione finora
Filament Winding
5 pagine
Vivere Il Futuro-Corrado Malanga-Luca Nali-Luca Serleto.
Nessuna valutazione finora
Vivere Il Futuro-Corrado Malanga-Luca Nali-Luca Serleto.
68 pagine
Pier Francesco Roggero, Michele Nardelli, Francesco Di Noto - Regola Universale Per Trovare Tutti I Numeri Primi
Nessuna valutazione finora
Pier Francesco Roggero, Michele Nardelli, Francesco Di Noto - Regola Universale Per Trovare Tutti I Numeri Primi
12 pagine
Manuale Meccatronica Completo
82% (11)
Manuale Meccatronica Completo
1326 pagine
E - Disegno Tecnico - Aggiornamento 2015 PDF
Nessuna valutazione finora
E - Disegno Tecnico - Aggiornamento 2015 PDF
78 pagine
Esercizi Di Meccanica Razionale A - V. Franceschini
100% (1)
Esercizi Di Meccanica Razionale A - V. Franceschini
93 pagine