Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Esposizione esito
Terapia
Eziologia
Prevenzione
Diagnosi precoce
Prognosi
Tossicità
Definire chiaramente la domanda cui vogliamo dare risposta e darne una adeguata giustificazione. Definire la
domanda di studio in modo che possa essere analizzabile in maniera corretta e non ambigua.
Trasformare concetti vaghi in definizione operative che descrivono le misure che possono fare e che saranno
poi valutate. Tradurre la domanda di studio in affermazione relative ad attributi della popolazione.
Popolazione: va chiaramente definita in relazione alla localizzazione geografica, al tempo, alle caratteristiche
demografiche (età, sesso) e, se possibile, ad altre caratteristiche sociali ed ambientali.
La scelta dipende dall’obiettivo.
Bias di selezione
Si riferisce ai soggetti studiati. La probabilità di inclusione dei soggetti nello studio dipende dall’esposizione
e dalla malattia.
Scelta della popolazione di studio.
I soggetti sono un campione conveniente invece che uno rappresentativo della popolazione obiettivo
(volontari, soggetti istituzionalizzati, elenchi incompleti, cartelle cliniche)
Popolazione - parametro
L’insieme di tutte le persone (o altre unità statistiche) cui vogliamo che si riferiscano le nostre conclusioni.
La definizione è operativa, nel senso che sulla base di criteri
Indichiamo con il termine parametri gli attributi della popolazione che vogliamo conoscere.
Campione - stima
Un sottoinsieme della popolazione su cui effettivamente vengono raccolte le informazioni.
Ci sono fattori che rendono il campione non rappresentativo cioè sistematicamente diverso dalla popolazione
in studio?
La maniera migliore per ottenere un campione rappresentativo è di scegliere le unità di campionamento a
sorte.
Una buona variabile è adeguata all’obiettivo, chiaramente definita, accurata, riproducibile, misurata in tutti i
soggetti, definita prima dell’inizio dello studio.
Bias di informazione
Si riferisce alle informazioni raccolte. È dovuto all’errata classificazione (misclassificazione)
dell’esposizione o dell’esito.
o Modalità e tempi di osservazione diversi nei bracci confrontati
o Differente memoria all’esposizione (recall bias)
o Informazioni raccolte in modo differente dai diversi ricercatori
La misura è definita come l’attribuzione di un numero a una proprietà (variabile) a oggetti o eventi
- Diretta
- Indiretta, perché abbiamo creato degli strumenti che ci aiutano a misurare determinati fattori (dolore
con scala VAS)
Bisogna distinguere misurazione (metodi e procedure) e misura (la realizzazione del processo)
È l’obiettivo dello studio a determinare…
Errori di misura
- Errori accidentali o casuali – precisione
Le variazioni intorno al valore “vero” di misure ripetute della stessa quantità bello stesso individuo,
dovute a cause indeterminate
- Errori sistematici – accuratezza
I risultati degli studi osservazionali spesso non sono confermati da studi sperimentali.
Distorsione da allocazione, dovuto all’assenza di randomizzazione negli studi osservazionali: ridotta
validità esterna.
Gli studi osservazionali sono complementari.
- studi sperimentali, studiano l’esposizione:
o non controllati
o controllati non randomizzati
o controllati randomizzati
2 lezione 17/11/2022
Sintesi: la statistica serve per avere misure di sintesi per avere informazioni generali sul campione
rappresentativo della popolazione.
Confronto: Serve a confrontare qualcosa o qualcuno e fare inferenza.
Analisi
Presentazione
Media:
La media può essere molto sensibile ai valori atipici.
Mediana:
si dice resistente ai valori estremi, perché non tiene in considerazione il peso dei singoli valori, ma solo
l’ordine.
Quando il numero è dispari si prende il numero al centro. Quando il numero è pari si deve fare una media.
Quartili:
se la mediana taglia in 2 la distribuzione, i quartili tagliano in 4 la distribuzione, ma i quartili sono 3 e
dividono la popolazione in blocchi da 25%. La distanza tra il primo e il terzo quartile si chiama differenza
interquartile, all’interno della quale c’è il 50% della popolazione
5 percentile
95 percentile
Deviazione standard:
scarto quadratico medio, serve per descrivere la distribuzione gaussiana
La distribuzione gaussiana è continua e simmetrica rispetto alla media: media, mediana e moda
coincidono.
Viene definita dalla media e dalla deviazione standard.
Molte variabili continue hanno una distribuzione gaussiana.
Alcune variabili non normali (non gaussiane) se si calcola la radice quadrata possono assumere una
distribuzione gaussiana.
La distanza tra media e la prima deviazione standard è il 34% dei soggetti, tra la prima e la seconda
deviazione standard la popolazione è 13%, tra la seconda e la terza deviazione standard è 2.1%, dopo la
terza deviazione standard è 0.1%.
Tra -3sigma e +3sigma ho quasi il 100% della popolazione.
Distribuzione asimmetrica
Media, mediana e moda non coincidono.
- A destra
- A sinistra
Si usa mediana e range interquartile, e l’uso della media e della deviazione standard non è corretto.
Raccogliere dati/informazioni
I software per l’analisi dei dati:
- Foglio elettronico
- Database relazionale (access, mysql)
- Software statistico (SPSS da scaricare da Unina, stata, r). Stata e R permettono di lavorare con linee
di comando, sono migliori perché possono essere salvati e condivisi, quindi riproducibili.
Si produce un Dataset:
Riga: osservazioni, ovvero i soggetti
Colonne: variabili
Al dataset deve essere associato un codebook (sesso = 1: maschi, 2: femmine)
3 lezione, 24/11/2022
Inferenza
Distribuzioni di probabilità
Continue
Discrete
Distribuzione di Bernoulli
La t di student è diversa rispetto alla normale perché ha le code più ampie: campione piccolo e variabili
continue.
Fino al p value
4 lezione 26/1/2023
(mancano i primi 25 min)
Errori di
- I (del 5%): è statisticamente significativo solo nel 95% dei casi (alfa è 5%)
- II tipo (dal 10 al 20%): non esce statisticamente significativo, anche se c’è correlazione (beta).
L’inverso dell’errore (1-beta) è la potenza.
5 lezione 13/02/2023
ANOVA: Variabile continua in >2 gruppi (analisi della varianza)
Valutare se 2 o più distribuzioni sono statisticamente simili.
Fattore
Livello
Variabile
Regressione lineare:
quanto una variabile indipendente ci può aiutare a predire l’altra variabile
intervallo di confidenza è più stretto vicino al valore medio, ma si allarga andando verso gli estremi.