Sei sulla pagina 1di 5

STATISTICA

STATISTICA MEDICA
Utilizza gli strumenti della statistica per rappresentare e sintetizzare dei dati, interpretare relazioni e fenomeni,
prendere decisioni in merito ad ipotesi e compiere ricerche. Nasce nel 800 ma solo con la diffusione dell’EBM
ebbe un forte sviluppo.
La statistica è la disciplina che studia qualitativamente e quantitativamente determinati fenomeni in condizioni di
incertezza e non determinismo. Si avvale della matematica.
STATISTICA DESCRITTIVA → ha lo scopo di sintetizzare i dati di uno studio con grafici e tabelle. Non vi è la possibilità
d’errore.
STATISTICA INFERENZIALE → stabilisce le caratteristiche di una popolazione a partire da dati campionari. Vi è
possibilità d’errore.
POPOLAZIONE→ insieme di unità statistiche su cui è svolto lo studio
CAMPIONE → insieme di unità statistica selezionate tra la popolazione. Richiede meno tempo per l’analisi, meno
costi ed è più facile da gestire. Si selezionano attraverso 2 metodi di campionamento:
• Campionamento probabilistico → sono note le probabilità associate ad ogni componente del
campione.
o Campione casuale semplice→ un numero per ogni unità e si scelgono a caso i numeri
o Campione stratificato casuale → si divide la popolazione in gruppi omogeni e si sceglie un
campione da ogni gruppo
o Campione a cluster → si divide la popolazione in cluster disomogenei e si sceglie un campione
da ognuno
o Campione sistematico → si scelgono delle unità secondo un passo costante
• Campionamento non probabilistico → è scelto sulla base di criteri non casuali
VARIABILE
Una variabile indica una qualsiasi caratteristica osservata al variare delle unità statistiche. È importante definirle la
scala di misura, che è determinata a partire dai valori della variabile. A seconda della scala cambierà la
classificazione della variabile e il metodo di analisi. Le variabili si dividono in:
• VARIABILI QUANTITATIVE → sono valori numerici che rispettano le leggi matematiche. Usano scale ad
intervalli o scale a rapporti. Possono essere:
o Discrete →associate ad un numero limitato di modalità
o Continue → associate ad un numero illimitato di modalità
• VARIABILI QUALITATIVE →sono modalità esaustive e mutualmente esclusive. Possono essere:
o Dicotomiche → 2 modalità
o Nominali → +2 modalità senza un ordine logico
o Ordinali → +3 modalità con un ordine predefinito
Esiste una scala linked che è un misto tra una scala quantitativa e una ordinale. È possibile passare da una scala
quantitativa ad una qualitativa ma non viceversa.
DATA-BASE
Banca dati, ovveo insieme di dati strutturati, omogenei per contenuto e forma. Sono organizzati in matrici, dove:
• Ogni riga è un record
• Ogni colonna è una variabile
o Variabili numeriche
▪ Dicotomiche → 1 o 0
▪ Continua → numeri decimali
▪ Nominali o ordinali → da 0 in poi
o Variabile non numerica → non standardizzabili, per cui non usate
ANALISI DATI STATISTICI
Per analizzare un gruppo di dati statistici usiamo:
• TABELLE
o TABELLE DI FREQUENZA SEMPLICI → modalità di un carattere e relativa frequenza. La frequenza
può essere
▪ Frequenza assoluta → n. unità con un determinato valore
▪ Frequenza relativa → rapporto tra f. assoluta e popolazione
▪ Frequenza percentuale → f. relativa %
o TABELLE DI FREQUENZA DOPPIE → confronta 2 caratteri
▪ Tabelle di correlazione → 2 caratteri quantitativi
▪ Tabelle di contingenza → 2 caratteri qualitativi
▪ Tabelle miste → un carattere quantitativo e uno qualitativo
• GRAFICI → descrivono in forma visiva i risultati di uno studio statistico
o Rappresentazione di variabili qualitative e quantitative discrete
▪ Diagramma a barre → ciascuna barra è una modalità, l’altezza è la frequenza
▪ Diagramma a torta → cerchio diviso in porzioni
o Rappresentazione di variabili quantitative continue
▪ Istogramma → asse x valori della variabile, asse y la frequenza
• INDICI
o INDICI DI TENDENZA CENTRALI → sintetizzano l’insieme di unità tramite un valore rappresentativo
che indica il centro della rappresentazione
▪ MODA → valore più ricorrente in una distribuzione, descrittivo ma poco informativo
▪ MEDIANA → posizione centrale in una distribuzione ordinata
▪ MEDIA → rapporto tra la somma delle misurazioni e il numero di misurazioni
o INDICI DI DISPERSIONE →informano riguardo la distribuzione dei valori intorno alla media
▪ CAMPO DI VARIANZA → differenza tra il valore massimo e il valore minimo
▪ DIFFERENZA INTERQUARTILE → differenza tra il quartile 1 e il quartile 3
▪ VARIANZA → rapporto tra la somma delle differenze di ogni valore con la loro media al
quadrato e il numero di valori
▪ SCARTO MEDIO → somma dei valori assoluti della differenza dei valori con la loro media,
diviso il numero di valori
▪ DEVIAZIONE STANDARD → radice quadrata della varianza. Riflette la dispersione dei
punteggi e consente l’analisi di questi entro la dispersione.
FORMA DELLA DISTRIBUZIONE
• SIMMETRICA → media coincide con mediana e moda
• ASIMMETRICA → deformazione orizzontale intorno alla media
o Asimmetrica negativa → mediana maggiore della media
o Asimmetrica positiva → media maggiore della mediana
È possibile misurare l’asimmetria attraverso la skew o la formula di Pearson.
La curtozi indica il grado di appuntinamento o appiattimento della distribuzione
• Mesocurtica → forma campanulata
• Leptocurtica → alta al centro e bassa nei fianchi
• Platicurtica → bassa al centro e spessa ai fianchi
BOX PLOT
Diagramma a scatola e baffi, è una rappresentazione grafica di variabili quantitative discrete o continue. La
linea nella scatola è la mediana, se è al centro si tratta di una distribuzione simmetrica, altrimenti è asimmetrica.
La parte superiore e inferiore mostrano il 75° e 25° percentile. La lunghezza della scatola è la differenza
interquartile. Le linee fuori dalla scatola sono chiamate baffi e rappresentano le variazioni dei dati attesi. Se i dati
sono al di sopra o al di sotto dei baffi si dicono outline e sono dei valori anormali che bisogna indagare. A
differenza degli istogrammi, non permette una visualizzazione complessiva dei dati.
SCATTERPLOT
Grafici a dispersione che mostrano il rapporto tra 2 variabili continue, una sull’asse x e una sull’asse y. I grafici
aiutano ad evidenziare gli outline, ovvero i punti insoliti.
PROBABILITA’
La probabilità è un numero reale che oscilla tra 0 e 1 ed esprime il grado di possibilità di un evento di verificarsi. Il
calcolo della probabilità è una disciplina che studia la probabilità dei fenomeni statistici prevedibili. Un
fenomeno è prevedibile quando si ripete nel tempo con discreta regolarità.
DISTRIBUZIONE DI PROBABILITA’
La distribuzione di probabilità di una variabile è un modo per rappresentare in maniera grafica come ad ogni
modalità si associa una probabilità. A seconda delle variabili d’interesse possiamo distinguere distribuzioni
continue (espresse con funzione di densità continua) e distribuzioni discrete (espresse con funzione di
probabilità). Nelle distribuzioni di probabilità i parametri d’interesse sono la media e la varianza. Sono distribuzioni
di probabilità
• Distribuzione normale → variabili quantitative continue. Il grafico ha la forma di una campana. Sarà
simmetrico rispetto alla media, che coincide con mediana e moda. Poiché il campione è estratto
causalmente dalla popolazione bisogna fare una stima della probabilità di commettere errori. Tale stima
può essere puntale (un uunico valore che non coincide ai con quello vero) o intervallare (intervallo che
con la prob. del 95% contiene il campione). Per stimare i risultati di un campione si utilizzano gli intervalli di
confidenza che indicano i valori entro i quali, con una determinata probabilità, si trova la media della
popolazione. È possibile conoscerli calcolando i limiti superiori ed inferiori entro i quali, con probabilità 1-a,
si trova il parametro. L’intervallo di confidenza diminuisce se diminuisce il livello di confidenza e la
variabilità del campione e se aumenta il numero del campione. P(Linf<Q<Lsup)=1-a
• Distribuzione binomiale → variabili quantitative discrete e qualitative
• Distribuzioni di poisson → variabili quantitative discrete e qualitative
VARIABILI DIPENDENTI E INDIPENDENTI
In probabilità, si definiscono:
• EVENTI DIPENDENTI → la probabilità che si verifichi un evento dipende dalla probabilità che se ne verifichi
un altro
• EVENTI INDIPENDENTI → la probabilità che si verifichi un evento non è condizionata dal fatto che si
verifichi o meno l’altro, quindi la loro probabilità congiunta è uguale al prodotto delle probabilità
marginali.
Invece, in statistica possiamo definire:
• VARIABILE DIPENDENTI → subisce gli effetti dei cambiamenti effettuati sulla variabile indipendente
• VARIABILE INDIPENDENTE → variabile che viene manipolata dal ricercatore
Se le variabili sono quantitative e qualitative ordinali, le voro relazioni sono calcolate dagli indici di correlazione
che oscillano tra -1 e 1, lo 0 indica l’indipendenza per cui se il loro indice è prossimo a 0 sono indipendenti. Se le
variabili sono qualitative nominali, la relazione è calcolata attraverso la statistica chi quadro dove lo 0 è un valore
indipendente, mentre per stabilire la dipendenza si ricorre al test d’ipotesi.
A seconda del contesto una variabile può essere dipendente o indipendente.
SIGNIFICATIVITA’ STATISTICA
La significatività statistica indica la probabilità che si verifichi un dato risultato, posto che l’ipotesi nulla vera. I test
statistici hanno lo scopo di accettare o confutare un ipotesi nulla, ovvero l’ipotesi secondo cui per il parametro
considerato non ci sono differenze tra i gruppi. L’ipotesi nulla può essere vera o falsa per cui si esegue un test
statistico. Se il test consiglia di confutare l’ipotesi nulla allora la differenza è statisticamente significativa. Se invece
consiglia di accettare l’ipotesi nulla allora la differenza non è statisticamente significativa. I risultati dei test
statistici sono sempre espressi in termini di probabilità per cui vi è sempre la probabilità di commettere un errore
accettando o confutando un ipotesi. La misura del rischio di cadere in errore è detta livello di significatività, che
può essere scelto a piacere dallo sperimentatore. Di solito si sceglie un livello di probabilità di 0,05 o 0.001, detto
valore P, che rappresenta la stima quantitativa della probabilità che le differenze osservate siano dovute aal
caso. Quindi in generale possiamo dire che se l’ipotesi nulla è respinta con un livello di significatività del n%,
avremmo n% di probabilità di respingere l’ipotesi zero che in effetti è vera. Quindi statisticamente significativo
indica che ciò che è osservato, difficilmente è dovuto al caso.
I test statistici vengono scelti a seconda delle variabili da studiare e dei gruppi da considerare. Possiamo
distinguere:
• Test statistici parametrici
Si basano sulla media e sulla deviazione standard e sono utilizzati per variabili continue normalmente
distribuite. La normalità di una distribuzione si valuta attraverso il grafico, la skeweness, la curtosis e il test
di kolmogorov-smirnov
• Test statistici non parametrici
Basati sul numero d’ordine delle osservazioni. Le variabili hanno evidenti scostamenti dalla normalità. Le
variabili usate sono ordinali o categoriche.
CORRELAZIONI TRA VARIABILI
• REGRESSIONE LINEARE → permette di ricercare la correlazione fra 2 variabili normalmente distribuite.
Valuta se e in che misura i valori di una variabile dipendente variano col variare di una variabile
indipendente.
• CORRELAZIONE R DI PEARSON → permette di esprimere attraverso un coefficiente l’esistenza di una
relazione lineare fra 2 variabili continue normalmente distribuite. Tale coefficiente varia tra -1 e +1 e il
segno indica la direzione della correlazione. La variabilità della variabile dipendente è misurata con R2.
o R negativo → la variabile dipendente diminuisce all’aumentare della variabile indipendente
o R positivo → la variabile indipendente diminuisce all’aumentare della variabile dipendente
o R=0 → non vi è correlazione
• Test t di Student → misura la differenza tra i livelli medi pressori tra gruppo di controllo e trattati.
T=differenza tra le medie campionare/errore standard della differenza tra le medie campionarie.
• Analisi della varianza → permette di confrontare i valori medi di più gruppi
• Tabelle di contingenza → studia la correlazione tra più variabili categoriche
• Analisi multivariate → qando vi è uno sbilanciamento in 1 o + fattori prognostici e per stmare il ruolo di un
fattore in assenza di problemi di confondimento. Per mette di valutare il ruolo indipendente di ogni
singola variabile.
• Regressione logistica → usata per variabili dipendenti dicotomiche. Si esprime in termini di Odd ratio. Se
OR>1 vi è un eccesso di rischio mentre se OR <1 vi un rischio basso
CASUALITA’
La casualità è ciò che mette in relazione le cause con gli effetti che esse producono. Una associazione casuale
può essere:
• Deterministica → la causa è necessaria e sufficiente
• Probabilistica → la causa è sostituita da un fattore di rischio, che non è né necessario, né sufficiente. Un
rischio è la probabilità che si verifichi il danno alla salute, mentre un fattore di rischio è un agente che
può danneggiare la salute umana.
Una relazione si dice casuale se vi sono almeno due criteri tra: relazione temporale, plausibilità, coerenza, forza,
relazione dose-effetto, reversibilità, progetto studio e valutazione evidenza.
In alcuni casi una relazione casuale può essere oscurata da degli errori, come:
• Errori casuali → dovuti alla mancata rappresentazione della popolazione con lo studio di un campione.
Possono essere dovuti a:
o Confondimento → confusione tra 2 variabili casuali
o Sinergismo → interazione tra variabili ha un effetto finale pari alla somma dei singoli effetti della
variabile
o Interazione → l’interazione tra 2 variabili è alterata da una terza variabile
• Errori sistematici (bias) → risultati distorti in una direzione dovuto a fattori non casuali, errori dovuti a un
disegno inadeguato dello studio
o Bias anamnestico → distorsione dovuta alla rilvazione di eventi pregressi non direttamente
verificabili.
o Bias di misurazioni → distorsione dovuta a rilevazione dei dati con diversa metodologia
o Bias di selezione → disuguale distribuzione dei soggetti nei vari gruppi di studio
STUDI CLINICI
Per la misurazione di fenomeni clinici si ricorre a:
• Rapporti → relazione tra 2 quantità tra loro indipendenti
• Proporzioni → rapporto in cui il numeratore è contenuto nel denominatore
• Tassi→ proporzione variabile nel tempo
o Grezzi → n. eventi in un intervallo di tempo per ogni K individui presenti nella popolazione
o Specifici → riferito ad un evento in particolare
Tassi utilizzati in epidemiologia sono:
o Mortalità → n. morti in un anno rispetto alla popolazione
o Morbosità → frequenza della malattia nella popolazione. È legata ai concetti di
▪ Prevalenza → percentuale di individui di una popolazione affetti da una determinata
malattia in un sato momento
▪ Incidenza → % di nuovi casi di una malattia che compaiono in un periodo di tempo,
rispetto alla popolazione suscettibile alla malattia.
Prevalenza e incidenza sono direttamente proporzionali. P= I*durata malattia
Studi epidemiologici si classificano in
• STUDI OSSERVAZIONALI
o STUDI DESCRITTIVI → Studiano la distribuzione geografica e temporale delle malattie nella
popolazione. Sono utili a generare ipotesi ma non a dimostrarle. Le unità statistiche sono il
risulatato di aggregazione. Utilizzano dati correnti, ovvero dati presenti nei flussi informatovo
riguardo la natalità, la mortalità, i fattori di rischio, la frequenza patologica e i servizi sanitari. Tali
dati devono rispondere ai requisiti di accuratezza, tempestività, confrontabilità e devono essere
orientati alla popolazione. Per raccogliere tali dati si ricorre a:
• Schede di morte → una parte serve ad identificare la persona deceduta. L’altra
parte riguarda le notizie relative al decesso
o Morte per causa naturale → la causa può essere iniziale (la malattia avvia
una serie di eventi morbosi che portano alla morte), intermedia (processo
che si aggiunge alla causa primaria e porta a morte) o finale (un evento
prima della morte è causa contigente)
o Causa violenta → descrizione della lesione e degli stati morbosi
• Rencam → registro nominativo delle cause di morte diviso per ASL
• Cartella clinica → atto di fede pubblica nel quale sono registrate le notizie
riguardanti il paziente. Ha lo scopo di facilitare le cure, comunicare fra il
personale, raccogliere gli atti medici ed effettuare studi retrospettivi e prospettici.
• Scheda di dimissione ospedaliera → base informativa per descrivere le attività di
ricovero svolte in ospedale, divise in accettazione, degenza e dimissione. Ne è
responsabile il medico della dimissione. Obbligatoria con il dm del 26/7/93
• Notifiche malattie infettive → obbligo di segnalare ogni patologia sospetta
• Banca dati infortuni e malattie professionali → raccolta di tutte le denunce all’inail
• Registro tumori di popolazione → raccolta dei malati residenti per effettuare una
sorveglianza dell’andamento della patologia
▪ Studi di correlazione temporale→ si vanno ad indagare i fattori ambientali che
comportano livelli di esposizione simili o omogenei per la popolazione
▪ Studi di correlazione geografica → gli andamenti temporali possono essere esaminati per
valutare l’efficacia di un intervento
o STUDI ANALITICI → studiano le cause delle malattie degli individui.
▪ Studi trasversali → studi osservazionali che si limita a studiare le caratteristiche dei pz. Al
momento della valutazione, cioè descrive e studia le correlazioni casuali tra esposizione e
disturbi di salute in un dato momento. Le tappe dello studio sono: campionamento,
raccolta dati, analisi dati e interpretazione. Ha il vantaggio di essere rapido, economico,
riproducibile e generalizzabile su tutta la popolazione. Molto utile per stimare la
prevalenza. Ha il vantaggio di essere poco attendibile e molto soggetto a distorsioni. Non
consente di valutare la sequenza temporale
▪ Studi di coorte → il gruppo di soggetti viene seguito nel tempo. Sono studi prospettici.
Bisogna selezionale un gruppo di persone con caratteristiche simili e si divisono in 2
sottogruppi, gli esposti e i non esposti. Vengono raccolti dei dati, analizzattimediante il
calcolo dell’incidenza degli esposti e dei non esposti, la loro proporzione e l’incidenza
totale. È importante valutare la forza di associazione mediante il rischio relativo.
Se RR<1 gli esposti si ammalano di meno, viceversa se RR>1 e RR=1 si ammalano
ugualmente. Altri valori sono il rischio attribuibile al fattore di rischio, il rischio attribuibile
negli esposti, rischio attribuibile alla popolazione e ka frazione degli esposti.
▪ Studi caso-controllo → studio osservazionale con monitoraggio retrospettivo. Si seleziona
un gruppo di soggetti malati e un gruppo di soggetti sani. Permette di valutare il ruolo
eziopatogenico dei fattori di rischio. L’associazione del fattore di rischio e malattia è
misurata attraverso l’odds ratio. È il rapporto tra probabilità degli esposti dei casi e quella
dei controlli.
▪ Studi case-crossover → usato per la valutazione dell’associazione tra incremento e nelle
esposizioni e negli effetti a breve termine.
• STUDI SPERIMENTALI → interviene lo sperimentatore in un determinato campione di soggetti. Sono più
lenti e costosi, poco riproducibili, più efficaci al fine di dimostrare le ipotesi e ha meno distorsioni.
o Sperimentazioni cliniche → utili per valutare terapie ed interventi di prevenzione. L’assegnazione
dell’intervento o del non intervento è casuale e randomizzata.
o Studi comunitari → valutano i diversi tipi di trattamenti preventivi. I gruppi di studio sono in genere
precostituiti e la composizione casuale è impossibile.

Potrebbero piacerti anche