Sei sulla pagina 1di 5

STATISTICA IN ANESTESIA

Quello che segue un riassunto del riassunto della statistica... non ha pretese di esaustivit, ma una sorta di memo di quello che dovremmo ricordare per sempre, almeno per capirci quando parliamo! Non credo di dire niente di nuovo, un esame di statistica labbiamo fatto tutti e molte delle cose che seguono sono del mio esame di statistica (perch, come molti degli argomenti made by Miller, non si capisce molto).

I medici utilizzano i metodi statistici sia per analizzare i loro dati che per verificare la validit di altri report scientifici. I metodi statistici possono avere due indirizzi diversi: S. DESCRITTIVA: descrive e organizza i risultati ottenuti da una serie di osservazioni empiriche S. INFERENZIALE: permette di trasformare le informazioni ottenute da un campione in conclusioni generali valide per lintera popolazione. Questo trasferimento porta con se un certo grado di incertezza. I dati statistici, o variabili (qualunque caratteristica che pu assumere valori diversi nello spazio, tempo, persone diversi) possono essere: QUANTITATIVI: se la variabile espressa con un numero o DISCRETI: misurabile solo con numeri interi (frequenza cardiaca, numero di sigarette...) o CONTINUI o DI INTERVALLO: misurabile con una scala continua, il valore del dato dipende solo dalla precisione dello strumento che misura (peso, et, statura) CATEGORICI: se la variabile espressa con un nome, un aggettivo o ORDINALE: se possibile riconoscere un criterio di ordinamento o BINARIO: ci sono solo 2 possibilit alterative (vivo/morto, maschio/femmina, responder/non responder) o MULTIPLO: se ci sono pi possibilit alternative importante distinguere i dati con cui ci troviamo a ragionare perch dati diversi corrispondono, o meglio, impongono test statistici diversi!! La descrizione matematica di come sono collocati i valori di frequenza definita DISTRIBUZIONE. La distribuzione rappresentata da una funzione matematica che corrisponde alla funzione di probabilit per cui se X la variabile casuale in esame e x un valore che la X pu assumere, la P(X=x) [si legge: la probabilit che la variabile X abbia valore x]si definisce attraverso la funzione di probabilit F(x). Essenzialmente in ambito biologico le distribuzioni importanti sono 3: distribuzione binomiale o di Bernulli (valida per dati binari), distribuzione di Poisson (valida per dati discreti, o meglio per descrivere eventi di un certo tipo che si verificano casualmente nel tempo, o piccole particelle che si distribuiscono casualmente nello spazio), distribuzione normale di Gauss (valida per dati quantitativi continui, caratterizzata dal fatto che simmetrica rispetto al valore medio; la media, la mediana e la moda coincidono). Concentriamoci sulla distribuzione di Gauss. La distribuzione teorica, la realt differisce. Infatti media, mediana e moda spesso non coincidono, le due code sono asimmetriche, oppure la curva pi o meno appiattita... per queste circostanze esistono degli indici che stimano quanto la realt si discosta dalla teoria... ma non ci interessano, basta sapere che esistono! Passiamo a definire gli indici di tendenza centrale: MEDIA: distinta in 3 categorie:

o ARITMETICA: somma di tutti i valori osservati per una categoria fratto il numero di osservazioni; utilizzata come indicatore sintetico, soprattutto quando i dati seguono una distribuzione normale. o GEOMETRICA: l'N-esima radice del prodotto di tutti gli N valori; viene usata soprattutto quando i diversi valori vengono per loro natura moltiplicati tra di loro e non sommati. Esempio tipico sono i tassi di crescita, adeguatamente modificati. o ARMONICA: il reciproco della media aritmetica dei reciproci. particolarmente indicata quando i dati sono relativi a misure di tempo. MEDIANA: rappresenta il valore della variabile corrispondente alla met delle osservazioni (se abbiamo 11 dati, dopo averli ordinati in ordine crescente, la mediana corrisponde al valore del sesto dato). MODA: la modalit (o la classe di modalit) caratterizzata dalla massima frequenza. In altre parole, il valore che compare pi frequentemente. Una distribuzione unimodale se ammette un solo valore modale, bimodale se ne ammette due (ossia: se esistono due valori che compaiono entrambi con la frequenza massima nella data distribuzione), trimodale se ne ha tre, ecc.

E non dimentichiamo gli indici di dispersione che servono per descrivere sinteticamente una distribuzione statistica quantitativa, e in modo particolare la misura con la quale i suoi valori sono distanti da un valore centrale. Dobbiamo ricordare: RANGE: differenza tra il massimo e il minimo valore; in generale, tuttavia, non un buon indice di variabilit in quanto risente di eventuali valori anomali che possono essere tali perch influenzati da fattori eccezionali. DIFFERENZA INTERQUANTILE: i quartili sono i valori che ripartiscono una popolazione in 4 parti ugualmente popolate. Sono i quantili q1/4 (primo quartile), q2/4=q1/2 (mediana) e q3/4 (terzo quartile). In altri termini, la frequenza cumulata fino ai tre quartili circa 25%, 50% e 75% rispettivamente. Il secondo quartile corrisponde alla mediana. La differenza tra il terzo ed il primo quartile lo scarto interquartile. Oltre che in quartili la popolazione pu essere divisa in percentili, ovvero in 100 parti, per cui il primo quartile corrisponde al 25 percentile, il secondo quartile corrisponde al 50 percentile e il terzo quartile corrisponde al 75 percentile. VARIANZA: un numero che fornisce una misura di quanto siano vari i valori assunti dalla variabile, ovvero di quanto si discostino dalla media aritmetica (misura media degli scarti al quadrato della media). DEVIAZIONE STANDARD: la radice quadrata della varianza. Statistica epidemiologica

Gli studi scientifici possono essere studi osservazionali (descrive gli eventi e indaga eventuali rapporti causa-effetto tra fattori di rischio ed eventi) o studi di intervento (si descrive leffetto di un particolare intervento terapia per stabilire il pi efficace; es: trial clinico) I modello di studio: STUDIO DI COORTE. La coorte un gruppo omogeneo di popolazione, che viene diviso in due campioni diversi per lesposizione ad un fattore di rischio o per lintervento terapia che si somministra, e si seguono nel tempo. Il valore statistico che permette di pesare i risultati il RISCHIO RELATIVO, ovvero il rapporto tra i malati tra gli esposti e i malati tra in non esposti. II modello di studio: STUDIO CASO CONTROLLO. Il gruppo dei malati (o sottoposti ad un intervento terapia) viene confrontato con un gruppo simile che non ha avuto lo stesso esito o trattamento che funziona da gruppo controllo. Lo strumento statistico che permette di valutare i risultati lODDS RATIO, ovvero il rapporto tra lodd dei malati (rapporto tra malati tra gli esposti e malati tra non esposti) e lodd dei non malatia (rapporto tra i non malati tra gli esposti e non malati tra gli esposti). Vantaggi Studio di coorte Studio casocontrollo Misura diretta dellincidenza Possibilit di valutare effetti multipli di un unico fattore di rischio Possibilit di studiare fattori di rischio rari Rapida esecuzione e basso costo Si possono valutare pi di un fattore di rischio per ogni malattia/condizione Utile per malattie/condizioni rare Svantaggi Elevato costo economico Non adatto a studio malattie/condizioni rare di

Maggiore intervento di bias (soprattutto bias di selezione) Non adatto a fattori di rischio rari Fornisce solo stime di rischio

Per ridurre al minimo i bias, e distribuire in tutti i gruppi la stessa probabilit di fattori di confondimento, il gold standard per la pianificazione di uno studio la randomizzazione del campionamento vedi TRIAL CLINICO RANDOMMIZATO. Per ridurre i fattori di confondimento sui risultati studi in CIECO (il pz non sa a quale gruppo di uno studio assegnato) e DOPPIO CIECO (ne il paz ne il medico sanno a che gruppo dello studio il pz assegnato). Valutazione della qualit di un test diagnostico o predittivo Stato di malattia Malati Positivi Risposta al test Veri positivi VP Falsi negativi FN Sani Falsi positivi FP Veri negativi VN Sensibilit = capacit del test di identificare la malattia = VP/totale malati = VP/(VP+FN) Specificit = capacit del test di evitare errori = VN/totale sani = VN/(VN+FP) Valore predittivo positivo (PPV) = VP/totale positivi = VP/(VP+FP) Valore predittivo negativo (NPV) = VN/totale negativi = VN/(VN+FN)

Negativi

Il test ideale ha sensibilit e specificit entrambi pari ad 1. i test reali si discostano da questo valore in almeno uno dei due parametri per la scelta ci si pu rifare alle curve ROC, ovvero uno schema grafico per un classificatore binario. Lungo i due assi si possono rappresentare la sensibilit e (1-specificit), come True Positive Rate (vero positivo) e False Positive Rate (falso positivo). In altre parole, si studiano i rapporti fra allarmi veri (hit rate) e falsi allarmi.

Verifica delle ipotesi Obiettivo: guidare il clinico a prendere decisioni riguardo ad un parametro, partendo da dati campionari. Centrale nel processo decisionale lipotesi statistica: si formula un sistema di ipotesi: la prima unipotesi di uguaglianza detta ipotesi nulla H0, la seconda unipotesi di disuguaglianza detta ipotesi alternativa H1. le ipotesi si formulano sempre rispetto ad un parametro. Di solito lipotesi alternativa quella pi simile, come formulazione, allipotesi di ricerca: ci che il ricercatore sta dimostrando. Per poter accettare o rifiutare lipotesi nulla ci si serve di un test. La statistica test una formula matematica che si pu calcolare a partire dai dati campionari, ogni statistica test ha una distribuzione di probabilit che consentir la decisione finale di accettazione o di rifiuto dellipotesi nulla. La statistica test esita in un calcolo numerico rispetto al quale bisogna prendere la decisione di accettare o rifiutare lipotesi nulla. Per fare questo necessario avere un termine di riferimento che dipende dalla distribuzione della statistica e dal livello di significativit (il grado di errore che si accetta di commettere nel rifiutare unuguaglianza che invece vera). Per convenzione il massimo valore di errore 0,05. Il livello di significativit indicato da ed lerrore di I tipo: la probabilit di rifiutare unipotesi nulla vera. Un secondo errore lerrore di II tipo: la probabilit di accettare unipotesi nulla falsa e si indica con . 1- si definisce potenza del test. Ultimi due concetti da tenere a mente sono la Correlazione e la Regressione. La correlazione permette di studiare laccordo tra 2 variabili quantitative, valutando il grado di reciproca influenza tra le due e/o valuta il grado di associazione di due variabili influenzate entrambe da una causa esterna. La misura della correlazione pu essere espressa mediante il coefficiente di correlazione di Pearson r. r varia da -1 (massima correlazione con proporzionalit inversa) a +1 (minima correlazione con proporzionalit diretta). Se r=0 vuol dire che non esiste correlazione lineare tra le due variabili, e che la correlazione potrebbe essere rappresentata da una funzione diversa da una retta o che potrebbe non esserci correlazione.

La regressione il metodo statistico che permette di studiare il legame tra variabili quantitative, analizzando un rapporto di dipendenza causa-effetto; per cui esister una variabile indipendente e una variabile dipendente il cui comportamento pu essere spiegato in base alle variazioni della variabile indipendente. Il pi semplice modello di relazione la retta. Come dicevo prima, dati diversi significano statista test diverse!!!! Non importante conoscere le formule matematiche, ormai tutti usano i programmi di statistica, ma se non sappiamo con cosa abbiamo a che fare, non sapremo cosa far fare al nostro programma!!! Dati quantitativi richiedono test parametrici (cio basati sui parametri di media, DS e varianza) quali: test Z (con distribuzione normale di Gauss), F di Fisher, T-student. Dati qualitativi richiedono test non parametrici quali: tabelle di contingenza, test per la somma dei ranghi in campioni indipendenti, test dei ranghi con segno di Wilcoxon appaiati. Scelta dei test (Miller, pag 888) Intervallo di dati Obiettivo del (parametrici) Intervallo di dati non confronto distribuiti parametrici normalmente Mediana, moda, Descrivere un gruppo Media DS percentile Confrontare un Test t Wilcoxon gruppo con un valore Confrontare due Test t non appaiato Mann-whitney gruppi Due gruppi appaiati Test t appaiato Wilcoxon Tre o pi gruppi Molteplici gruppi appaiati Regressione ANOVA ANOVA di misure ripetute Regressione lineare Kruskal-Wallis Friedman Regressione non parametrica

Dati di categorie Conte e proporzioni Chi-quadro Chi-quadro, Fisher McNemar Chi-quadro Regressione logistica