Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
NOTA DALLA SCRITTRICE: ogni tanto ci sono scritte due o tre cazzate firmate da me medesima, giusto per
sdrammatizzare la mia traduzione e il nostro studio. Nessun Rengo è stato maltrattato durante la stesura. Si
scherza. No offence.
Perché?
La statistica è diventata la seconda lingua della ricerca.
Perché?
Bisogno di dare visibilità all’attività di ricerca attraverso le pubblicazioni.
Perché?
Odontoiatria basata sull’evidenza (con “evidence” si intende una prova, una testimonianza, dunque
evidenza nel senso di casi clinici, esperienze pregresse riportate in letteratura. Da qui in poi si utilizza in
questo senso il termine “evidenza”).
1. Definire il problema;
2. Trovare le informazioni di cui si ha bisogno;
3. Valutare le informazioni in modo critico;
4. Applicare l’evidenza al paziente;
5. Stimare quanto è stato di aiuto.
Dati nominali
Categorie senza nessuna relazione quantitativa o gerarchica.
Dati nominali
Raccolta
Contare i soggetti o i campioni che mostrano o non mostrano la variabile di interesse.
Dati ordinali
Le categorie vengono assegnate ad una certa classe con un ordine gerarchico
Dati ordinali
Status parodontale (Salute=0; gengivite=1; parodontite=2);
Indice di placca; indice gengivale; indice di sanguinamento; livello della profondità dell’ anestesia (?! Bah);
indice di microinfiltrazione; indice di sensibilità post-chirurgica.
Dati quantitativi
La differenza tra numeri consecutivi rappresenta un valore costante della caratteristica misurata.
Esempio: la differenza tra 36°C e 37°C è la stessa che quella tra 42 e 43 °C.
Indice di altezza diverso dall’età
(Vedi esempi)
(Immagine tabella)
!!!
Una classificazione dei dati fatta ad opera d’arte è di vitale importanza per la scelta dell’analisi statistica
appropriata.
Terzo passo:
Riassumere i dati (statistica descrittiva)
Moda
Non molto accurata come misura di tendenza centrale: può essere un valore estremo (vedi esempio);:
Distribuzioni bimodali o trimodali
Es.: quanti assistenti lavorano nel tuo ufficio? (Vedi esempio)
Distribuzione bimodale
Mediana
Quando i dati sono ordinati in modo decrescente o crescente, è il valore centrale, quello che divide la
distribuzione dei dati in due sottogruppi uguali;
L’osservazione tale che il 50% delle altre osservazioni sono minori di questa, e il restante 50% maggiori.
Mediana:
Indicata per:
Dati ordinali (vedi esempio);
Distribuzioni di dati quantitativi che includono valori estremi
Es. lunghezza radicolare in mm (vedi esempio)
Mean= media; median= mediana.
Varianza
Del campione (dati numerici)
La somma dei quadrati delle deviazioni della media del campione diviso per il numero totale delle
componenti del campione meno 1
Somma di (dati- valore della media) al quadrato/n-1
Deviazione standard
Radice quadrata della varianza
I dati numerici sono sintetizzati con un valore “medio”, come la media o la mediana, insieme ad una misura
dello spread delle osservazioni fatte intorno a questo valore, come il range o la deviazione standard.
La media e la deviazione standard sono le misure più informative, perché usano tutti i dati nel calcolo. Però,
dovrebbero essere usate soltanto per variabili numeriche distribuite normalmente, perché ogni skewness
(si usa il termine inglese, significa “asimmetria) nei dati distorce anche i valori della media e della
deviazione standard.
Variabili non distribuite normalmente dovrebbero essere riassunte utilizzando la mediana e o il range, o il
range interquartile.
La moda è usata raramente.
(Vedi tabella)
Distribuzione normale
Distribuzione normale
Molte statistiche inferenziali (test parametrici: t-test, ANOVA) sono basati sulla distribuzione normale;
E’ molto importante verificare a priori se la variabile analizzata è distribuita normalmente.
Test di normalità
Test di NOME IMPRONUNCIABILE FIGURIAMOCI DA IMPARARE
Confronta la distribuzione dei dati raccolti con una distribuzione normale (p>0.05 —> normalità)
Stem & leaf plot (non so se si traduce- letteralmente, disegno del ramo e della foglia)
(Vedi esempio)
(Vedi disegno)
La caratteristica di un fenomeno può essere analizzata studiando o tutta la popolazione o una porzione
della stessa.
Statistica inferenziale
I mezzi statistici che permettono di giungere a conclusioni riguardo la popolazione studiando parte di essa.
Campionamento
Popolazione: l’intero gruppo di soggetti/oggetti di cui desideriamo ottenere informazioni.
Unità/oggetto- ogni individuo membro della popolazione
Campione: una parte del sottogruppo della popolazione usata per ottenere informazioni su tutta la
popolazione.
Statistica inferenziale
Presupposti:
1) il campione deve essere adeguato a rappresentare la popolazione;
2) C’è inevitabilmente un certo grado di errore inerente all’esperimento
Test di ipotesi
Ipotesi nulla (H0): ipotesi testata
Ipotesi alternativa (H1): ipotesi di interesse
Test di ipotesi
Ipotesi nulla
Formulazione dell’ipotesi nulla;
Applicazione di un test
I risultati dello studio sono difficilmente nelle condizioni dell’ipotesi nulla;
Si rigetta l’ipotesi nulla.
P>0.05
C’è almeno una probabilità del 5% che i risultati riscontrati nel nostro campione si presentino nell’ipotesi
nulla;
C’è più del 5% di possibilità che la differenza riscontrata sia dovuta soltanto al caso.
Si accetta l’ipotesi nulla, si rigetta l’ipotesi alternativa.
Non c’è una differenza statistica significativa.
Test di ipotesi
(Uguale alla slide precedente)
Applicazione di un test
Come vengono classificati i dati? Nominali, ordinali, quantitativi?
La distribuzione dei dati è normale?
Stiamo testando una differenza o una relazione?
Quanti gruppi ci sono? Due o più di due?
I gruppi sono indipendenti o connessi=
(Vedi tabella)
(Vedi disegno)
(Le seguenti 13 slide sono una serie di esempi che mostrano tutti i tipi di test che si possono fare)
Normalità- i valori della variabile dipendente si assume siano distribuiti normalmente in ogni gruppo;
Varianze uguali- la varianza della popolazione è la stessa in ogni gruppo;
Osservazioni indipendenti- le osservazioni sono indipendenti, ossia non sono collegate.
(Non c’è bisogno di varianze uguali se la grandezza di ogni gruppo è simile l’una all’altra)
Facendo più test su un certo insieme di dati, c’è una probabilità sempre maggiore di ottenere un risultato
significativo semplicemente per puro caso.
Come correggere: la correzione di Bonferroni per questo tipo di test di significanza multipla consiste
semplicemente nel moltiplicare il valore di p per il numero di test che sono stati fatti. Il valore corretto
viene poi messo a confronto con il livello di 0.05 (sta cosa non l’ho mai capita, e mai la capirò in statistica,
ILLUMINATEMI) per decidere se è significativo. Se il valore corretto è ancora minore di 0.05, allora l’ipotesi
nulla viene rigettata.
La correzione di Bonferroni è una correzione a confronti multipli usata quando molti test statistici
dipendenti o indipendenti vengono fatti contemporaneamente (perché mentre un certo valore di alfa
potrebbe essere appropriato per ogni confronto individuale, non lo è per l’insieme di tutti i confronti). Per
evitare molti falsi positivi, il valore di alfa deve essere abbassato per tenere conto del numero di confronti
che vengono fatti.
L’approccio più semplice e conservativo è la correzione di Bonferroni, che stabilisce il valore di alfa per
l’intero insieme di confronti stabilendo il valore di alfa per ogni confronto uguale a alfa/n.
ANOVA fattoriale a tre fattori o Three-way ANOVA (che mi sa tanto di una categoria porno, per rifarci a
quanto detto sopra)
1 variabile dipendente (numerica), 3 fattori (variabili categoriche)
Influenza del sesso (fattore, vedi sempre sopra hehe), assunzione di grassi (fattore), ed età (fattore) sulla
pressione arteriosa (variabile dipendente).
Interazioni
Quando un interazione o effetto principale è significativo su più livelli, deve essere esaminato in maniera
invariabile successivamente. (SI CAPISCE SOL’ISS)
ANOVA multivariabile o MANOVA (Mr. Lover Lover mmh.. Mr Lover Lover… SHE CALLS ME MR
BOOMBASTIC)
Più di una variabile dipendente (variabili Numeriche), più di un fattore (variabili categoriche)
Studio del tempo atmosferico: come cambiano la quantità di pioggia (variabile dipendente) e la
temperatura (variabile dipendente) a seconda della stagione (fattore) e della regione (fattore)?
Risposta:
Sì ffa ‘o patapà ‘e l’acqua, è sicuro novembre, tranne ad Avellino addò chiov semp.
Relazioni
La variabile di interesse cambia in concomitanza con un’altra?
Correlazione: la relazione tra due variabili in un gruppo.
Rappresentazione grafica: scatterplot
Correlazione lineare
La più comune. Indica come due variabili cambiano insieme, senza nessuna presunzione di causa-effetto.
Esempio: la crescita del dito del piede è correlata con quella della mandibola, ma una non causa l’altra.
Entrambe derivano dalla crescita somatica. La correlazione potrebbe essere forte, ma non rilevante
clinicamente (MO IO VORREI SAPERE CHI È CHE UN GIORNO SI È SVEGLIATO, SI È PREPARATO UN CAFFÈ, E
HA PENSATO: “TOH, CHISSÀ SE IL DITO DEL PIEDE CRESCE COME LA MANDIBOLA! FAMMI FARE UN
BELL’ESPERIMENTO!”. Un feticista, sicuro).
Esempi di correlazione
(Grafico)
Praticamente:
(Vedi numeri)
1: correlazione debole
2: moderata
3: forte
Significatività statistica della correlazione:
E’ possibile che il coefficiente di correlazione misurato nell’esperimento sia dovuto al caso? P
Significatività clinica della correlazione:
La correlazione deve essere molto forte per essere clinicamente significativa (> o uguale a 0.7)
Regressione lineare
Influenza di una variabile (indipendente o predittore) su un’altra (dipendente o criterio)
Variabile dipendente: y
Variabile indipendente o predittore: x
Il metodo della regressione lineare definisce l’equazione della retta da cui tutti i punti della distribuzione
hanno la stessa distanza.
Regressione lineare
Equazione della retta: y=a + bx
A= intercetta con l’asse delle y
Valore della variabile dipendente quando quella indipendente vale 0.
B= pendenza, il valore di cui la variabile dipendente aumenta quando la variabile indipendente aumenta di
un’unità.
Se c’è una relazione lineare significativa tra x ed y, la pendenza della retta è diversa da 0.
Regressione lineare
Scopo: predire il valore di una variabile (dipendente) a partire da quello di un’altra variabile (indipendente o
predittore)
Y= a + bx
R quadro: stima della variabilità di y che può essere attribuita alla variabilità di x.
R quadro deve essere abbastanza alto (0.5-0.6) per essere clinicamente significativo.
(Vedi esempio).
(Vedi tabella)
Errore di tipo I: alfa: se per sbaglio rigetti l’ipotesi nulla
P: probabilità di rigettare per sbaglio l’ipotesi nulla. Di solito pari a 0.05, ossia 5%;
Livello di significatività (alfa): la probabilità massima di rigettare incorrettamente H0 (5% o 0.05)
Errore di tipo II, beta: se accetti per errore l’ipotesi nulla. Di solito 0.1-0.2
Potenza: (1- beta)
Pr(rigettando H0/H1 è vera)
Abilità di un test di mostrare una differenza quando la differenza effettivamente esiste.
Di solito 0.8/0.9 (80-90%)
Misura del campione: la potenza del test può essere aumentata aumentando la misura del campione.
Test ad una coda: la direzione in cui ci si aspetta di vedere la differenza è indicata (esempio medicina vs.
Placebo)
Le differenze devono essere notevoli per essere significative
Test a due code: la differenza è testata senza indicarne la direzione.
(Vedi esempio)
Significatività statistica
La probabilità che la differenza osservata sia dovuta al caso è bassa;
Si riferisce alla probabilità che lo studio sia giunto alle conclusioni sbagliate. Non dà informazioni riguardo la
grandezza della differenza tra gruppi.
Significatività clinica
La differenza osservata rappresenta un vero beneficio per il paziente.
Aumento della crescita mandibolare: 0.3 mm
Aumento della lunghezza d’attacco: 0.5 mm
Aumento della sopravvivenza di un restauro: 2 mesi
Possono essere considerati clinicamente significativi?
Dovremmo calcolare le statistiche per singolo dente o mettere insieme i dati per più denti?
Se ignoriamo le variazioni tra denti, rischiamo di considerare troppe o troppo poche informazioni che
abbiamo riguardo specifici confronti
Trattare il dente come se fosse un effetto casuale;
Fare più misurazioni ANOVA con il dente come soggetto;
Usare la regressione con il dente come variabile;
Fare un 2-way ANOVA con il dente e il materiale come fattore;
Fare un confronto tra i dati riguardo la forza del bond tra i denti in ogni gruppo con un One-Way ANOVA.