Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Una scala numerica continua è una scala in cui ci sono una serie di dati quantitativi
determinati dal rapporto fra l'entità del fenomeno e la sua unità di misura, si compone
infatti di vere e proprie misurazioni scientifiche che contengono anche cifre decimali.
La scala numerica discreta è anch'essa quantitativa ma è usata più per enumerazioni
(esempio media di figli per donna).
In una scala numerica continua esistono misure per identificare la dispersione dei dati,
ossia quanto, numericamente parlando, i dati rilevati sono diversi fra loro; queste misure
sono: deviazione standard, intervallo interquartile, il campo di variazione e coefficiente
di variazione.
Outlier è un valore estremo che va indagato per capire se è un errore o un dato reale:
può avere un'influenza notevole sulla media, sulla deviazione standard e sulla scala con
cui è disegnato un istogramma.
La media più o meno una deviazione standard comprende il 68% dei dati
La media più o meno 2 deviazione standard comprende il 95% dei dati
La media più o meno 3 deviazione standard comprende il 99,7% dei dati
L'errore standard di una misura è definito come la stima della deviazione standard dello
stimatore. È dunque una stima della variabilità dello stimatore cioè una misura della sua
imprecisione.
La deviazione standard è un indicatore della dispersione dell'insieme.
Per quantile si intende il valore che divide un insieme di misure in N parti uguali
Per verificare che un parametro di campione sia normale verifico che media + 1dev
stand = 84 esimo percentile e la media - 1 dev stand = 16° percentile; inoltre la media
deve coincidere con la mediana (50°percentile)
DISTRIBUZIONI DI PROBABILITA’
STRATEGIE DI CAMPIONAMENTO
Tipi di campionamento
Campionamento casuale
Gli individui della popolazione vengono scelti in modo che ciascun singolo individuo
abbia la stessa probabilità di essere selezionato
Campionamento casuale semplice
È di taglia N in modo che ciascun campione di taglia N abbia la stessa probabilità di
essere selezionato ( invece che scegliere casualmente i singoli individui si scelgono
casualmente dei singoli gruppi).
Campionamento sistematico
Scegliamo a caso un punto iniziale e successivamente ogni K-esimo elemento (multiplo
di quel numero).
Campionamento di convenienza
Si tratta di un campionamento in cui si usano dati di facile raccolta, poco usato poiché
poco rappresentativo, dispone di bassa variabilità della popolazione.
Campionamento stratificato
Si usa quando sono presenti almeno due strati o due sottogruppi che condividono le
stesse caratteristiche.
Campionamento a grappoli
È un campionamento in cui si suddivide la popolazione in sezioni o grappoli e si
sorteggiano le sezioni.
Per i confronti multipli si usano test divisi in due gruppi: quelli per confronti multipli fra
meno di 10 categorie e fra più di 10 categorie. Nel primo gruppo troviamo il test di
Bonferroni, considerato il migliore e si usa con il test di Student per dati appaiati; nel
secondo gruppo troviamo il test di Tukey, anche questo si usa con il test di Student per
dati appaiati
10 O MENO CATEGORIE
-Test di Bonferroni: più cautelativo e quindi più consigliato
-Test SNK: tende a sovrastimare
-Test di Holm: riduce la potenza di correzione
PIU’ DI 10 CATEGORIE
-Test di Tuckey: tende a sottostimare (è meglio, è più facile evitare errori, cosa facile
quando si trattano molte categorie)
-Test Dunnet: tende a sovrastimare
Quando un campione non è molto numeroso cioè meno di 30 soggetti, si dice che è
senza distribuzione cioè distribution free e si usano test non parametrici che sfruttano le
frequenze o al massimo le mediane
Il test del chi quadro di mcnemar serve solo per variabili in scala nominale e serve per la
verifica di omogeneità ( le frequenze con cui si presentano le categorie sono simili)
associazione ( le categorie sono associate) e indipendenza, per questo motivo può essere
usato per valutare il grado di accordo intra operatore, inter operatore o tra test clinici
diversi. Test chi quadro: scala nominale e ordinale.
Il test di Wilcoxon si usa per vedere se c'è una differenza significativa tra le mediane di
due gruppi appaiati cioè dipendenti l'uno dall'altro, se i 2 campioni invece non sono
appaiati, si usa il test U di Mann Whitney. Esiste un altro test chiamato di Kruskal-
Wallis, è un test non parametrico usato per confrontare le mediane di tre o più campioni
non appaiati.
Correzione di Yates nel test del chi quadro: tabella 2x2 (si usa quando sono presenti
solo 2 categorie e quindi un solo grado si libertà).
Per verificare la relazione tra due variabili si usa la retta di regressione. Una variabile
deve essere indipendente e l'altra dipendente, chiamate rispettivamente variabile
predittore e variabile risposta; è necessario che il campione di dati accoppiati sia casuale
e di dati quantitativi, lo scatterplot deve confermare che i punti si dispongono
approssimativamente lungo una linea retta.
L’intervallo di confidenza della retta di regressione per essere valido: non deve
comprendere lo 0
La regressione lineare non si può ovviamente applicare se c'è stato un intervento sulle
variabili da parte del ricercatore
EPIDEMIOLOGIA-STUDI EPIDEMIOLOGICI
Negli studi trasversali è importante calcolare la prevalenza per monitorare momento per
momento la popolazione.
Uno studio trasversale è uno studio fotografia che lavora con le popolazioni dinamiche e
dà un'idea del momento preciso in cui viene fatto il test, è molto veloce poco costoso e
fornisce la possibilità di formulare ipotesi che però bisogna verificare con altri tipi di
studio.
Uno studio longitudinale serve per studiare più effetti contemporaneamente e a valutare
il trend spontaneo dei fattori di rischio. Gli studi longitudinali permettono alla
rappresentatività della casistica, confrontabilità della terapia pratica e
risultati/conclusioni basate sull'obiettivo primario.
EPIDEMIOLOGIA-STUDI CLINICI
In un trial clinico controllato, ma anche nei trials clinici crossover, il campione deve
avere taglia fissa e non può cambiare durante il trial stesso. (NB: per trials clinici
crossover si intendono quei casi in cui due gruppi vengono sottoposti secondo diversi
disegni di esperimenti a due trattamenti diversi.) in un trial clinico controllato è
fondamentale evidenziare le relazioni temporali causa-effetto, studiare più siti
contemporaneamente e calcolare la prevalenza. In un trials clinico controllato ogni
soggetto sottoposto a un solo trattamento; nella crossover invece ogni soggetto
sottoposto a tutti i trattamenti.
Nelle coorti fisse i soggetti entro nello studio e ne escono quando sono diventati casi.
Le popolazioni dinamiche sono popolazioni in cui soggetti vengono visti per un periodo
più o meno lungo e poi non vengono più visti.
L'odds ratio si calcola negli studi di caso controllo retrospettivi, mentre il Risk Ratio si
calcola negli studi caso controllo prospettici.
INTERVALLI DI CONFIDENZA RR e OR
Qualunque sia il risultato dell’OR e RR, se l’intervallo di confidenza contiene l’1, cioè
se un estremo è <1 e l’altro >1, il risultato è ininfluente perché l’intervallo di confidenza
ha il 95% delle probabilità di contenere il valore della popolazione. Se invece IC >1, il
FdR è sempre favorevole all’evento; in alternativa se IC<1, il FdR è sempre protettivo
nei confronti dell’evento.
MISURE STATISTICHE-TASSI
Il rapporto di letalità di una malattia è uguale al numero di decessi per quella malattia/ il
numero degli affetti da quella malattia.
Il tasso grezzo di mortalità annuale è dato dal numero totale di morti durante l'anno
fratto il numero di persone di quella popolazione al primo luglio di quell'anno; il tutto
per questioni burocratiche.
SENSIBILITA’ E SPECIFICITA’
In un test la sua sensibilità indica la capacità di individuare i malati cioè i veri positivi,
la specificità invece è la sua capacità di individuare i veri negativi, ossia i sani
La curva Roc è una curva che serve ad individuare qual è la soglia da fissare per poter
avere il massimo numero di veri negativi e veri positivi in un test. Nella curva Roc la
specificità è in ascissa e la sensibilità in ordinata, in termini di percentuale. Nella curva
Roc è importante l'area sottesa dalla curva stessa perché rappresenta il prodotto tra la
specificità e la sensibilità il particolare corrisponde a base per altezza e quindi area
sottesa alla curva: là dove l'aria è più alta ho più forza. L'area sottesa dalla curva Roc ha
come valori auspicabili maggiore di 0,5 e tendente al 1 ma mai maggiore di 1. Ricorda
che l'accuratezza globale del test è tanto più elevata quanto la curva Roc si avvicina al
punto di coordinate 0 1. La curva Roc consente di evidenziare l'effetto che si ha
modificando la soglia del cut-off utilizzando un test invece di un altro. Area sottesa dalla
curva ROC: >0,5 e <1
Un test molto sensibile: individua i veri malati ma può dare falsi positivi (errore alfa)
Un test molto specifico: individua i veri sani ma può dare falsi negativi (errore beta)
Rifiutare un ipotesi quando è vera è un errore di primo tipo (errore alfa), non rifiutare un
ipotesi quando è falsa è un errore di secondo tipo (errore beta)
Esistono errori di primo tipo errore alfa ed errore di secondo tipo errore beta. Per ridurre
gli errori di primo tipo bisogna abbassare la soglia di significatività cioè ridurre Alfa,
per ridurre gli errori di secondo tipo bisogna aumentare la potenza del test.
Gli obiettivi della raccolta e analisi dei dati sono: promuovere la correttezza e la
precisione; ridurre gli errori differenziali non differenziali; ridurre la variabilità intra ad
extra osservazionale.
Esistono degli errori da valutare all'interno dei campioni che vengono analizzati negli
studi, ci possono essere degli errori di validità interna ossia errori dovuti al fatto che
vengono scelti campioni troppo diversi tra loro o che comprendono soggetti non
omogenei tra loro, ci possono anche essere errori di validità esterna cioè errori legati a
popolazioni troppo diverse. Errori inoltre si distinguono in differenziali cioè quelli
indotti da una misurazione distorto o non accurata e ed errori non differenziali cioè
casuali, quest'ultimi essendo per l'appunto casuali possono essere evitati con numerose
osservazioni, gli errori differenziali invece non sono assolutamente casuali.
CONFIDENZA E POTENZA