Sei sulla pagina 1di 65

1

Estadstica para los no estadsticos

Epidemiologa Clnica. Inferencia causal. Error aleatorio.


Deriva del hecho de tomar slo una muestra de la poblacin terica sobre la que queremos sacar conclusiones. Su importancia puede disminuirse aumentando el tamao de la muestra. Su importancia puede cuantificarse mediante test de hiptesis (probabilidad de error al rechazar la hiptesis nula de igualdad) y/o el clculo de los intervalos de confianza (valor del estimador muestral con rango poblacional). La ausencia de error aleatorio se denomina precisin.

Error aleatorio. Introduccin a favor.

Y as como el analfabetismo cierra a quien lo padece casi todas las puertas de la cultura, el anaritmetismo impide el acceso a esa puerta maestra del conocimiento objetivo que es la ciencia. Por supuesto, el discurso cientfico tambin utiliza el lenguaje verbal, incluso ms que el numrico; pero es en la cuantificacin y en la correlacin matemtica de las magnitudes donde la ciencia se realiza como tal, donde se vuelve concreta, precisa y eficaz.

Carlo CarloFrabetti. Frabetti.Anaritmetismo. Anaritmetismo.El ElPais, Pais,mircoles mircoles24 24de deenero enerode de1996. 1996.

Error aleatorio. Introduccin en contra.


La estadstica es una disciplina que debe una gran parte de su configuracin actual a las matemticas. Las matemticas, por otro lado, son un conjunto de conocimientos tericos, abstractos, cuyos creadores, la mayora de la veces, no pretendan resolver problemas prcticos, sino generar abstracciones a partir de los nmeros, deducir otros nuevos conocimientos tericos, derivables de abstracciones previas o resolver problemas, incoherencias o curiosidades generadas, como efectos secundarios, en la creacin de teoras matemticas. Considerar los conocimientos matemticos como el resultado de mentes creadoras que jugaron con smbolos o aceptaron retos de otros jugadores similares, no es alejarse excesivamente de la historia de esta ciencia.
Manzano ManzanoV. V.Inferencia Inferenciaestadstica. estadstica.Aplicaciones Aplicacionescon conSPSS/PC+. SPSS/PC+.Madrid: Madrid:RA-MA, RA-MA,1995; 1995;98. 98.

Estadstica. Proceso de medicin.


La Estadstica es la disciplina encargada del tratamiento de los datos numricos derivados de los grupos de indivduos. La Medicin es el proceso por el que se representan las propiedades de los fenmenos investigados mediante nmeros o nombres.

Unidades de anlisis son las entidades objeto de nuestro


estudio (individuos, grupos, ciudades, hospitales, etc). Las unidades de anlisis tienen caractersticas, que varian (variables) y son objeto de comparacin entre ellas.

Estadstica. Proceso de medicin.


En cada una de estas caractersticas diferentes se incluyen dimensiones o modalidades (niveles, categorias, atributos, valores). Entre las modalidades hay relaciones, en ocasiones escasas y simples y otras veces mltiples y complejas. Las Escalas de Medida de estas modalidades establecen dos tipos de variables: Cualitativas y Cuantitativas.

Estadstica. Escalas de medida.


Tipos de Escalas Nominal Variables Nominales o Categricas (Di o Policotmicas Ordinales Relacin entre valores Igualdad/desigualdad Ejemplos Raza, sexo, religin, estado civil, profesin Nivel socioeconmico, grado de mejora o empeoramiento, opiniones Grados centgrados, tiempo o longitud sin origen determinado Tensin arterial, edad, peso, grados Kelvin.

Ordinal

Igualdad/desigualdad Orden

De Cuantitivativas Intervalo contnuas o discretas De Razn Cuantitativas contnuas o Discretas

Igualdad/desigualdad Orden y Unidad de medida emprica Igualdad/desigualdad Orden y unidad emprica de medida, con cero absoluto

Las variables de las escalas nominal y ordinal son cualitativas.

Estadstica. Diseo de un cuestionario y transferencia a soporte en disco. Algunos puntos destacables.


Suele tenerse la tentacin de recoger ms informacin de la que realmente se necesita, en previsin de que pueda usarse en el futuro. Recuerda, si slo tienes que rellenar 20 items/indivduo, les dedicars ms atencin que si rellenas 50. Define bien las variables. Para rellenar la base de datos estamos precisamente en este curso; y casi, casi, slo hacemos el curso para sto. Guarda alguna copia de seguridad. Si no lo haces, te acordars de esta advertencia!. En general, la matriz de datos muestra la informacin en filas (pacientes) y columnas (variables).

Estadstica descriptiva.
Resume los valores que toman las variables en las unidades de anlisis. Atencin al examen de los datos, previo a la realizacin de tcnicas ms complejas de confirmacin de hiptesis. Importancia central de la representacin grfica. Resistencia de los estadsticos a valores extremos. Distincin entre ajuste y resduo. Apertura a la transformacin de variables para conseguir modelos ms ajustados.

10

Estadstica descriptiva y Estadstica inferencial.


Estadstica descriptiva.
Resumen de los datos para condensar la informacin.

Estadstica inferencial.
Inferir los valores de la poblacin (parmetros) basndonos en el conocimiento de los valores de la muestra (estadsticos).

11

Estadstica descriptiva.
Resumen de los valores que toman las variables en las unidades de anlisis: Variables cualitativas: Tablas de distribucin de frecuencias absolutas o relativas. Grficas (diagramas de barras y tartas). Variables cuantitativas: Medidas de tendencia central, de variabilidad, de posicin, de simetra y de apuntamiento. Grficas (histogramas, polgonos de frecuencias, arbol y hoja, caja y bigotes, nube de puntos, etc.).

12

Estadstica descriptiva. Variables cualitativas


Tablas de distribucin de frecuencias absolutas o relativas.
Se disponen en filas los valores de la variable y en columnas las frecuencias absolutas, relativas y acumuladas. Las variables cuantitativas pueden agrupar los valores en intervalos (categorizacin) y representarse tambin en una tabla de distribucin de frecuencias o categorizarse.

13

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas: Medidas de tendencia central. Media aritmtica: i =1 n (Distribuciones normales) Mediana: Valor que deja 50% de los casos a ambos lados. Igual que el P50. (distribuciones que no son normales). Moda: Valor ms frecuente.

x =
n

14

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas: Medidas de de variabilidad (dispersin). Rango: Distancia entre mayor y menor. Percentiles. Valor bajo el que se encuentra una cierta proporcin (cuartiles, deciles, n-tiles). Recorrido intercuartlico: P25 a P75. Varianza: n 1 Desviacin estandar:

xi x
1

xi x
1

s Coeficiente de variacin: CV ( x ) = 100 % x Q1 Q3


Coeficiente Variacin intercuartlico: CVI =

n 1

Q1 + Q3

Ajuste de un modelo
Media: Modelo para resumir nuestros datos. Varianza: Error promediado para evaluar el ajuste del modelo a los valores de los sujetos. Como Desviacin Estandar se expresa en las mismas unidades que la media.

15

= xi i =1 n
n

xi x 1
n 1
n

(xi x )
1

n 1

16

Estadstica descriptiva. Variables cualitativas


Grficas (diagramas de barras y tartas o sectores).

Utilidades:
Presentar la informacin. Evaluar la estructura de los datos.

Tipos:
Comparaciones de dos o ms nmeros (diagrama de barras o pictogramas). Distribucin de objetos individuales o medidas en diferentes categoras (diagrama de sectores). Mostrar el cambio en alguna cantidad con el paso del tiempo (diagrama de lneas) Mostrar la relacin entre dos mediciones (nube de puntos).

17

Estadstica descriptiva. Variables cuantitativas


Variables cuantitativas: Grficas (histogramas y polgonos de frecuencias).
Intervalos de clase, marca de clase, rango del intervalo. Pedir 22 intervalos para este fichero.

Satisfaccin del usuario en puntuacin Porcentaje vlido ,3 ,5 ,8 1,0 1,3 1,5 1,8 2,0 2,3 2,5 2,8 3,0 3,3 3,5 3,8 4,0 4,3 4,5 4,8 5,0 4,8 4,5 4,3 4,0 3,8 3,5 3,3 3,0 2,8 2,5 2,3 2,0 1,8 1,5 1,3 1,0 ,8 ,5 ,3 100,0 Porcentaje acumulado ,3 ,8 1,5 2,5 3,8 5,3 7,0 9,0 11,3 13,8 16,5 19,5 22,8 26,3 30,0 34,0 38,3 42,8 47,5 52,5 57,3 61,8 66,0 70,0 73,8 77,3 80,5 83,5 86,3 88,8 91,0 93,0 94,8 96,3 97,5 98,5 99,3 99,8 100,0

18

Vlidos

5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00 45,00 50,00 55,00 60,00 65,00 70,00 75,00 80,00 85,00 90,00 95,00 100,00 105,00 110,00 115,00 120,00 125,00 130,00 135,00 140,00 145,00 150,00 155,00 160,00 165,00 170,00 175,00 180,00 185,00 190,00 195,00 Total

Frecuencia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 400

Porcentaje ,3 ,5 ,8 1,0 1,3 1,5 1,8 2,0 2,3 2,5 2,8 3,0 3,3 3,5 3,8 4,0 4,3 4,5 4,8 5,0 4,8 4,5 4,3 4,0 3,8 3,5 3,3 3,0 2,8 2,5 2,3 2,0 1,8 1,5 1,3 1,0 ,8 ,5 ,3 100,0

Estadstica descriptiva. Variables cuantitativas

La distribucin Normal
50 40 30

20

10 Std. Dev = 40,82 Mean = 100,0 0 N = 400,00


0 5, 20 ,0 5 19 ,0 5 18 ,0 5 17 ,0 5 16 ,0 5 15 ,0 5 14 ,0 5 13 ,0 5 12 ,0 5 11 ,0 5 10 0 , 95 0 , 85 0 , 75 0 , 65 0 , 55 0 , 45 0 , 35 0 , 25 0 , 15 0 5, ,0 -5

VAR00001

50

La distribucin normal
Media, Mediana y Moda, coinciden Simtrica Unimodal Dos colas

19

40

30

Frecuencia absoluta

20

Probabilidades de los valores de la variable en los intervalos de clase.


68% (xsd) 95% (x 2sd) 99% (x 2.6sd)
Std. Dev = 40,82 Mean = 100,0 N = 400,00
0 5, 20 ,0 5 19 ,0 5 18 ,0 5 17 ,0 5 16 ,0 5 15 ,0 5 14 ,0 5 13 ,0 5 12 ,0 5 11 ,0 5 10 0 , 95 0 , 85 0 , 75 0 , 65 0 , 55 0 , 45 0 , 35 0 , 25 0 , 15 0 5, ,0 -5

10

Estadstica descriptiva. Estandarizacin de los valores de una variable con distribucin normal.
80

20

60 100

x x Z=
i

80 40

60 20 40 0 20 0,0 20,0 40,0 60,0 80,0 100,0 120,0 140,0 160,0 180,0

N ( x, s 2 ) N (0,1)
Std. Dev = 40,82 Mean = 100,0 N = 400,00 200,0 Std. Dev = 1,00 Mean = 0,00 N = 400,00 ,50 1,00 1,50 2,00 2,50

VAR00001
-2,50 -2,00 -1,50 -1,00 -,50

68% 95% 99%


0,00

Zscore(VAR00001)

21

Estadstica descriptiva. Trasformacin de variables


Tipo de transformacin Aritmtica Lineal Potencia Frmula Cambios en forma de distribucin Ausentes Reduccin de asimetra. Si q<1 a la izq. si q> 1 a la dcha. Cambio de curtosis Ms representativos los valores centrales. Ejemplo

x i = a + bx i
q x = x i i xi = log x q x = x i i

Tipificacin

Logaritmos y races plegadas Lgica

Estadstica inferencial. Muestreo aleatorio

22

Estadstica Inferencial: Estimacin de un parmetro


poblacional y pertenencia de dos muestras a la misma poblacin. Intervalo de confianza y Test de Hiptesis

23

Estadstica inferencial.
Muestreo: Permite aplicar la estadstica inferencial. Estadstica Inferencial, permite hacer inferencias sobre
los valores poblacionales:

Estima los parmetros poblacionales conociendo los estadsticos muestrales. Evalua si dos o ms muestras pertenecen a la misma poblacin.

Mtodos de inferencia:
Intervalo de confianza. Test de Hiptesis.

24

Intervalo de confianza

Teorema del Lmite Central. Inferencia de un parmetro poblacional a partir de un estimador muestral
Descriptive Statistics Std. Deviation 14,10 Age (years) Valid N (listwise) Descriptive Statistics N Age (years) Valid N (listwise) 236 236 Mean 57,07 N 236 236 Mean 55,00

25

Std. Deviation 13,35

Descriptive Statistics Std. Deviation 13,26

Descriptive Statistics

N Age (years) Valid N (listwise) 238 238

Mean 56,46

Descriptive Statistics N Age (years) Valid N (listwise) 1207 1207 Mean 56,39 Std. Deviation 13,33
Age (years) Valid N (listwise)

N 250 250

Mean 55,83

Std. Deviation 13,10

Descriptive Statistics Std. Deviation 13,30

Descriptive Statistics Std. Deviation 13,12

N Age (years) Valid N (listwise) 243 243

Mean 56,86

N Age (years) Valid N (listwise) 264 264

Mean 55,94

Descriptive Statistics Std. Deviation 13,63 Age (years) Valid N (listwise)

Descriptive Statistics Std. Deviation 12,88

N Age (years) Valid N (listwise) 258 258

Mean 56,94

N 219 219

Mean 54,93

Teorema Central del Lmite. Inferencia de un parmetro poblacional a partir de un estimador muestral
Ki n,x,s Ki,x,s Ki Ki,x,s Ki
N = tamao poblacional. n = tamao muestral. k = nmero de muestras de tamao n.

26

N, ,
Ki Ki

N = k = n

N! n! (N n)!

(*) La raiz cuadrada de este valor es el Error estandar del estimador.

Sea cual sea la distribucin de una variable aleatoria poblacional, con media y varianza 2 , la distribucin de las medias, x, de muestras de tamao n es, aproximadamente, una normal, con media y varianza 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto ms aproximadamente cuanto mayor sea el tamao de n (por tanto, a mayor n, mayor simetra de la distribucin).

27

Teorema Central del Lmite. Conociendo la media de nuestra muestra podemos inferir la media de la poblacin de donde se obtuvo.

-1.96*/n

0 Tipificacin

1.96* /n 1.96

xi N , 2 n

-1.96

Distribucin emprica

Distribucin estandarizada

xi N (0,1) n

28

Clculo del Intervalo de Confianza de un estimador


x P( 1.96 + 1.96) = 0.95 n

P(1.96 x +1.96 ) = 0.95 n n

1 96 1 96 P( x . x+ . ) = 0.95 n n
Parmetro () Estimador () 1.96 x (error estandar del estimador)

29

Error estandar y Error asociado a la estimacin o error de muestreo.


Parmetro () Estimador () 1.96 x (error estandar del estimador)

El producto 1.96 n
n

se denomina ERROR ASOCIADO A LA ESTIMACIN ERROR DE MUESTREO. El valor se denomina ERROR ESTANDAR de la media (del estimador en general), es decir la desviacin estandar de las medias muestrales (recuerda que mide la bondad de ajuste).

30

Utilidad del Intervalo de Confianza.


Porqu utilizar un nico punto de corte cuando la eleccin de ese punto es arbitraria?. Porqu reducir la cuestin de si un tratamiento es efectivo a un valor dicotmico (si/no) cuando sera ms apropiado verlo como un continuum?. Guyatt G,
Jaenschke R, Heddle N, et al. Basic statistics for clinicians. 1. Hypothesis testing. Can Med Assoc J 1995;152:27-32.

El IC proporciona un recorrido de posibilidades para el valor poblacional en la escala de magnitud de la variable medida, no una dicotoma arbitraria basada tan solo en la significacin estadstica.

31

Intervalo de confianza para medias y proporciones


La frmula del IC para un estimador de una media es:

P( x t x+t ) = 1 1 2 n 1 2 n
De manera similar, la frmula del IC para una proporcin es:

t P( p 1 2

q p +t p p 1 2 n

q p ) = 1 n

32

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.


Ho frecuencia de cncer los aos de vida son los mismos en los sujetos fumadores que en los no fumadores.
H0 p(A) = p(B) p(A) - p(B) = 0
H 0 p(A) = p(B)

H0 x(A) = x(B) x(A)- x(B) = 0

p(A) =1 p(B)

La decisin del investigador estar basada en los datos obtenidos en su muestra (informacin emprica). Si la probabilidad (que vamos a buscar en la tabla con la distribucin correspondiente al final del libro: nmero de casos y grados de libertad) de obtener unos resultados tan extremos o ms que los encontrados en nuestro estudio es demasiado pequea, nos atreveremos a rechazar H0.

Un ejemplo para entender el intervalo de confianza

33

34

Intervalo de confianza. Algunas ideas sueltas.


La magnitud del estimador indica la importancia del efecto y la amplitud del IC la cantidad de variabilidad (incertidumbre) inherente a la estimacin (muestreo). Cualquier estadstico tiene su error estandar y por tanto su IC. Si el IC no incluye el valor nulo ( para diferencias, 0, y para cocientes, 1), la p< 0,05 por definicin. Cuanto menor sea la muestra, los resultados estarn ms expuestos a no indicar la realidad de la poblacin sobre la que se desean inferir resultados, debido a la gran variabilidad del muestreo y al azar.

qu sucede si queremos tener ms o menos confianza (99%, 90%) en que el parmetro poblacional se encuentre en nuestro intervalo? Si aumentamos o disminuimos el tamao muestral?

35

1 96 1 96 P( x . x+ . ) = 0.95 n n

Tabla de valores del estadstico Z para y Nivel Estadstico Z 0.90 bilateral 1.64 0.95 unilateral 1.64 0.95 bilateral 1.96 0.99 bilateral 2.57 0.999 bilateral 3.29 0.20 0.84 0.10 1.28 0.05 1.64 0.01 2.32

36

Intervalo de Confianza. Cambios con el nivel de confianza

Intervalo de Confianza. Cambios con el nivel de confianza y el tamao muestral.

37

Intervalos de Confianza de los estimadores(*)


Decidir lo que constituye una diferencia clnicamente importante es difcil e inevitablemente arbitrario. Las caractersticas del resultado que se evala (prevenir una muerte, ictus grave, TIA), el riesgo basal, los efectos adversos, los inconvenientes y el costo, todo influye.

38

10
Diferencia de TA entre Diabticos y normales o entre no tratados y tratados con un frmaco hipotensor.

A B C D E F G

(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuanta y direccin) y no tanto en saber la probabilidad de que hallamos llegado a un resultado falso positivo (si podemos o no rechazar la hiptesis nula).

39

Clculo del tamao muestral

40

Clculo del tamao muestral. Estimacin de una media

P( 1.96 x +1.96 ) = 0.95 n n P( x 1.96 ) = 0.95 n


La distancia entre x y no puede ser mayor que el mximo error asociado a la estimacin posible para tener una seguridad del 95% de haber elegido una de las k muestras de la poblacin que nos interesa.

x 1.96 n

x <

El producto 1.96
El valor

n se denomina ERROR ESTANDAR de la media (del estimador en general).

n se denomina ERROR ASOCIADO A LA ESTIMACIN ERROR DE MUESTREO.

41

Clculo del tamao muestral. Estimacin de una media

x 1.96 n

x <

= 1.96 n
2

n = (1.96)

2 2

Tomando muestras de, como mnimo, el tamao n, podemos asegurar que en el (1- )%, usualmente 95%, de ellas obtendremos medias que no diferirn de en ms de la cantidad prefijada, .

42

Clculo del tamao muestral. Estimacin de una media y una proporcin. Factores a considerar

2 pq n = (1 . 96 ) 2
2
En consecuencia, el tamao muestral depender de las pretensiones del investigador (lo que indica la subjetividad inherente), ya que ste establecer las pautas de su estudio.

n = (1.96)

43

Test de hiptesis

44

Test de Hiptesis.
Test de hiptesis son procedimientos estadsticos que nos permiten decidir acerca de una hiptesis establecida sobre el valor de uno o ms parmetros desconocidos (relaciones entre variables); es decir, Establecer el grado de consistencia entre la hiptesis establecida y la experiencia realizada. El objetivo de los test de hiptesis consiste en ver si se puede rechazar la hiptesis de independencia entre dos variables (por ejemplo fumar y cncer de pulmn). La hiptesis formulada de esta manera se llama Hiptesis nula, Ho.

45

Test de Hiptesis. Evaluacin de una muestra.


Variable resultado (dependiente): Frecuencia de cncer de pulmn. Media de aos de supervivencia. El objetivo ser saber si los valores de las variables obtenidas en nuestra muestra son posibles en la poblacin de referencia.

46

Test de Hiptesis. Evaluacin de dos muestras.


Variable predictora (independiente, factor): Muestra A: Grupo de no fumadores. Muestra B: Grupo de fumadores. Variable resultado (dependiente): Frecuencia de cncer de pulmn. Mediana de aos de supervivencia.

47

Test de Hiptesis. Objetivo: rechazar la hiptesis nula.


Ho frecuencia de cncer los aos de vida son los mismos en los sujetos fumadores que en los no fumadores.
H0 p(A) = p(B) p(A) - p(B) = 0
H 0 x(A) = x(B) x(A) - x(B) = 0
p(A) H 0 p(A) = p(B) =1 p(B)

La decisin del investigador estar basada en los datos obtenidos en su muestra (informacin emprica). Si la probabilidad de obtener unos resultados tan extremos o ms que los encontrados en nuestro estudio es demasiado pequea, nos atreveremos a rechazar H0.

48

Test de Hiptesis. Aqu viene la p.


Ahora bien, siempre hay alguna probabilidad de que nos equivoquemos, porque la realidad (la poblacin terica de donde obtuvimos nuestra muestra) nunca estar a nuestro alcance.

DECISION INVESTIGADOR REALIDAD No rechazar Ho Ho verdadera Correcto H0 falsa Error , tipo II Rechazar Ho Error , tipo I Correcto (1-)

El test estadstico que aplicamos nos proporciona la probabilidad (p) de equivocarnos al rechazar H0.
(1- ): Potencia del test.

49

Test de Hiptesis. quin calcula la p(1)?


Naturalmente, ahora lo hacen las mquinas.
Supongamos que conocemos que el verdadero valor del colesterol de una poblacin de varones con IAM es 240 mg/dl y la d.e. es 40 mg/dl, cul es la probabilidad de obtener una muestra de 100 sujetos seleccionados aleatoriamente de esa poblacin con una media de 260 mg/dl? dicho de otra manera, cul es la probabilidad de que un grupo de 100 sujetos de esa poblacin, muestreados al azar, tenga una media de Colesterol de 260 mg/dl?. Estandarizamos y obtenemos la puntuacin Z.

Zi =

( xi i )
n

valor observado valor poblaciona l error estandar del estimador

N (0,1)

50

Test de Hiptesis. quin calcula la p (2)?


Naturalmente, ahora lo hacen las mquinas.

Zi =

( xi )
n

260 240 40 100

=5

una media de 260 mg/dl se coloca a 5 veces el error estandar de la media poblacional de 240 mg/dl. La probabilidad de inters ser < 0.001. La probabilidad de que una muestra de 100 sujetos con nivel medio de colesterol de 260 mg/dl pertenezca a la poblacin de referencia es muy pequea; sera muy raro que esta muestra perteneciera a la poblacin referida. En consecuencia, nos atrevemos a rechazar la hiptesis nula de que esta muestra de 100 sujetos pertenece a la poblacin de referencia.

51

Test de Hiptesis. Aqu viene la p.


Debe recordarse siempre que aceptar Ho no significa que sea verdadera. Para un tamao de muestras suficientemente grandes siempre podremos demostrar diferencias estadsticamente significativas.

Zi =

( xi )
n

valor observado valor poblaciona l error estandar del estimador

N (0,1)

Es fundamental establecer la diferencia clnicamente relevante ms que la estadsticamente significativa.

52

Puntos a destacar en la valoracin de los aspectos estadsticos de un estudio


Han elegido los autores el escenario de forma correcta? Han establecido si los grupos son comparables y si es necesario, han realizado ajustes para las diferencias basales?. Qu tipo de datos han utilizado?. Han usado los tests estadsticos apropiados?. Si los tests estadsticos son oscuros, porqu han decidido utilizarlos?. Los datos han sido analizados de acuerdo al protocolo original del estudio?.
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.

53

Puntos a destacar en la valoracin de los aspectos estadsticos de un estudio


Datos apareados, colas y sujetos extremos. Se han realizado tests apareados con datos apareados?. Se ha realizado una prueba de dos colas si el efecto de la intervencin puede ser tambin de tipo negativo?. Se ha tratado el problema de los sujetos extremos con sentido comn y con los ajustes estadsticos apropiados?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.

54

Puntos a destacar en la valoracin de los aspectos estadsticos de un estudio


Correlacin, regresin y causalidad:
Se ha distinguido correlacin de regresin y se ha calculado e interpretado correctamente el coeficiente de correlacin?. Se han realizado asunciones sobre la naturaleza y direccin de la causalidad?

Probabilidad y confianza. Se han calculado e interpretado correctamente los valores de la p. Se han calculado los intervalos de confianza y los reflejan las conclusiones de los autores?.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.

55

Puntos a destacar en la valoracin de los aspectos estadsticos de un estudio


Se han expresado los resultados en trminos de la probabilidad de dao o beneficio que puede esperarse en un paciente individual? Riesgo Relativo/Odds ratio. Reduccin del Riesgo Relativo. Reduccin del Riesgo Absoluto. Nmero Necesario para Tratar.

Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.

Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBU VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO CION INDEPENDEPENDIENTE LAS MUESTRAS DIENTE UNIVARIANTE O BIVARIANTE Normal Una sola Cuantitativa t-student para una muestra (Param- muestra Cualitativa Chi-cuadrado para una muestra tricos) (compara con valor terico) Dicotmica Categrica No relacionadas No existe (se usa Chi-cuadrado de Pearson) Se usa el Test de McNemar t-student muestras dependientes t-student muestras independientes

56

Relacionadas Cuantitativa Relacionadas No relacionadas

Policotmica Categrica Cuantitativa

No relacionadas No relacionadas

No existe (se usa Chi-cuadrado de Pearson ANOVA de una va (ONEWAY) ANOVA de dos vas

Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras). DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO INDEPENDIENTE DEPENDIENTE LAS MUESTRAS UNIVARIANTE O BIVARIANTE No normal Una sola muestra Binomial (No paramtri(compara con valor Chi-cuadrado de Pearson cos) terico) Chi-cuadrado de Mantel-Haenzsel Kolmogorow-Smirnov Rachas Dicotmica Categrica Relacionadas Test exacto de McNemar Prueba de los Signos Chi-cuadrado de Pearson Test exacto de Fisher Prueba de los signos Prueba de los rangos con signo de Wilcoxon Mann-Whitney W de Wilcoxon Mediana Z Kolmogorov-Smirnov Rachas de Wald-Wolfowitz Valores extremos de Moses Prueba Q de Cochran Friedman W de Kendall (concordancia) Kruskal-Wallis Mediana K variables ANOVA de dos vas por rangos

57

No relacionadas

Cuantitativas

Relacionadas

No relacionadas

Policotmica

Categrica Cuantitativa

No relacionadas Relacionadas

No relacionadas

tras). DISTRIBUCION

VARIABLE INDEPENDIENTE UNIVARIANTE O BIVARIANTE

VARIABLE DEPENDIENTE

RELACIN ENTRE LAS MUESTRAS

TEST ESTADSTICO

58

COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio) Paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Pearson pendiente o independiente No paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Spearman pendiente o independiente Correlacin Tau de Kendal REGRESIN Paramtrica Cuantitativa o Cuantitativa Regresin lineal simple Cualitativa

59

Asunciones para el uso de test paramtricos. Distribucin normal


Distribucin normal de la variable dependiente para los dos niveles del factor: Pruebas estadsticas:
Test de Kolmogorov-Smirnov con la correccion de Lilliefors y test de Shapiro-Wilk. Asimetra y curtosis.

Evaluacin grfica:
Stem & Leaf. normal probability plot (Q-Q plot). detrended normal plot (P-P plot). Histograma y curva normal: Permite echar un ojo al aspecto del histograma valorando su distribucin.

60

Asunciones para el uso de test paramtricos: Homogeneidad de las varianzas.


Homogeneidad de varianzas de la variable dependiente para cada nivel del factor que se analiza en el modelo. Pruebas estadsticas:
Test de Levene. Asimetra (uno u otro lado) y curtosis (alejadas o prximas) .

Representacin grfica
Spread vs. Level Scatter plots entre observados, predichos y residuales estandarizados.

61

Asunciones para el uso de test paramtricos: Variable medida al menos en escala de intervalo.
La variable dependiente debe medirse al menos en una escala de intervalo, de forma que existe la misma proporcin entre dos valores consecutivos de la escala.

62

Asunciones para el uso de test paramtricos: Independencia de las observaciones.


Independencia de las observaciones con distribucin aleatoria de la muestra en los diferentes subgrupos formados por las combinaciones de niveles de los factores. Esto significa que la puntuacin obtenida por un sujeto es independiente de la que obtiene otro. Prueba estadstica:
Test de las rachas.

63

Pruebas de inferencia estadstica. Comparacin de medias entre dos grupos. T de student y pruebas no paramtricas.
T de studen para una muestra. T de student para muestras independientes. T de student para muestras dependientes. Pruebas no paramtricas: Test de Mann-Whitney Test de Wilcoxon

64

Pruebas de inferencia estadstica. Comparacin de proporciones entre dos o mas grupos. Test estadstico chi-cuadrado.
Test chi cuadrado: Pearson. Correccin de continuidad de Yates. Razn de verosimilitud. Prueba exacta de Fisher. Asociacin lineal. Prueba de McNemar Prueba Q de Cochran.

Pruebas de inferencia estadstica. Comparacin de medias entre dos o mas grupos. Modelos Lineales Generalizados. ANOVA y pruebas no paramtricas.
ANOVA de una va (factor). ANOVA de dos o ms vas (factores). ANCOVA. MANOVA (anlisis multivariante de la varianza). ANOVA de medidas repetidas.

65

Potrebbero piacerti anche