Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Y as como el analfabetismo cierra a quien lo padece casi todas las puertas de la cultura, el anaritmetismo impide el acceso a esa puerta maestra del conocimiento objetivo que es la ciencia. Por supuesto, el discurso cientfico tambin utiliza el lenguaje verbal, incluso ms que el numrico; pero es en la cuantificacin y en la correlacin matemtica de las magnitudes donde la ciencia se realiza como tal, donde se vuelve concreta, precisa y eficaz.
Carlo CarloFrabetti. Frabetti.Anaritmetismo. Anaritmetismo.El ElPais, Pais,mircoles mircoles24 24de deenero enerode de1996. 1996.
Ordinal
Igualdad/desigualdad Orden
Igualdad/desigualdad Orden y Unidad de medida emprica Igualdad/desigualdad Orden y unidad emprica de medida, con cero absoluto
Estadstica descriptiva.
Resume los valores que toman las variables en las unidades de anlisis. Atencin al examen de los datos, previo a la realizacin de tcnicas ms complejas de confirmacin de hiptesis. Importancia central de la representacin grfica. Resistencia de los estadsticos a valores extremos. Distincin entre ajuste y resduo. Apertura a la transformacin de variables para conseguir modelos ms ajustados.
10
Estadstica inferencial.
Inferir los valores de la poblacin (parmetros) basndonos en el conocimiento de los valores de la muestra (estadsticos).
11
Estadstica descriptiva.
Resumen de los valores que toman las variables en las unidades de anlisis: Variables cualitativas: Tablas de distribucin de frecuencias absolutas o relativas. Grficas (diagramas de barras y tartas). Variables cuantitativas: Medidas de tendencia central, de variabilidad, de posicin, de simetra y de apuntamiento. Grficas (histogramas, polgonos de frecuencias, arbol y hoja, caja y bigotes, nube de puntos, etc.).
12
13
x =
n
14
xi x
1
xi x
1
n 1
Q1 + Q3
Ajuste de un modelo
Media: Modelo para resumir nuestros datos. Varianza: Error promediado para evaluar el ajuste del modelo a los valores de los sujetos. Como Desviacin Estandar se expresa en las mismas unidades que la media.
15
= xi i =1 n
n
xi x 1
n 1
n
(xi x )
1
n 1
16
Utilidades:
Presentar la informacin. Evaluar la estructura de los datos.
Tipos:
Comparaciones de dos o ms nmeros (diagrama de barras o pictogramas). Distribucin de objetos individuales o medidas en diferentes categoras (diagrama de sectores). Mostrar el cambio en alguna cantidad con el paso del tiempo (diagrama de lneas) Mostrar la relacin entre dos mediciones (nube de puntos).
17
Satisfaccin del usuario en puntuacin Porcentaje vlido ,3 ,5 ,8 1,0 1,3 1,5 1,8 2,0 2,3 2,5 2,8 3,0 3,3 3,5 3,8 4,0 4,3 4,5 4,8 5,0 4,8 4,5 4,3 4,0 3,8 3,5 3,3 3,0 2,8 2,5 2,3 2,0 1,8 1,5 1,3 1,0 ,8 ,5 ,3 100,0 Porcentaje acumulado ,3 ,8 1,5 2,5 3,8 5,3 7,0 9,0 11,3 13,8 16,5 19,5 22,8 26,3 30,0 34,0 38,3 42,8 47,5 52,5 57,3 61,8 66,0 70,0 73,8 77,3 80,5 83,5 86,3 88,8 91,0 93,0 94,8 96,3 97,5 98,5 99,3 99,8 100,0
18
Vlidos
5,00 10,00 15,00 20,00 25,00 30,00 35,00 40,00 45,00 50,00 55,00 60,00 65,00 70,00 75,00 80,00 85,00 90,00 95,00 100,00 105,00 110,00 115,00 120,00 125,00 130,00 135,00 140,00 145,00 150,00 155,00 160,00 165,00 170,00 175,00 180,00 185,00 190,00 195,00 Total
Frecuencia 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 400
Porcentaje ,3 ,5 ,8 1,0 1,3 1,5 1,8 2,0 2,3 2,5 2,8 3,0 3,3 3,5 3,8 4,0 4,3 4,5 4,8 5,0 4,8 4,5 4,3 4,0 3,8 3,5 3,3 3,0 2,8 2,5 2,3 2,0 1,8 1,5 1,3 1,0 ,8 ,5 ,3 100,0
La distribucin Normal
50 40 30
20
VAR00001
50
La distribucin normal
Media, Mediana y Moda, coinciden Simtrica Unimodal Dos colas
19
40
30
Frecuencia absoluta
20
10
Estadstica descriptiva. Estandarizacin de los valores de una variable con distribucin normal.
80
20
60 100
x x Z=
i
80 40
60 20 40 0 20 0,0 20,0 40,0 60,0 80,0 100,0 120,0 140,0 160,0 180,0
N ( x, s 2 ) N (0,1)
Std. Dev = 40,82 Mean = 100,0 N = 400,00 200,0 Std. Dev = 1,00 Mean = 0,00 N = 400,00 ,50 1,00 1,50 2,00 2,50
VAR00001
-2,50 -2,00 -1,50 -1,00 -,50
Zscore(VAR00001)
21
x i = a + bx i
q x = x i i xi = log x q x = x i i
Tipificacin
22
23
Estadstica inferencial.
Muestreo: Permite aplicar la estadstica inferencial. Estadstica Inferencial, permite hacer inferencias sobre
los valores poblacionales:
Estima los parmetros poblacionales conociendo los estadsticos muestrales. Evalua si dos o ms muestras pertenecen a la misma poblacin.
Mtodos de inferencia:
Intervalo de confianza. Test de Hiptesis.
24
Intervalo de confianza
Teorema del Lmite Central. Inferencia de un parmetro poblacional a partir de un estimador muestral
Descriptive Statistics Std. Deviation 14,10 Age (years) Valid N (listwise) Descriptive Statistics N Age (years) Valid N (listwise) 236 236 Mean 57,07 N 236 236 Mean 55,00
25
Descriptive Statistics
Mean 56,46
Descriptive Statistics N Age (years) Valid N (listwise) 1207 1207 Mean 56,39 Std. Deviation 13,33
Age (years) Valid N (listwise)
N 250 250
Mean 55,83
Mean 56,86
Mean 55,94
Mean 56,94
N 219 219
Mean 54,93
Teorema Central del Lmite. Inferencia de un parmetro poblacional a partir de un estimador muestral
Ki n,x,s Ki,x,s Ki Ki,x,s Ki
N = tamao poblacional. n = tamao muestral. k = nmero de muestras de tamao n.
26
N, ,
Ki Ki
N = k = n
N! n! (N n)!
Sea cual sea la distribucin de una variable aleatoria poblacional, con media y varianza 2 , la distribucin de las medias, x, de muestras de tamao n es, aproximadamente, una normal, con media y varianza 2/n(*) (cuanto mayor sea n, menor es la varianza), y tanto ms aproximadamente cuanto mayor sea el tamao de n (por tanto, a mayor n, mayor simetra de la distribucin).
27
Teorema Central del Lmite. Conociendo la media de nuestra muestra podemos inferir la media de la poblacin de donde se obtuvo.
-1.96*/n
0 Tipificacin
1.96* /n 1.96
xi N , 2 n
-1.96
Distribucin emprica
Distribucin estandarizada
xi N (0,1) n
28
1 96 1 96 P( x . x+ . ) = 0.95 n n
Parmetro () Estimador () 1.96 x (error estandar del estimador)
29
El producto 1.96 n
n
se denomina ERROR ASOCIADO A LA ESTIMACIN ERROR DE MUESTREO. El valor se denomina ERROR ESTANDAR de la media (del estimador en general), es decir la desviacin estandar de las medias muestrales (recuerda que mide la bondad de ajuste).
30
El IC proporciona un recorrido de posibilidades para el valor poblacional en la escala de magnitud de la variable medida, no una dicotoma arbitraria basada tan solo en la significacin estadstica.
31
P( x t x+t ) = 1 1 2 n 1 2 n
De manera similar, la frmula del IC para una proporcin es:
t P( p 1 2
q p +t p p 1 2 n
q p ) = 1 n
32
p(A) =1 p(B)
La decisin del investigador estar basada en los datos obtenidos en su muestra (informacin emprica). Si la probabilidad (que vamos a buscar en la tabla con la distribucin correspondiente al final del libro: nmero de casos y grados de libertad) de obtener unos resultados tan extremos o ms que los encontrados en nuestro estudio es demasiado pequea, nos atreveremos a rechazar H0.
33
34
qu sucede si queremos tener ms o menos confianza (99%, 90%) en que el parmetro poblacional se encuentre en nuestro intervalo? Si aumentamos o disminuimos el tamao muestral?
35
1 96 1 96 P( x . x+ . ) = 0.95 n n
Tabla de valores del estadstico Z para y Nivel Estadstico Z 0.90 bilateral 1.64 0.95 unilateral 1.64 0.95 bilateral 1.96 0.99 bilateral 2.57 0.999 bilateral 3.29 0.20 0.84 0.10 1.28 0.05 1.64 0.01 2.32
36
37
38
10
Diferencia de TA entre Diabticos y normales o entre no tratados y tratados con un frmaco hipotensor.
A B C D E F G
(*) Recuerda, estamos interesados en conocer la magnitud del efecto (cuanta y direccin) y no tanto en saber la probabilidad de que hallamos llegado a un resultado falso positivo (si podemos o no rechazar la hiptesis nula).
39
40
x 1.96 n
x <
El producto 1.96
El valor
41
x 1.96 n
x <
= 1.96 n
2
n = (1.96)
2 2
Tomando muestras de, como mnimo, el tamao n, podemos asegurar que en el (1- )%, usualmente 95%, de ellas obtendremos medias que no diferirn de en ms de la cantidad prefijada, .
42
Clculo del tamao muestral. Estimacin de una media y una proporcin. Factores a considerar
2 pq n = (1 . 96 ) 2
2
En consecuencia, el tamao muestral depender de las pretensiones del investigador (lo que indica la subjetividad inherente), ya que ste establecer las pautas de su estudio.
n = (1.96)
43
Test de hiptesis
44
Test de Hiptesis.
Test de hiptesis son procedimientos estadsticos que nos permiten decidir acerca de una hiptesis establecida sobre el valor de uno o ms parmetros desconocidos (relaciones entre variables); es decir, Establecer el grado de consistencia entre la hiptesis establecida y la experiencia realizada. El objetivo de los test de hiptesis consiste en ver si se puede rechazar la hiptesis de independencia entre dos variables (por ejemplo fumar y cncer de pulmn). La hiptesis formulada de esta manera se llama Hiptesis nula, Ho.
45
46
47
La decisin del investigador estar basada en los datos obtenidos en su muestra (informacin emprica). Si la probabilidad de obtener unos resultados tan extremos o ms que los encontrados en nuestro estudio es demasiado pequea, nos atreveremos a rechazar H0.
48
DECISION INVESTIGADOR REALIDAD No rechazar Ho Ho verdadera Correcto H0 falsa Error , tipo II Rechazar Ho Error , tipo I Correcto (1-)
El test estadstico que aplicamos nos proporciona la probabilidad (p) de equivocarnos al rechazar H0.
(1- ): Potencia del test.
49
Zi =
( xi i )
n
N (0,1)
50
Zi =
( xi )
n
=5
una media de 260 mg/dl se coloca a 5 veces el error estandar de la media poblacional de 240 mg/dl. La probabilidad de inters ser < 0.001. La probabilidad de que una muestra de 100 sujetos con nivel medio de colesterol de 260 mg/dl pertenezca a la poblacin de referencia es muy pequea; sera muy raro que esta muestra perteneciera a la poblacin referida. En consecuencia, nos atrevemos a rechazar la hiptesis nula de que esta muestra de 100 sujetos pertenece a la poblacin de referencia.
51
Zi =
( xi )
n
N (0,1)
52
53
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.
54
Probabilidad y confianza. Se han calculado e interpretado correctamente los valores de la p. Se han calculado los intervalos de confianza y los reflejan las conclusiones de los autores?.
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.
55
Greenhalgh T. How to read a paper. The basics of evidence based medicine. London:BMJ Publishing Group. 1997.
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras).
DISTRIBU VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO CION INDEPENDEPENDIENTE LAS MUESTRAS DIENTE UNIVARIANTE O BIVARIANTE Normal Una sola Cuantitativa t-student para una muestra (Param- muestra Cualitativa Chi-cuadrado para una muestra tricos) (compara con valor terico) Dicotmica Categrica No relacionadas No existe (se usa Chi-cuadrado de Pearson) Se usa el Test de McNemar t-student muestras dependientes t-student muestras independientes
56
No relacionadas No relacionadas
No existe (se usa Chi-cuadrado de Pearson ANOVA de una va (ONEWAY) ANOVA de dos vas
Tipo de test estadstico a utilizar para hacer inferencias (estimacin de parmetros poblacionales o comparacin entre muestras). DISTRIBUCION VARIABLE VARIABLE RELACIN ENTRE TEST ESTADSTICO INDEPENDIENTE DEPENDIENTE LAS MUESTRAS UNIVARIANTE O BIVARIANTE No normal Una sola muestra Binomial (No paramtri(compara con valor Chi-cuadrado de Pearson cos) terico) Chi-cuadrado de Mantel-Haenzsel Kolmogorow-Smirnov Rachas Dicotmica Categrica Relacionadas Test exacto de McNemar Prueba de los Signos Chi-cuadrado de Pearson Test exacto de Fisher Prueba de los signos Prueba de los rangos con signo de Wilcoxon Mann-Whitney W de Wilcoxon Mediana Z Kolmogorov-Smirnov Rachas de Wald-Wolfowitz Valores extremos de Moses Prueba Q de Cochran Friedman W de Kendall (concordancia) Kruskal-Wallis Mediana K variables ANOVA de dos vas por rangos
57
No relacionadas
Cuantitativas
Relacionadas
No relacionadas
Policotmica
Categrica Cuantitativa
No relacionadas Relacionadas
No relacionadas
tras). DISTRIBUCION
VARIABLE DEPENDIENTE
TEST ESTADSTICO
58
COVARIACION (medidas de dos variables en los mismos sujetos o unidades de anlisis del estudio) Paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Pearson pendiente o independiente No paramtrico Ambas variables cuantitativas, pero no hay deCorrelacin de Spearman pendiente o independiente Correlacin Tau de Kendal REGRESIN Paramtrica Cuantitativa o Cuantitativa Regresin lineal simple Cualitativa
59
Evaluacin grfica:
Stem & Leaf. normal probability plot (Q-Q plot). detrended normal plot (P-P plot). Histograma y curva normal: Permite echar un ojo al aspecto del histograma valorando su distribucin.
60
Representacin grfica
Spread vs. Level Scatter plots entre observados, predichos y residuales estandarizados.
61
Asunciones para el uso de test paramtricos: Variable medida al menos en escala de intervalo.
La variable dependiente debe medirse al menos en una escala de intervalo, de forma que existe la misma proporcin entre dos valores consecutivos de la escala.
62
63
Pruebas de inferencia estadstica. Comparacin de medias entre dos grupos. T de student y pruebas no paramtricas.
T de studen para una muestra. T de student para muestras independientes. T de student para muestras dependientes. Pruebas no paramtricas: Test de Mann-Whitney Test de Wilcoxon
64
Pruebas de inferencia estadstica. Comparacin de proporciones entre dos o mas grupos. Test estadstico chi-cuadrado.
Test chi cuadrado: Pearson. Correccin de continuidad de Yates. Razn de verosimilitud. Prueba exacta de Fisher. Asociacin lineal. Prueba de McNemar Prueba Q de Cochran.
Pruebas de inferencia estadstica. Comparacin de medias entre dos o mas grupos. Modelos Lineales Generalizados. ANOVA y pruebas no paramtricas.
ANOVA de una va (factor). ANOVA de dos o ms vas (factores). ANCOVA. MANOVA (anlisis multivariante de la varianza). ANOVA de medidas repetidas.
65