Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
UNIVERSIDAD QUETZALCATL
Taller de Bioestadstica
Ing. Norma Dena Luvanos
QU ES LA ESTADSTICA?
Mentiras Aprender a interpretar y utilizar correctamente
En mi rea no es necesaria
Las Ciencias de la Salud no son deterministas El medicamento se administra a razn de 5 mg: Cada cundo? Lo nico seguro es la incertidumbre
La diabetes mata: A todo el mundo? Influye el medio ambiente? Es hereditaria? Influye la raza, el gnero, la edad?
La ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes.
Los modelos que crea la ciencia son de tipo determinista o aleatorio. La estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de la naturaleza. La Bioestadstica ensea y ayuda a investigar en todas las reas de las ciencias de la vida, donde la variabilidad no es la excepcin sino la regla. Da credibilidad a la informacin que se genera y descarta que la informacin sea producida por el azar.
APLICACIONES
Diseo de Programas de Salud Mortalidad: Causas, grupos de edad Recursos: Humanos, materiales y financieros Lneas de Investigacin Tabaquismo Virus del Papiloma Humano Obesidad Diabetes
DEFINICIN
Estadstica es la ciencia que:
Mediante mtodos sistematizados recopila, organiza y presenta datos referentes a un fenmeno que presenta variabilidad o incertidumbre, con la finalidad de Deducir (analizar e interpretar) las leyes que rigen a dichos fenmenos Y poder as hacer previsiones sobre los mismos, obtener conclusiones y tomar decisiones.
POBLACIN
Conjunto de entidades sobre el cual se est interesado en obtener conclusiones (hacer inferencias). Total de elementos en un grupo definido y delimitado. Requiere de una definicin conceptual y una delimitacin temporal.
MUESTRA
Subconjunto de la poblacin al que se tiene acceso y sobre el que realmente se hacen las observaciones (mediciones). Se conforma con miembros seleccionados de la poblacin. Debera ser representativa.
NOTA
Inferencia. Extrapolacin que se hace de los resultados de una muestra a la totalidad de elementos de la poblacin de donde se obtuvo dicha muestra. Decir algo de la poblacin a partir de la muestra.
VARIABLE
Es una caracterstica o atributo observable (cualidad o cantidad) que vara entre los diferentes individuos de una poblacin. Informacin disponible acerca de cada individuo o entidad.
Cualitativa. Sus valores no se asocian con nmeros (no se hacen operaciones algebraicas). Cuantitativa. Sus valores son numricos (se hacen operaciones algebraicas).
MEDICIN
Cuantitativa Numrica
Nmero de hijos: 0, 1, 2, 3,., > Nmero de pacientes: 0, 1, 2, 3,., > Nmero de cigarros: 0, 1, 2, 3,., >
Peso (kg) Estatura (cm) Dosis de medicamento (mg) Edad (aos, meses)
Determinar el tipo de variable, la escala de medicin y naturaleza, correspondiente a cada variable enumerada a continuacin:
Variable 1. Edad 2. Peso corporal 3. Gnero 4. Nivel escolar 5. Temperatura en C 6. Diagnstico mdico 7. Raza 8. Estado civil 9. Dolor 10. Presin intraocular 11. Nmero de hijos 12. Nmero de pacientes Tipo a) Cualitativa b) Cuantitativa i) ii) Escala Nominal Ordinal Naturaleza *) Continua **) Discreta
EJERCICIO
iii) Numrica
RESPUESTAS
Variable
1. Edad (b, iii, *) 2. Peso corporal (b, iii, *) 3. Gnero (a, i)
Tipo
a) Cualitativa b) Cuantitativa i) ii)
Escala
Nominal Ordinal
Naturaleza
*) Continua **) Discreta
iii) Numrica
VARIABLES
Sin olvidar el tipo y naturaleza de las variables, es recomendable: Codificar. Manejo de las variables mediante la asignacin de un nmero. Etiquetar. Asignacin de etiquetas a los valores de las variables.
Codificacin de respuestas especiales. Datos perdidos (missing data). 0=No sabe; 99=No contesta
EJEMPLOS
1) Gnero (Cualitativa, nominal) a) Codificacin: 1=Hombre 2=Mujer b) Etiqueta: Sexo del encuestado
2) Estado civil (Cualitativa, nominal) a) Codificacin: 5= Soltero 10= Casado 15= Divorciado 20= Viudo b) Etiqueta: Estado civil del encuestado
EJERCICIO
3) Felicidad ( a) Codificacin: )
b) Etiqueta:
RESPUESTAS
3) Felicidad (Cualitativa, ordinal) a) Codificacin: 0= No sabe 1=Muy feliz 2=Bastante feliz 3=No demasiado feliz 99=No contest b) Etiqueta: Nivel de felicidad 2) Hijos (Cuantitativa, numrica, discreta) a) Codificacin: 0, 1, 2, 3, 4, 5, 6, 7, 8 ms b) Etiqueta: Nmero de hijos
PRESENTACIN DE DATOS
Listado ordenado de datos, generalmente de menor a mayor. Tablas o Distribuciones y Grficas de Frecuencias. Formas equivalentes de presentar la informacin (variable) recopilada de una muestra.
TABLAS Y GRFICAS
8
Gnero Hombre Frecuencia 4
Mujer
Total
6
36
TABLAS O DISTRIBUCIONES DE FRECUENCIA Distribucin de Frecuencias: Es un mtodo descriptivo numrico que proporciona informacin sobre todos los posibles valores que una variable puede tomar y las veces que esos valores ocurren dentro de una categora o clase de observaciones.
DISTRIBUCIN DE FRECUENCIAS
Frecuencia absoluta. Nmero de observaciones dentro de cada categora, clase o intervalo. Frecuencia relativa. Nmero de observaciones dentro de cada categora, clase o intervalo dividido entre el total de frecuencias. Frecuencia acumulada. Nmero de observaciones que en una serie ordenada de menor a mayor son iguales o menores que un valor en particular. Variables ordinales y numricas.
Gnero
Porcentaje
Vlidos
Nivel de felicidad
Porcentaje
Porcentaje Vlido 232/760= 441/760= 87/760= 760/760= 30.5 58.0 11.5 100.0
Vlidos Muy feliz Bastante feliz No demasiado feliz Total Perdidos No contesta Total
Porcentaje 26.8 17.3 25.3 13.0 8.6 3.7 1.5 1.7 1.4 99.4 0.6 100.0
Porcentaje Vlido 27.0 17.4 25.5 13.1 8.6 3.7 1.6 1.7 1.4 100.0
Porcentaje acumulado 27.0 44.4 69.9 83.0 91.6 95.3 96.9 98.6 100.0
EJEMPLO
Nmero de hijos 0 1 2 3 4 5 6 7 8 ms Total Frecuencia 210 135 198 102 67 29 12 13 11 777 Porcentaje vlido 27.0 17.4 25.5 13.1 8.6 3.7 1.6 1.7 1.4 100.0 Porcentaje acumulado 27.0 44.4 69.9 83.0 91.6 95.3 96.9 98.6 100.0 > 50%
Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? R: X= 2 hijos Qu porcentaje de encuestados tienen exactamente 4 hijos? R: fr= el 8.6% de los encuestados
EJERCICIO
Nmero de horas de sueo de 45 pacientes de un hospital como consecuencia de la administracin de cierto anestsico:
Horas de sueo 0-2 3-5 6-8 9-11 12-14 15-17 Total Frecuencia 5 16 13 5 4 2 45 Porcentaje vlido 11.1 35.6 28.9 11.1 8.9 4.4 100.0 Porcentaje acumulado 11.1 46.7 75.6 86.7 95.6 100
Qu porcentaje de pacientes presenta entre 9 y 11 horas de sueo? Cuntos pacientes presentan menos de 6 horas de sueo? Qu porcentaje de los pacientes presentan ms de 11 horas de sueo? Qu cantidad de horas de sueo es tal que al menos el 40% de la poblacin tiene una cantidad inferior o igual?
RESPUESTAS
Qu porcentaje de pacientes presenta entre 9 y 11 horas de sueo? R: fr= el 11.1% de los pacientes
Horas de sueo 0-2 3-5 6-8 9-11 12-14 15-17 Total Frecuencia 5 16 13 5 4 2 45 Porcentaje vlido 11.1 35.6 28.9 11.1 8.9 4.4 100.0 Porcentaje acumulado 11.1 46.7 75.6 86.7 95.6 100 > 40%
Cuntos pacientes presentan menos de 6 horas de sueo? R: f(0-2)+f(3-5)=5+16=21 pacientes Qu porcentaje de los pacientes presentan menos de 15 horas de sueo? R: fa=95.6% de los pacientes Qu cantidad de horas de sueo es tal que al menos el 40% de la poblacin tiene una cantidad inferior o igual? R: X=3-5 horas de sueo
cantidada de alumnos
31%
hombes mujeres
69%
200
100 0
8 6 4 2 0 1
PARMETROS Y ESTADSTICOS
Parmetro. Cantidad numrica calculada sobre una poblacin (informacin obtenida directamente de la poblacin). Ejemplos: , , , ,
Estadstico. Cantidad numrica calculada sobre una muestra (informacin obtenida directamente de la muestra). Por ejemplo: x, s, p, n
Si el estadstico se usa para aproximar un parmetro se le denomina estimador.
ESTADSTICOS
ESTADSTICOS
Posicin. Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos (cuantiles, percentiles, cuartiles, deciles). Centralizacin. Indican valores con respecto a los que las observaciones (datos) parecen agruparse (media aritmtica, mediana, moda).
Dispersin. Representan la menor o mayor concentracin de observaciones (datos) con respecto a las medidas de centralizacin (rango, varianza, desviacin tpica o estndar, coeficiente de variacin).
Forma. Depende de la distribucin de las observaciones (datos): asimetra y apuntamiento o curtosis.
ESTADSTICOS DE POSICIN
Cuantil. Valor de la variable por debajo del cual se encuentra una frecuencia acumulada. Casos particulares: Percentil, cuartil, decil, quintil.
ESTADSTICOS DE POSICIN
Percentil de orden k=cuantil de orden k/100 La mediana es el percentil 50 El percentil de orden 15 deja por debajo al 15% de las observaciones (datos); por encima queda el 85%. Cuartil. Divide a la muestra en 4 grupos con frecuencias similares: Primer cuartil=Percentil 25=Cuantil 0.25 Segundo cuartil=Percentil 50=Cuantil 0.50=Mediana Tercer cuartil=Percentil 75=Cuantil 0.75
ESTADSTICOS DE POSICIN
Ejemplos: El 5% de los recin nacidos tiene un peso demasiado bajo. Qu peso se considera demasiado bajo? Percentil 5 o cuantil 0.05 Qu peso es superado slo por el 25% de los individuos? Percentil 75 El colesterol se distribuye simtricamente en la poblacin. Se consideran patolgicos los valores extremos. El 90% de los individuos son normales. Entre qu valores se encuentran los individuos normales? Entre el percentil 5 y el percentil 95 Entre qu valores se encuentra la mitad de los individuos ms normales de una poblacin? Entre el cuartil 1 y 3
ESTADSTICOS DE POSICIN
Estadsticos
peso
Percentiles
25 50 75
Qu peso es superado por el 25% de los individuos? Tercer cuartil=percentil 75= 80Kg
Entre qu valores se encuentra el 50% de los individuos con un peso ms normal? Entre el primer y tercer cuartil= entre 60 y 80 Kg
90 80
70
mediana
Diagrama de informacin
caja.
Sintetiza
toda
esta
60
50
ESTADSTICOS DE CENTRALIZACIN
Son medidas que buscan posiciones (valores) con respecto a los que los datos presentan una tendencia de agrupacin: Media aritmtica. Promedio de los valores de una variable. Suma de los valores dividida por el tamao de la muestra. Es conveniente cuando los datos se concentran simtricamente con respecto a ese valor. Muy sensible a valores extremos. Centro de gravedad de los datos. Mediana. Valor que divide a nmero de datos (percentil la media de los dos valores Es conveniente cuando los extremos. las observaciones en dos grupos con el mismo 50). Si el nmero de datos es par, la mediana es centrales. datos son asimtricos. No es sensible a valores
FRMULAS
Datos sin Ordenar Datos Ordenados
Media:
Media:
___
___
X X n
fX X n
Mediana:
n/ 2C Md L i f
Moda:
d1 Mo L i d1 d 2
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Total
Media:
___
3 5 10 0 3 8 6 4 5 0 13 10 7 8 8 90
4 10 1 5 8 2 9 7 13 6 14 15 3 12 11 Total
0 0 3 3 4 5 5 6 7 8 8 8 10 10 13 90
4 10 1 5 8 2 9 7 13 6 14 15 3 12 11 16 Total
0 0 3 3 4 5 5 6 7 8 8 8 10 10 13 13 90
Mediana= 6 caries
Moda= 8 caries
Md
67 6.5 2
f 5 10 21 11 5 3 3 58
MC 45 55 65 75 85 95 105
fa 5 15 36 47 52 55 58
fX n
n/ 2C Md L i f
Media = 68.8 Kg
Mo L
d1 i d1 d 2
Mediana = 66.7 Kg
Moda = 65.2 Kg
EJERCICIO
En un estudio de sobrepeso, realizado por un grupo de nutriologos, entre el personal de una empresa, se obtuvieron los siguientes I.M.C. de una muestra de la poblacin :
25.6 27.8 25.6 26.7 27.8 28.2 24.3 21.9 27.9 27.4 27.3 27.1 35.6
RESPUESTAS
Media = 27.17 Mediana = 27.30 Moda = 25.60 y 27.80 Por la media, SE DIRA QUE LA MUESTRA EST CON SOBREPESO.
OTRO.
Se realiza una investigacin sobre desarrollo de habilidades psicomotoras a un grupo de nios de entre 1 y 5 aos de edad.
A este grupo se le aplic una prueba, donde la mxima puntuacin es de 100 puntos y corresponde al grado mximo de desarrollo, y la puntuacin mnima es de cero puntos e indica que no hay desarrollo.
CALCULAR:
Media Mediana Moda A qu conclusiones se podra llegar?
RESPUESTAS
Media = 69.34 Mediana = 70 Moda = 69
Se puede concluir que: Como la media, la mediana y la moda son similares, la mayora de los nios tienen una calificacin que ronda los 70 puntos..
Informan acerca de la homogeneidad o heterogeneidad de un conjunto de datos, es decir, si ste consta de valores muy similares o muy diferentes.
X X s
2 2 i
Xi X
2
s s
ASIMETRA O SESGO
Una distribucin es simtrica, si la mitad izquierda es idntica a la mitad derecha.
Asimetra positiva (+)
En una distribucin simtrica, la media, la mediana y la moda (si slo hay una) coinciden y se ubican en el centro de la distribucin. La asimetra es positiva o negativa en funcin de a qu lado se encuentra la cola de la distribucin. La media tiende a desplazarse hacia los valores extremos (colas).
50%
Media=mediana=moda
Moda=mediana=media
50% Media=mediana=moda
50%50%
Las diferencias entre las medidas de centralizacin (media, mediana y moda) son seal de asimetra.
APUNTAMIENTO O CURTOSIS
El apuntamiento o curtosis mide el grado de apuntamiento (achatamiento) de una distribucin con respecto a la distribucin normal. Es adimensional. Leptocrtica (curtosis>0). Si la distribucin presenta colas elevadas (grficamente se suele ver como una zona central muy apuntada) le corresponde una curtosis de valor positivo. Mesocrtica (curtosis=0). Los valores de curtosis compatibles con la normalidad son los cercanos a cero. Platicrtica (curtosis<0). Cuando la distribucin de los datos no presenta colas (los datos se distribuyen ms o menos uniformemente en un intervalo) le corresponde un estadstico de curtosis con valor negativo.
EJEMPLO
El precio de un interruptor magentotrmico en 10 comercios de electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27 Euros. Obtener: La media, mediana, moda, desviacin tpica, coeficiente de variacin, diagrama de barras, diagrama de caja y asimetra.
EJEMPLO
___
X n
Xi X
2
n
Coeficiente de variacin=1.86 euros= 7.02% Asimetra=0.81 (+) Moda Mediana _ Media Cuartil 1= 2.75 Cuartil 2= 5.5 Cuartil 3= 8.25
Qu?
Sepa!