Sei sulla pagina 1di 85

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

UNIVERSIDAD NACIONAL DE LOJA REA DE LA SALUD HUMANA CARRERA DE MEDICINA MDULO IV

ESTADSTICA DESCRIPTIVA

Dr. Jorge Reyes J. Marzo - 2012

1 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

INTRODUCCIN
La Constitucin Poltica del Estado, en el Art. 360, al referirse al Sistema Nacional de Salud define que .. garantizar, a travs de las instituciones que lo conforman, la promocin de la salud, prevencin y atencin integral, familiar y comunitaria, con base en la atencin primaria de salud. A continuacin menciona que articular los diferentes niveles de atencin; y promover la complementariedad con las medicinas ancestrales y alternativas, la red pblica integral de salud ser parte del sistema nacional de salud y estar conformada por el conjunto articulado de establecimientos estatales, de la seguridad social y con otros proveedores que pertenecen al Estado, con vnculos jurdicos, operativos y de complementariedad. Bajo estos preceptos constitucionales se debe organizar el sistema de salud, obviamente, reconociendo la rectora del Ministerio de Salud Pblica, con base en la Atencin Primaria de Salud, en un contexto cuya particularidad es la existencia de un modelo econmico, poltico y social distinto al neoliberal. Iniciemos mencionando que hace 30 aos, la Declaracin de Alma-Ata defini la atencin primaria de salud como un conjunto de valores rectores para el desarrollo sanitario, un conjunto de principios para la organizacin de servicios de salud y una variedad de criterios para abordar las necesidades sanitarias prioritarias y los determinantes fundamentales de la salud () Ante todo, la atencin primaria de salud ofreca una forma de organizar toda la atencin de salud, desde los hogares hasta los hospitales, en la que la prevencin era tan importante como la curacin y en la que se invertan recursos de modo racional en los distintos niveles de atencin1. Desde Alma Ata, los progresos en materia de salud han sido extremada e inadmisiblemente desiguales, y muchas poblaciones desfavorecidas se estn quedando rezagadas o incluso pierden terreno, -pero- al mismo tiempo, est cambiando radicalmente la naturaleza de los nuevos problemas sanitarios. Esto, naturalmente, tiene repercusiones sociales inocultables: La gente est cada vez ms descontenta ante la incapacidad de los servicios de salud para proporcionar un nivel de cobertura nacional que satisfaga la demanda y las nuevas necesidades, y ante el hecho de que los servicios prestados no sean acordes con sus expectativas2. En este orden de consideraciones mencionemos que la globalizacin est afectando a la cohesin social de muchos pases, y no cabe duda de que los sistemas de salud, elementos fundamentales de la estructura de las sociedades contemporneas, no estn funcionando todo lo bien que podran y deberan.3. Agreguemos que la urbanizacin, la globalizacin y otros factores aceleran la propagacin mundial de las enfermedades transmisibles y aumentan la carga de trastornos crnicos asimismo- el cambio climtico y la inseguridad alimentaria tendrn grandes repercusiones en la salud en los aos venideros, de modo que la articulacin de una respuesta eficaz y equitativa
1 2

Dra. Margaret Chan, Directora General de la OMS Informe sobre la salud en el mundo 2008 3 Informe sobre la salud en el mundo 2008

2 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

entraar enormes retos4, como advierte la OMS en el informe sobre la salud en 2008. En consecuencia, cabe una reflexin, desde nuestros haceres, sobre lo que estamos haciendo por la salud de nuestros pueblos. Ante todo eso, seguir haciendo lo habitual no es una opcin viable para los sistemas de salud. Muchos de ellos parecen hallarse a la deriva, fijndose una tras otra prioridades a corto plazo, de forma cada vez ms fragmentada y sin un sentido claro de la preparacin necesaria para afrontar el futuro. Por fortuna, el actual contexto internacional es favorable a una renovacin de la APS. La salud mundial acapara un inters sin precedentes. Se aboga cada vez ms por la unidad de accin y abundan los llamamientos en pro de la atencin integral y universal y de la salud en todas las polticas. Las expectativas nunca haban sido tan altas.5 En consecuencia es necesario construir acuerdos conceptuales sobre el significado, dimensiones, problemticas y perspectivas de la APS en diversos contextos: internacional, panamericano, nacional; identificar los aspectos relevantes para las reformas de la APS en nuestro pas relacionando con el paradigma del Buen Vivir, las propuestas de polticas y lineamientos del Plan Nacional del Buen Vivir respecto de la calidad de vida. En otras palabras, involucrarnos en una propuesta nacional, desde una perspectiva crtica. Para ello es necesario desarrollar un grado ms profundo de anlisis de los fundamentos, preceptos constitucionales y legales del Sistema Nacional de Salud; de la estructura, funcionalidad y principales programas del MSP; de la poltica nacional de salud. Obviamente, el anlisis de la APS y las polticas de salud, exige afinar la capacidad de anlisis sobre el significado y uso de los indicadores demogrficos y de enfermedad utilizados para el diagnstico de salud enfermedad atencin, que signifique desarrollar las habilidades y destrezas para construir perfiles epidemiolgicos, establecer tendencias, interpretarlos integralmente, evidenciando los postulados de la APS. En este sentido, el estudio de la Epidemiologa, como disciplina cientfica es fundamental e ineludible para los mdicos y mdicas. El estudio de la Epidemiologa exige tener conocimientos fundamentados de la bioestadstica; por ello el estudio de la bioestadstica se convierte en un instrumento para el estudio de epidemiologa. En esta primera parte abordaremos los la bioestadstica descriptiva, esperando obtener los siguientes resultados : Aplican sus conocimientos, respecto del significado y utilidad de las variables, distinguiendo las cuantitativas y cualitativas. Utilizan pertinentemente las medidas de frecuencia, tales como: proporcin, porcentaje, razn, tasas, realizan anlisis, para la caracterizacin de la situacin de salud / enfermedad de comunidades.
4 5

Resumen del Informe sobre la salud en el mundo 2008 Ibid

3 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Re-conocen el significado y aplican medidas de tendencia central a aspectos de la salud, tales como: promedios, mediana y moda. Re-conocen el significado de la distribucin normal y aplican medidas de dispersin, tales como la desviacin estndar y varianza. Recuperan sus conocimientos sobre la presentacin de datos a travs de tablas y grficos y los aplican pertinentemente. Respecto de la aplicacin de pruebas de significacin estadstica en aspectos de salud, se espera obtener los siguientes resultados: Conocen y aplican pruebas de significacin estadsticas, particularmente la comparacin de promedios y de proporciones. Mejoran sus conocimientos en la utilidad de probabilidad estadstica en salud, mediante la aplicacin del clculo de intervalo. Fundamentan el conocimiento y aplicacin de las pruebas de significacin estadstica: intervalos de confianza y estandarizan las tasas, en epidemiologa. Luego se desarrollar el anlisis estadstico aplicado a la Epidemiologa, especialmente referido al clculo del riesgo epidemiolgico mediante la aplicacin de medidas de fuerza, fundamentados en los dos grandes pilares de la epidemiologa que son la prevalencia e incidencia, para lo que se proponen los siguientes resultados esperados: Fundamentan y aplican sus conocimientos epidemiolgicos mediante el empleo de las medidas de fuerza de aplicacin estadstica: Prevalencia e Incidencia. Conocen la fundamentacin y aplican los procedimientos estadsticos para calcular los diferentes tipos de riesgo. Conocen la fundamentacin y aplican los procedimientos estadsticos de significacin para la evaluacin de pruebas. El estudio exige el conocimiento de herramientas informticas que faciliten la gestin epidemiolgica. Para ello se propone los siguientes resultados: Utilizan el programa EXEL para el clculo de los principales estadsticos indicados anteriormente. Utilizan el programa EPI-Info para disear matrices y procesar la informacin.

4 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CONTENIDOS TERICO-PRCTICOS
PRIMERA PARTE VARIABLES. VARIABLES CUALITATIVAS: NOMINALES, ORDINALES; VARIABLE CUANTITATIVAS: DISCRETAS, CONTINUAS. ANLISIS DE VARIABLES. MEDIDAS DE FRECUENCIA: PROPORCIN, PORCENTAJE, RAZN, TASAS, ANLISIS DE VARIABLES CUANTITATIVAS: RANGO O AMPLITUD, CLCULO DEL INTERVALO. MEDIDAS DE TENDENCIA CENTRAL: PROMEDIO O MEDIA (X); MEDIA ARITMTICA (PROMEDIO) CON DATOS AGRUPADOS.MEDIANA (MD).- MEDIANA EN UNA SERIE ESTADSTICA DE FRECUENCIAS; MODA. MEDIDAS DE DISPERSIN: CUARTILES, DECILES Y PERCENTILES EN SERIES ESTADSTICA DE DATOS POR FRECUENCIA; VARIANZA (S2) Y DESVIACIN ESTNDAR (DE).- VARIANZA EN DATOS AGRUPADOS.- DISTRIBUCIN NORMAL.PRESENTACIN DE DATOS: TABLAS, GRFICOS: DIAGRAMA POR SECTORES O PASTEL, GRFICO DE BARRA, HISTOGRAMA, POLGONO DE FRECUENCIAS, DIAGRAMA DE DISPERSIN, GRFICO LINEAL.

SEGUNDA PARTE: PRUEBAS DE SIGNIFICACIN: o COMPARACIN DE PROPORCIONES); PROMEDIOS: PRUEBA Z (Z DE

o COMPARACIN DE DOS PROPORCIONES; o CORRELACIN LINEAL; o INTERVALO DE PROMEDIOS; CONFIANZA PARA PROPORCIONES Y

o INTERVALO DE CONFIANZA PARA EL CASO DE TASAS.o ESTANDARIZACIN DE TASAS. MEDIDAS DE FUERZA DE ASOCIACIN.o PREVALENCIA: PREVALENCIA PUNTUAL Y DE PERODO. o INCIDENCIA: INCIDENCIA ACUMULADA, INCIDENCIA, DENSIDAD DE INCIDENCIA. TASA DE

o RIESGO EPIDEMIOLGICO. MEDIDAS DE FUERZA DE ASOCIACIN: RIESGO RELATIVO, RIESGO ATRIBUIBLE;

5 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

PROPORCIN DE RIESGO ATRIBUIBLE; NDICE INTERVENCIN, RIESGO ABSOLUTO, ODDS RATIO. EVALUACIN DE PRUEBAS: SENSIBILIDAD, VALOR PREDICTIVO POSITIVO Y NEGATIVO.

DE

ESPECIFICIDAD,

COMPETENCIAS ADQUIRIDAS

Desde la perspectiva de los procesos investigativos de salud enfermedadatencin, los estudiantes estarn en condiciones de: Identificar, caracterizar, aplicar y analizar variables investigativas cuantitativas y cualitativas en investigaciones mdico-sociales. Interpretar el significado, aplicaciones, limitaciones y ponderaciones, de las medidas de frecuencias. Calcular los intervalos de confianza e interpretar su significacin estadstica. Aplicar medidas de tendencia central e interpretar su significacin y limitaciones. Aplicar medidas de dispersin, particularmente cuartiles, deciles y percentiles, interpretar su significacin, limitaciones y ponderaciones. Procesar informacin y presentar pertinentemente en tablas y grficos. Aplicar pruebas de significacin estadstica para comparar promedios y proporciones; calcular los intervalos de confianza, interpretar su validez e implicaciones investigativas y gerenciales. Calcular los intervalos de confianza para tasas; estandarizarlas; realizar estudios comparativos, reconociendo su aplicabilidad y limitaciones. Aplicar pertinentemente medidas de fuerza de asociacin estadstica; calcular la prevalencia puntual y de periodo, la incidencia acumulada, tasa de incidencia y densidad de incidencia, en estudios epidemiolgicos, reconociendo su aplicabilidad y limitaciones. Calcular el riesgo relativo, riesgo atribuible, proporcin de riesgo atribuible, ndice de intervencin, riesgo absoluto, odds ratio, en estudios epidemiolgicos, reconociendo su aplicabilidad y limitaciones. Evaluar, desde la perspectiva epidemiolgica, las pruebas sensibilidad, especificidad, valor predictivo positivo y negativo.
6 Jorge Reyes Jaramillo

de

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

7 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

PRIMERA PARTE
VARIABLES
Las variables pueden ser definidas como cualquier cualidad del organismo, grupo o situacin capaz de adoptar valores diferentes en un mismo individuo o entre individuos, ya que a lo largo del tiempo se producen variaciones en el complejo interaccionar del hombre con el ambiente. Desde esta perspectiva tenemos diferentes tipos de variables:

VARIABLES CUALITATIVAS o categoras se refieren a propiedades del objeto en


estudio, sean estos animados o inanimados; y, no puede ser medida en lo que se refiere a la propiedad presente. En otras palabras se restringe a determinar la presencia o ausencia de dicha cualidad.

NOMINALES
Se usa cuando los datos expresa una cualidad, categora o atributo, que no tienen razn de ordenamiento, sino de clasificacin. Al utilizar este tipo de escala simplemente se cuantifica la cantidad de datos que corresponden a cada una de las caractersticas de las variables. Ejemplos: Sexo Raza Estado Civil Ocupacin Color del cabello Forma de los ojos Anote cinco ejemplos:

ORDINALES
Se utiliza para establecer una relacin de orden, entre datos que pertenecen a distintas categoras, de acuerdo a la posicin relativa respecto de otras, en base a un determinado criterio, que puede ir desde el valor inferior hasta el de valor superior o viceversa. Ejemplos: Nivel de instruccin (primaria, secundaria, superior, cuarto nivel) Condicin socio econmica (alta, media alta, media baja, popular) Grado de satisfaccin (elevado, medio, bajo) Anote cinco ejemplos:

8 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

VARIABLE CUANTITATIVAS, que puede medirse su magnitud con nmeros; es


decir, los valores de los fenmenos observados estn distribuidos a lo largo de una escala.

DISCRETAS
Son aquellas que se utilizan para presentar valores enteros (nmero finito); por ejemplo, que no pueden expresarse con decimales. Ejemplos: Nmero de hijos

CONTINUAS
Son aquellas que se utilizan para expresar cualquier valor dentro de un intervalo. Ejemplos: Talla Peso Edad IMC Anote cinco ejemplos:

Anote cinco ejemplos:

Se conocen otro tipo de clasificacin para el anlisis de datos. Los datos de intervalo, en el que secuencialmente se distribuyen a lo largo de una escala. Por ejemplo el termmetro en grados centgrados nos indica esta relacin de grado en grado. Sin embargo, no nos permite hacer un anlisis de proporcin. Por ejemplo, si se determina que un enfermo registra 37,2oC tendr una febrcula, no podra pensarse que deba tener el doble (74oC) para decir que tiene fiebre. Tambin se ubican datos de razn, que permite observar proporciones entre s. El hecho de que una persona A tenga 60 aos, respecto de otra persona B, implica que A tiene el doble de aos que B; o, dicho a la inversa, que B tiene la mitad de aos que A. Qu diferencia existe entre variables nominales y ordinales? Qu diferencia existe entre variable continua y discreta?

9 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

ANLISIS DE VARIABLES
Medidas de frecuencia
Estas medidas son: proporcin, razn y tasas y estn orientadas a permitir cuantificar, medir los eventos de enfermedad, salud, atencin, as como tambin otros eventos sanitarios. PROPORCIN, es una expresin numrica por la que se compara con el total una parte de las unidades del estudio, que puede expresarse como fraccin o decimales.

a Proporcin = -----a+b a = nmero de individuos que posee determinada caracterstica. b = nmero de individuos que no posee la caracterstica. El numerador est incluido necesariamente dentro del denominador. Ejemplo: Calcular la proporcin de la poblacin urbana de la provincia de Loja conforme a los resultados del ltimo censo poblacional. Poblacin urbana: 183.313; y, poblacin rural: 221.522 a = poblacin urbana (183.313 habitantes) b = poblacin rural (221.522 habitantes) Proporcin = 183.313 ------------183.313 + 221.522 = 0.45

Como se puede apreciar, a + b, es igual, en este caso a la poblacin total de Loja. Ejemplo: Un estudio demuestra que aproximadamente la proporcin de diabticos tipo II, en personas mayores de 40 aos es de 0,2. Si la poblacin X sobre la que se practic el estudio es de 90.000 hab. ( 40 aos en adelante).

1. Cul es el nmero aproximado de diabticos?. 2. Cmo se expresa en forma de quebrados?.


a = poblacin de diabticos 0,2 b = poblacin total 1- 0,2, = 0,8 n = poblacin total= 90.000

10 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

a= poblacin de diabticos= b= poblacin de no diabticos=

poblacin total x 0,2, 90.000 x 0,2 = 18.000 poblacin total x 0,8, 90.000 x 0,8 = 72.000

Si 0,2 es la proporcin, esto es igual 1/5. Se puede decir que la proporcin de la poblacin de diabticos es de 0,2 o de 1/5 de la poblacin de mayores de 40 aos, en la poblacin X en donde se practic el estudio. Ejercicio: Vamos a suponer que estamos analizando un programa orientado a mujeres de la comunidad en la que trabaja, con nfasis en las mujeres en edad frtil. Utilizando los datos del ltimo censo poblacional, determine qu proporcin de mujeres est en esa edad? a. b. c. d. e. A nivel nacional A nivel de la regin sierra A nivel de la provincia de Loja A nivel del cantn Loja En la parroquia urbana Sucre de la Ciudad de Loja f. En la parroquia rural El Cisne del Cantn Loja. PORCENTAJE, es el nmero de unidades que poseen determinada caracterstica dividido por el nmero total de unidades en la muestra y multiplicado por 100. a Porcentaje = ------ x 100 n Ejemplo: Calcular el porcentaje de defunciones totales de hombres, en el ao 2008, que sumaron 34,509 de un total de 60,023. a = defunciones masculinas (34.509) n = defunciones totales (60.023) Porcentaje = 34.509 ------------60.023 x 100 = 57,5%

Ejercicio: A partir de los datos oficiales del INEC, sobre defunciones en el ao 2008, que se anotan en el cuadro No. 1, proceda a:

1. En el total de defunciones, en el grupo de < de 1 ao, qu significa el


porcentaje 5,63%?. En el mismo grupo de < de 1 ao, en los varones que significa el porcentaje 5,65% y en las mujeres 5,60%. Explique. 2. En el total de defunciones, en el grupo de 15 a 49 aos, qu significa el porcentaje 22,16%?; y, en el mismo grupo, en los varones, que significa el porcentaje 27,30% y en las mujeres 15,20%. Explique. 3. Observe: En la filas que corresponden a los varones hay una primera que corresponde a valores absolutos de defunciones. A continuacin hay dos tipos 11 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

de porcentajes. Cmo se obtuvieron los porcentajes de la primera fila y, como se obtuvieron los de la segunda fila? 4. Observe la segunda fila de porcentajes de los hombres y comprela con los porcentajes de la segunda fila de las mujeres. Explique: por qu todos los porcentajes que corresponden a los hombres son mayores que los calculados para las mujeres?; y, por qu, en algunos grupos se presentan variaciones mas amplias que en otros?. 5. Analice el cuadro en su conjunto y ensaye algunas explicaciones utilizando fundamentalmente los porcentajes.

CUADRO No. 1 DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2008


GRUPOS DE EDAD (AOS) <1 5a 50 a 1a4 15 a 49 65 y + ao 14 64 60023 3380 1264 1249 13299 9292 31461 TOTAL 100 5,63 2,11 2,08 22,16 15,48 52,41 34509 1950 701 741 9420 5473 16169 HOMBRE 100,00 5,65 2,03 2,15 27,30 15,86 46,85 S 57,69 55,46 59,33 70,83 58,90 51,39 25514 1430 563 508 3879 3819 15292 MUJERES 100 5,60 2,21 1,99 15,20 14,97 59,94 42,31 44,54 40,67 29,17 41,10 48,61 TOTAL Ignora do 78 0,13 55 0,16 70,51 23 0,09 29,49

Ejercicio: 1. Mediante consulta en el INEC complete los cuadros siguientes, que corresponden a las defunciones generales por grupos de edad y sexo correspondientes a los aos 2005, 2006, 2007, 2009 y 2010; calcular los distintos porcentajes. Luego incorpore los datos del 2008. 2. Realice un estudio comparativo, en general (o con los datos totales) de los datos porcentuales de las tendencias en los distintos grupos de edad. Realice un grfico y ubique la lnea de tendencia en cada curva. a. Cul es la tendencia de los porcentajes de las defunciones en los menores de un ao? b. Cul es la tendencia de los porcentajes de las defunciones en el grupo de 65 y + aos? c. Cul es la tendencia de los porcentajes de las defunciones en los grupos de 1 a 4 aos y de 5 a 14 aos? 3. Realice un estudio comparativo de las tendencias de la mortalidad por grupos de edad y por gnero. Utilice los porcentajes calculados entre grupos. 4. Escriba 4 o 5 conclusiones puntuales.

12 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. 1A DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2005


TOTAL TOTAL HOMBRE S MUJERES <1 ao 1a4 GRUPOS DE EDAD (AOS) 5a 50 a 15 a 49 65 y + 14 64 Ignora do

CUADRO No. 1B DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2006


TOTAL TOTAL HOMBRE S MUJERES <1 ao 1a4 GRUPOS DE EDAD (AOS) 5a 50 a 15 a 49 65 y + 14 64 Ignora do

CUADRO No. 1C DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2007


TOTAL TOTAL HOMBRE S MUJERES <1 ao 1a4 GRUPOS DE EDAD (AOS) 5a 50 a 15 a 49 65 y + 14 64 Ignora do

13 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. 1D DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2009


TOTAL TOTAL HOMBRE S MUJERES <1 ao 1a4 GRUPOS DE EDAD (AOS) 5a 50 a 15 a 49 65 y + 14 64 Ignora do

CUADRO No. 1E DEFUNCIONES GENERALES POR GRUPOS DE EDAD Y SEXO. 2010


TOTAL TOTAL HOMBRE S MUJERES <1 ao 1a4 GRUPOS DE EDAD (AOS) 5a 50 a 15 a 49 65 y + 14 64 Ignora do

14 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

RAZN, es la relacin que existe entre dos variables en la que cada una posee caractersticas diferentes. Razn x = -----y

x = fenmeno observado en la situacin x. Y= fenmeno observado en la situacin y El numerador no est incluido necesariamente dentro del denominador. Ejemplo: Calcular la razn que existe entre los egresos hospitalarios de nios y nias, menores de un ao, el 2008. a = egresos nios (31.476) n = egresos nias (23.001) Razn = 31.476 ------------23.001 = 1, 37

Qu significa el valor 1,37? Ejercicio: A partir de los datos oficiales del INEC, sobre egresos hospitalarios de menores de un ao, en 2008, que se anotan en el Cuadro No. 3, proceda a determinar: 1. La razn egresos hospitalarios de nios / egresos hospitalarios nias en cada una de las enfermedades; y, 2. Avance con una explicacin sobre el significado de los datos procesados. Ejercicio: Calcule la razn de mortalidad materna (RMM) en cada uno de los aos y escriba un comentario respecto de su tendencia. RAZN DE MORTALIDAD MATERNA
AO Nmero de nacidos vivos pas Nmero de muertes maternas en el pas RMM pas Nmero de nacidos vivos Regin Costa Nmero de muertes maternas Regin Costa RMM Costa Nmero de nacidos vivos Regin Sierra Nmero de muertes maternas Regin Sierra RMM Sierra

2000 2001 2202 2003 2004 2005 2006 2007 2008 2009 2010
Fuente: INEC

15 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

TASAS, es la relacin que existe entre el nmero de eventos o fenmenos que son observados en un determinado tiempo, respecto de una poblacin dada, multiplicado por una constante. Usualmente se registran los eventos en un ao; la poblacin en la que se observa se la calcula a mitad del periodo; y, la constante k puede variar (1.000, 10.000 o 100.000 habitantes). El numerador est siempre incluido en el denominador. Las tasas tienen fundamental importancia para las actividades epidemiolgicas y de planificacin de los servicios de salud, polticas pblicas, etc. Las tasas pueden ser aplicables a distintos aspectos como los demogrficos, de estados de enfermedad, gravedad, tendencias, etc., que ms adelante sern evidenciados con su aplicacin al la APS. Ejemplo: En el ao 2008 se registraron 60.023 defunciones de un total de 13.805.095. Cul es la tasa por 1000 habitantes? No de casos Tasa = ---------------------------------------------------- x K Poblacin en el periodo de observacin 60023 Tasa = ------------------------------- x 1000 = 4,35 13805095 Analizar: 1. Cul es el significado de 4,35? 2. Par que puede servir este dato? Ejercicio: 1. Calcule las tasas de mortalidad infantil y general del Ecuador y analice su tendencia histrica. 2. Establezca las tendencias histricas del nmero de defunciones infantiles en el periodo y comprelas con la tendencia de las defunciones generales. 3. Calcule la proporcin de defunciones de < de 1 ao respecto de las defunciones generales y analice su tendencia. 4. Formule un comentario general (integral) que evidencie la utilidad del empleo de las tasas.

16 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. 2 TASAS DE MORTALIDAD INFANTIL Y GENERAL. ECUADOR 2008


AO Nmero de fallecid os < 1 ao Nacidos vivos Tasa por 1000 n.v. AO Nmero total de fallecid os Poblacin Ecuador Tasa por 1000 hab. Proporci n Def <1 ao/Def. general

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

5372 5480 4800 4530 3985 3942 3717 3715 3529 3380

305284 296149 278170 275300 262004 254362 252725 278591 283984 206215

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008

55921 56420 55214 55549 53521 54729 56825 57940 58016 60023

12120984 12298745 12479924 12660728 12842578 13026891 13215089 13408270 13605485 13805095

FUENTE: INEC

Ejercicio de integracin: En base del cuadro nmero 3, proceda a realizar los siguientes clculos: 1. La tasa de egreso hospitalario en cada una de las entidades nosolgicas que se indican; 2. El porcentaje, que representa cada una de las entidades respectos de total de egresos hospitalarios, de hombres y de mujeres; 3. La razn egresos de hombres vs. Egresos de mujeres y su valor estadstico. A partir de estas observaciones, analice lo siguiente: a. Si considera las tasas ms altas de estas entidades, podra asociar a algunos determinantes sociales?; b. Si considera el enfoque de gnero, en su conjunto, cul es la situacin? c. Si considera, una entidad aislada, qu comentario puede hacer respecto de la parlisis cerebral y otros sndromes paralticos?; y, si la compara con otras enfermedades del sistema nervioso .

17 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. 3 EGRESOS HOSPITALARIOS POR CONDICIN AL EGRESO, SEXO Y TASA DE LETALIDAD HOSPITALARIA. LISTA DE AGRUPAMIENTO DE 298 CAUSAS - CIE-10. MENORES DE UN AO
EGRESOS
DIAGNSTICOS TOTAL REPBLICA
DESNUTRICIN DEPLECIN DEL VOLUMEN OTRAS ANEMIAS OTROS TRASTORNOS ENDOCRINOS, NUTRICIONALES Y METABLICOS OTROS TUMORES IN SITU Y BENIGNOS, Y TUMORES DE COMPORMIENTO INCIERTO Y DESCONOCIDO ENFERMEDADES INFLAMATORIAS DEL SISTEMA NERVIOSO CENTRAL EPILEPSIA AFECCIONES HEMORRGICAS Y OTRAS ENFERMEDADES DE LA SANGRE Y DE LOS RGANOS HEMATOPOYTICOS OTRAS ENFERMEDADES DEL SISTEMA NERVIOSO PARLISIS CEREBRAL Y OTROS SNDROMES PARALTICOS NACIDOS VIVOS EN 2008: 206.215 * POR 1000 n. v. Porcentaje de los egresos
54477 TOTAL TASA* 100 % RAZN H/M HOMBRES 31476 100 % MUJERES 23001 100 %

330 324 187 186

1,6 1,57 0,91

1,36 1,40 1,15 1,16

190 189 100 100

140 135 87 86

0,90

159

0,57

1,24

88

71

152 85 74

1,41 1,74

89 54

63 31

1,31

42

32

73 71

2,17 0,51

50 26

23 45

FUENTE: INEC

Ejercicio: En el Ecuador, en el ao 2002, se presentaron 874.176 casos de infecciones respiratorias agudas, (IRA); en la regin sierra 365.392 casos, en la regin costa 433.887 casos; y, en la regin oriental o Amaznica, 72.141 casos. A partir de esos datos calcular las tasas y observar sus diferencias.

18 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. 4 TASAS DE INFECCIONES RESPIRATORIAS AGUDAS NACIONAL Y POR REGIONES TASA POR NMERO DE SITIO POBLACIN 10.000 CASOS DE IRA GEOGRFICO TOTAL 2002 HABITANTES 2002 2002
ECUADOR REGIN SIERRA REGIN COSTA REGIN AMAZNICA
Fuente: MSP

12156.608 5460.738 6056.223 548.419

874.176 365.392 433.887 72.141

719.09 669.13 716.43 1315.43

Analice: Cul es el significado de cada una de las tasas?. Cmo explica que la tasa de IRA en la regin oriental sea ms elevada que en las otras regiones a pesar de que el nmero de casos es menor al presentado en las otras?. Ejercicio.- Anlisis de tendencia de las infecciones respiratorias agudas 1. Calcule cada una de las tasas utilizando el cuadro. 2. Realice un grfico lineal utilizando las diferentes tasas, en el que conste la tendencia calculada matemticamente. 3. Enumere las similitudes y diferencias entre regiones. 4. Escriba un comentario en el que procure explicar las tendencias evidenciadas.
CUADRO No. 5 TENDENCIA DE LA TASAS DE INFECCIONES RESPIRATORIAS AGUDAS POR REGIONES (tasa por 10.000 hab.) ECUADOR AO Pobl acin Caso s Tasa REGION COSTA Pobla cin Caso s Tasa REGION SIERRA Pobla cin Caso s Tasa REGION ORIENTE Pobla cin Cas os Tasa

200 0 200 1 200 2 200 3 200 4 200 5 200 6 200 7 200 8 19 Jorge Reyes Jaramillo

BIOESTADSTICA 200 9 201 0

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Utilizando las mismas indicaciones del ejercicio anterior y el mismo cuadro, realice los siguientes ejercicios con: 1. DIARREA Y GASTROENTERITIS DE PRESUNTO ORIGEN INFECCIOSO. 2.- ABORTO NO ESPECIFICADO. 3.- COLELITIASIS. 4.APENDICITIS.

20 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

ANLISIS DE VARIABLES CUANTITATIVAS


Para iniciar el anlisis hay que definir lo que es el rango o amplitud, entendido como la diferencia entre el valor ms elevado y el valor ms pequeo; lo que significa que tiene el inconveniente de ser determinada por los dos valores extremos, -el menor y el mayor-, esto implica que contienen otros datos que son ignorados. Cuando tenemos valores muy amplios podemos pensar que es una muestra bastante heterognea, o, al menos, dispersa; lo contrario, una muestra ms homognea, que incidir, v.g., al contrastar proporciones. Amplitud = valor mximo valor mnimo.

CLCULO DEL INTERVALO:


Ejemplo:
Peso de veinte alumnos en Kg.: 65, 66, 55, 56, 58, 68, 77, 75, 70, 56, 76, 67, 64, 57, 60, 62, 59, 61, 74, 69 a frmula: ni = ------------ + 1 i ni i a = = = nmero de intervalos ancho del intervalo amplitud

Procedimiento: 1. Ordenar de mayor a menor.

2. Calculamos la amplitud, restando al mayor valor el ltimo: 77 Kg. 55 Kg. = 22 3. 4. Tomamos la decisin del ancho del intervalo, en este caso 4 Aplicamos la frmula:

22 ------------- + 1; = 6,5 aproximadamente 6 intervalos. 4 5. Calculamos los intervalos, desde el mayor hasta el menor. Para ello, consideramos que el lmite superior est dado por el valor mayor, en este caso 77 Kg.. Para calcular el lmite inferior de ese intervalo procedemos as: Ni = Valor superior menos el ancho del intervalo ms uno 77 - 4 + 1 = 74.

21 Jorge Reyes Jaramillo

BIOESTADSTICA 6.

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Los siguientes intervalos se disminuir el valor del ancho. As: 74 - 4 = 70, quedando la tabla de la siguiente manera: 74 70 66 62 58 54 77 73 69 65 61 57

7.

Asignamos a cada rango las frecuencias respectivas Frecuencia (ancho 4) 4 1 4 3 4 4 20 intervalos Frecuencia (ancho 5) 73 77 4 68 72 3 63 67 4 58 62 5 53 - 57 4 intervalos 72 77 66 71 60 65 54 - 59 Frecuencia (ancho 6) 4 5 6 5

intervalos 74 - 77 70 - 73 66 - 69 62 - 65 58 - 61 54 - 57 TOTAL

8.

Realicemos un ejercicio complementario, cambiando el ancho del intervalo a 6. Qu diferencias observa?.

Realizar los siguientes ejercicios:


1.Supongamos que en un estudio sobre estado nutricional, usted obtuvo los siguientes valores de IMC en varones comprendidos entre los 19 y 44 aos de edad cronolgica: 17,5; 28,3; 34,1; 20,2; 23,4; 27,8; 18,1; 33,0; 32,9; 30,1; 25,6; 24,1; 23,9; 24,2; 24,5; 23,8; 24,0; 21,7; 19,3; 19,5; 30,3; 32,1; 22,2; 25,4; 29,8; 20,1; 35,0; 34,9; 32,1; 27,6; 26,1; 23,7; 21,3. En primer lugar usted quiere hacer una distribucin que le permita conocer la normalidad del grupo, para lo cual debe decidir el ancho del intervalo, luego calcular el primer intervalo y los subsiguientes y anotar las frecuencias. En este caso deber obligatoriamente considerar un decimal. 2.Supongamos que en una investigacin obtuvo los siguientes valores de creatinina (mg/ml en sangre): 1,05; 0,93; 3,56; 0,89; 1,50; 1,57; 1,23; 0,9; 0,92; 0,96; 0,98; 0,78; 1,10; 1,09; 1,27; 0,88; 1,11; 1,16; 0,96; 1,34; 1,31; 1,06; 1,00; 0,79. Proceda a calcular el primer intervalo y los subsiguientes; anote las frecuencias; y, ensaye dos conclusiones. En este caso deber obligatoriamente considerar que los datos tienen dos decimales.

APUNTES:

22 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central son valores que se localizan en el centro de una distribucin de frecuencias; por lo que se puede decir que representa el conjunto de una serie de valores. Media o promedio Mediana Moda X Md Mo

PROMEDIO O MEDIA (X)


Es la suma de cada uno de los valores observados dividido para el nmero total de observaciones. CARACTERSTICAS: El promedio no puede ser menor al dato inferior ni mayor al dato superior. Cada uno de los valores tiene igual importancia en el clculo de la media, por tanto se tiene que utilizar todos y cada uno de los datos. Si la media es restada a cada uno de los valores la suma es cero. Es necesario distinguir la media de una muestra y la de una poblacin: la media de la muestra se representa x y la de una poblacin u. El promedio es sensible a valores extremos, la presencia de una observacin extrema, har que la media se desplace en esa direccin; por lo tanto es recomendada para describir distribuciones simtricas. Se usa slo con variables cuantitativas continuas, pues en datos nominales u ordinales da un resultado sin significado.

Si la serie de datos es simple para el clculo puede utilizarse la siguiente frmula: Promedio = = xi -----N

es el operador de sumatoria

X1= es cada uno de los valores de la serie de los datos N= es la suma del nmero total de observaciones

Ejemplo Calcular el promedio de peso de 20 estudiantes, dato en Kg. 65, 66, 55, 56, 58, 68, 77, 75, 70, 56, 76, 67, 64, 57, 60, 62, 59, 61, 74, 69 Suma de las observaciones = 1.295 23 Jorge Reyes Jaramillo

BIOESTADSTICA Promedio = 1.295 / 20= 64,75

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Ejercicio 1.- Valores de creatinina en sangre (mg/ml) de personas aparentemente normales = 1,05; 0,93; 3,56; 0,89; 1,50; 1,57; 1,23; 0,9; 0,92; 0,96; 0,98; 0,78; 1,10; 1,09; 1,27; 0,88; 1,11; 1,16; 0,96; 1,34; 1,31; 1,06; 1,00; 0,79. Calcular el promedio. Ejercicio 2.- IMC en varones comprendidos entre los 19 y 44 aos de edad cronolgica: 17,5; 28,3; 34,1; 20,2; 23,4; 27,8; 18,1; 33,0; 32,9; 30,1; 25,6; 24,1; 23,9; 24,2; 24,5; 23,8; 24,0; 21,7; 19,3; 19,5; 30,3; 32,1; 22,2; 25,4; 29,8; 20,1; 35,0; 34,9; 32,1; 27,6; 26,1; 23,7; 21,3. Calcular el promedio de IMC.

CLCULO DE LA MEDIA ARITMTICA (PROMEDIO) CON DATOS AGRUPADOS.Si los datos estn agrupados en intervalos la media se calcula con la siguiente frmula Promedio = = Xi= N= f.xi -----N

es el operador de sumatoria corresponde a la marca de clase o punto medio del intervalo i es la suma del nmero total de observaciones

A partir de los siguientes PESOS (Kg.) de estudiantes varones y mujeres, obtener el promedio, en cada uno y posteriormente analizar lo siguiente:

CUADRO No. PESOS DE 20 ESTUDIANTES VARONES Intervalo Frecuenci Punto ( Kg.) a medio f ( xi) 73 - 77 4 75 300 68 - 72 3 70 210 63 - 67 4 65 260 58 - 62 5 60 300 53 - 57 4 55 220 20 1290 PROMEDIO 64,5 Kg.

24 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CUADRO No. PESOS DE 20 ESTUDIANTES MUJERES


Intervalo ( Kg.) 73 - 77 68 - 72 63 - 67 58 - 62 53 - 57 Frecuencia Punto medio 1 75 3 70 4 65 5 60 7 55 20 PROMEDIO 61,45 Kg. f ( xi) 75 210 260 300 385 1230

Cul es el significado de 64,5 kg. y 61,45Kg? En qu rango se ubica el promedio de los varones y de las mujeres?, Podras construir un grfico pertinente, para cada uno los casos?. Qu sucede?

Realizar el siguiente ejercicio:


Los siguientes son los pesos hipotticos de recin nacidos mediante parto eutcico. Re-Calcular el promedio utilizando el programa Excel (aplique frmulas).

CUADRO No. PESOS DE RECIN NACIDOS Intervalo Frecuen Punto f ( xi) ( gr.) cia medio 4801 - 5000 2 4,900.50 9,801.00 4601 - 4800 9 4,700.50 42,304.50 4401 - 4600 20 4,500.50 90,010.00 163,419.0 4201 -4400 38 4,300.50 0 205,025.0 4001 - 4200 50 4,100.50 0 585,075.0 3801 - 4000 150 3,900.50 0 1,073,145. 3601 - 3800 290 3,700.50 00 1,155,165. 3401 - 3600 330 3,500.50 00 1,155,175. 3201 - 3400 350 3,300.50 00 1,488,240. 3001 -.3200 480 3,100.50 00 725,125.0 2801 - 3000 250 2,900.50 0 2601 - 2800 140 2,700.50 378,070.0 25 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA 0 62,512.50 32,207.00 10,502.50 7,175,776. 50

2401 - 2600 2201 - 2400 2001 - 2200

25 14 5 2.153

2,500.50 2,300.50 2,100.50

PROMEDIO 3.332,92 gr.

Describa lo siguiente: 1. Enumere que pasos dio en el programa para comprobar si los datos estn correctos. 2. Cul es el significado de 3.332,92 gr.? 3. Por qu motivos afirma que est correcto? 4. Se cumple en este ejercicio aquella regla de que Si la media es restada a cada uno de los valores la suma es cero? La media o promedio es til para calcular la media poblacional. A partir de los diagnsticos situacionales que construy, re-calcule la media poblacional general, de hombres y de mujeres, utilizando el programa Excel.

26 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

MEDIANA (MD)
Cuando tenemos un conjunto de datos y necesitamos dividirlo en partes iguales, utilizamos la mediana, que tiene su particular utilidad cuando alguna de las mediciones es demasiado elevada o pequea con respecto al resto, en este caso la mediana no ser influenciada por estos valores, por lo que es la ms recomendada para distribuciones asimtricas. Para el clculo de la mediana, primero se ordena los datos en forma descendente y se localiza el lugar de la media con la siguiente frmula: Lugar de la Md = (n+1) ------------2

Frmulas para calcular la posicin y el valor de la mediana Si n es par la mediana se encontrar: Si n es impar se encontrar: Mediana entre n/2 y (n/2) +1 Mediana en (n+1)/2

Una vez localizado el lugar de la mediana, se procede a identificar el valor del dato, en el caso que n es impar solo tomamos el valor donde cay la posicin de la mediana; cuando n es par la mediana corresponde al promedio entre los dos valores. Ejemplos Cuando el nmero es impar 13, 4, 15, 7, 9, 2, 5

CUADRO No. Ejemplo: Impar Ejemplo par orden frecuencia frecuencia orden 1 15 15 1 2 13 13 2 3 9 9 3

4
5 6 7

7
5 4 2

7
5 4

4
5 6

Lugar de Md= 7+1/2 = 4 La Mediana corresponde al nmero 7, ya que se encuentra en la cuarta ubicacin Cuando el nmero es par 13, 4, 15, 7, 9, 5 Lugar de Md= 6/2 y (6/2)+1 = 3 y 4 Ubico el nmero que se encuentra en la tercera ubicacin que es el 9; y, luego el que se encuentra en la cuarta ubicacin, es decir, el 7. Luego los sumo y divido para dos: 9 + 7 = 16 / 2 = 8

Md= 8
27 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Slo puede calcularse en variables cuantitativas tanto discretas como continuas. CLCULO DE LA MEDIANA EN UNA SERIE ESTADSTICA DE FRECUENCIAS: Para calcular la mediana en una serie estadstica de frecuencias se procede de la siguiente manera: ( N-1 / 2 - fa. m) Aplicamos la siguiente frmula: Mdn. = Li + ----------------- x i f Li = Lmite real inferior N-1 / 2 = Nmero total de casos dividido para dos fa. m = frecuencia acumulada menor i = ancho del intervalo f = frecuencia. Ejemplo: Las estaturas de los estudiantes del paralelo, S son la que se sealan a continuacin: Cuadro No. intervalo 180 - 184 175 - 179 170 - 174 165 - 169 160 - 164 155 - 159 150 - 154 Procedimiento: f 1 3 5 14 8 12 4 47 fa 47 46 43 38 24 16 4

1. Construimos una columna de frecuencias acumuladas fa. (acumulado desde


abajo hacia arriba)

2. Calculamos la mitad de los datos, dividiendo la totalidad de datos para dos. As:
N-1/2 = 47-1 / 2 = 23

3. Luego ubicamos el valor calculado, en este caso 23 en el rango que lo contiene 4. 5. 6. 7.


en la columna de frecuencias acumuladas (fa). Para el ejemplo es el 24 que est en el intervalo de 160 a 164. Se ubica la frecuencia acumuladas menor en el intervalo inferior al que se ubic la media. En este caso es 16. Calculamos el lmite real inferior (Li) que corresponde al intervalo determinado en el paso 3. (160 a 164). Para ello realizamos lo siguiente: Li = 159+ 160 / 2 = 159,5 Calculamos la frecuencia que corresponde al intervalo (160-164), que en el ejemplo es 8 A continuacin identificamos el ancho del intervalo = 5 (Este estuvo previamente determinado)

Con estos datos reemplazamos en la frmula:

28 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

( N-1 / 2 - fa. m) Mdn. = Li + ---------------------- x i f 23 - 16

= 159,5 + ----------------- x 5 8 = 163.875


En este caso el valor de la mediana es de 163.875, aproximadamente, 164 cm. de talla. Ejercicio: Los siguientes son los pesos de recin nacidos eutcicos. Calcular la mediana.

CUADRO No. frecuenc

ia Intervalo frecuen ( gr.) cia (f) acumula da (fa) 2153 4801 - 5000 2 2151 4601 - 4800 9 2142 4401 - 4600 20 2122 4201 -4400 38 2084 4001 - 4200 50 2034 3801 - 4000 150 1884 3601 - 3800 290 1594 3401 - 3600 330 3201 - 3400 3001 -.3200 2801 - 3000 2601 - 2800 2401 - 2600 2201 - 2400 2001 - 2200

350
480 250 140 25 14 5

1076 1264 .5 914 fa. m 434 184 44 19 5

2153

1076.5
( N-1 / 2 - fa. m) Mdn. = Li + ----------------- x i f 1076.5 - 914 Mdn. = 3.200,5 + ------------------ x 200 350

Mdn. = 3.293,07

29 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Analice: 1. Qu significa el valor 3.293,07? 2. Si lo compara con el valor del promedio, cmo explica la diferencia? 3. Cmo sabe que est debidamente calculada la mediana?

MODA
Es el valor que ocurre con ms frecuencia en un conjunto de observaciones. Puede aplicarse a cualquier conjunto de datos sean estos ordinales o de intervalos. En las distribuciones bimodales o trimodales es la medida de eleccin, pues tanto el promedio como la mediana no toman en consideracin la presencia de dos o ms picos Ejemplo 1.3, 4, 6, 7, 9, 9, 9. 10, 12, 14, 15, 20 La moda es 9, porque se repite ms veces Ejemplo 2.3, 4, 5, 6, 6, 7, 9, 10, 11, 12, 12, 12, 13, 16 ,17 Como se puede apreciar hay dos valores que se repiten el 6 y el 12. Aqu hay dos modas que responden a una distribucin bimodal. Ejercicios A partir de los datos del control escolar, de un periodo determinado, organice los datos considerando las siguientes variables: edad, sexo, peso y talla. Luego obtenga calcule las medidas de tendencia central (del peso en Kg., de la talla en metros e IMC). Ensaye las conclusiones que crea conveniente.

30 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

MEDIDAS DE DISPERSIN
Las medidas de dispersin muestran cmo estn distribuidos los valores alrededor del centro o promedio, cmo varan o se dispersan las observaciones. Entre las principales analizaremos las siguientes:

Cuartiles: Quintiles Deciles: Percentiles: Varianza: Desviacin estndar:

q d p S2 S

CUARTILES (q)
Son medidas de dispersin que dividen al conjunto de valores ordenados en cuatro partes iguales, de 25% cada una: Posicin primer cuartil = N-1 ------------4 ( N-1) x3 ------------4

Posicin tercer cuartil =

El cuartil 2 es equivalente a la mediana. (n-1)x2/4= (n-1)/2 Pasos a seguir: 1. Se debe ordenar los datos en orden ascendente 2. Se calcula la posicin del q1 y q3. 3. Para calcular la posicin del primer cuartil debemos dividir al nmero total de observaciones menos uno para cuatro 4. Para calcular la posicin del tercer cuartil, debemos dividir al nmero total de observaciones menos uno para cuatro, y, ese resultado multiplicarlo por 3.

EL CLCULO DE CUARTILES EN UNA SERIE ESTADSTICA DE DATOS POR FRECUENCIA


El procedimiento es muy similar al de la media aritmtica. Para ello partimos de las siguientes frmulas: N - 1 / 4 - fa.m q1 = Li + -------------------- x I f 3( N - 1) / 4 - fa.m q3 = Li + -------------------- x I 31 Jorge Reyes Jaramillo

BIOESTADSTICA f Intervalo ( gr.)


4801 - 5000 4601 - 4800 4401 - 4600 4201 -4400 4001 - 4200 3801 - 4000

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

frecuen frecuen cia cia (f) acumul ada (fa) 2153 2 2151 9 2142 20 2122 38 2084 50 2034 150

1.614,75 3601 - 3800


3401 - 3600 3201 - 3400

290
330 350

1884 (q2) 1594 fa.m 1264

538,25
3001 - 3200
2801 - 3000 2601 - 2800 2401 - 2600 2201 - 2400 2001 - 2200
q1= 2.153-1/4 q3 = (2.153-1/4)3

480
250 140 25 14 5

914 (q1) 434 fa.m 184 44 19 5

2,153

538 1,614

QUARTIL 1

Dividimos N-1/4 . 2152 / 4 = 538.0 Luego ubicamos en la tabla, en este caso la frecuencia acumulada que lo contiene es de 914, que corresponde al intervalo 3001-3200. Obtenemos el lmite real inferior = 3001 + 3000 / 2 = 3000,5 Luego la frecuencia acumulada menor (fa.m) = 434 La amplitud del intervalo = 200 Luego la frecuencia del intervalo en donde hemos ubicado la mediana = 480.

Reemplazamos en la frmula: 538,0 - 434 q1 . = 3.000,5 + ------------------ x 200 480 = 3.048,83 QUARTIL 3

Dividimos 3(N-1)/4 = 3 (538,0) = 1,614.0 32 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Luego ubicamos en la tabla, en este caso la frecuencia acumulada que lo contiene es de 1.884, que corresponden al intervalo 3601 a 3800. Lmite real inferior = 3601 + 3600 / 2 = 3600,5 Luego la frecuencia acumulada menos (fa.m) = 1594 La amplitud del intervalo = 200 Luego la frecuencia del intervalo en donde hemos ubicado la mediana = 290

Reemplazamos en la frmula: 1.614.0 - 1.594 c3 . = 3.600,5 + ------------------------ x 200 290 = 3.614,29 Reflexione: 1. Qu significa el q1 y el q3? 2. Cuntas observaciones nios- estn entre el cuartil 1 y el cuartil 3? . Qu es la desviacin intercuartlica? 3. Cuntas observaciones estn bajo el cuartil 1?. Qu significa ese dato para usted? 4. Cuntas observaciones estn sobre el cuartil 3?. Qu significa este dato para un anlisis integral? 5. Anote dos aspectos principales para los que sirve este anlisis.

EL CLCULO DE DECILES Y PERCENTILES EN UNA SERIE ESTADSTICA DE DATOS POR FRECUENCIA DECILES.Son medidas de dispersin que dividen al conjunto de valores ordenados en diez partes iguales, de 10% cada una: Posicin primer decil = N-1 ------------10 ( N-1) x 9 ------------10

Posicin noveno decil =

El decil 5 es equivalente a la mediana. DECIL 2

Dividimos 2N-1/10. (2) 2154 / 10 = 430,4 Luego ubicamos en la tabla, en este caso la frecuencia acumulada que lo contiene es de 434, que corresponde al intervalo 2801-3000. 33 Jorge Reyes Jaramillo

BIOESTADSTICA -

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Obtenemos el lmite real inferior = 2801 + 2800 / 2 = 2800,5 Luego la frecuencia acumulada menor (fa.m) = 184 La amplitud del intervalo = 200 Luego la frecuencia del intervalo en donde hemos ubicado la mediana = 250.

CUADRO No. frecuen cia acumul ada (fa) 2153 2151 2142 2122 2084 1.938,60 2034 (d9) 1884
1594

frecuen Intervalo ( gr.) cia (f)


4801 - 5000 4601 - 4800 4401 - 4600 4201 -4400 4001 - 4200 2 9 20 38 50

3801 - 4000
3601 - 3800 3401 - 3600 3201 - 3400 3001 -.3200

150
290 330 350 480

1264
914

2801 - 3000
2601 - 2800 2401 - 2600 2201 - 2400 2001 - 2200

250
140 25 14 5

430,80 434 (d2)

184 fa.m
44 19 5

2,153

430. 40 1,936. d9 = 9 (2.153+1)/10 80


d2 = 2 (2.153+1)/10

D2

= Li +

2(N-1)/10 fa.m ------------------------ x i f

d2

= 2.800.5 +

430.4 184 ------------------- x 200 250

= 2.997.62

D9

= Li +

9(N-1)/10 fa.m --------------------------------- x i

34 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA f

d9

= 3.800.5 +

1.938,8 1.884 ---------------------150

x 200

= 3.870.9
Reflexione:

1. Qu significa el d2 y el d9? 2. Cuntas observaciones nios- estn por debajo del decil 2? 3. Cuntas observaciones estn sobre el decil 9?. Qu significa ese dato para
usted? 4. Cuntas observaciones estn entre el decil 2 y el decil 9?. 5. Anote dos aspectos principales para los que sirve este anlisis.

PERCENTILES
Son medidas de dispersin que dividen al conjunto de valores ordenados en cien partes iguales, de 1% cada una: Posicin primer percentil = N-1 ------------100 3 ( N-1) ------------100

Posicin del percentil 3 =

El percentil 50 es equivalente a la mediana. A partir de los siguientes datos se requiere calcular los percentiles: 3, 5, 25, 50, 75, 90 y 95 PERCENTIL 3

Dividimos 3(N-1)/100. (3) 2152 / 100 = 64,56 Luego ubicamos en la tabla, en este caso la frecuencia acumulada que lo contiene es de 184, que corresponde al intervalo 2601-2800. Obtenemos el lmite real inferior = 2601 + 2600 / 2 = 2600,5 Luego la frecuencia acumulada menor (fa.m) = 44 La amplitud del intervalo = 200 Luego la frecuencia del intervalo en donde hemos ubicado la mediana = 140.

p3 = 3 x N-1 / 100 =

3 x 2152 / 100 =

64.56

3(N+1)/100 fa.m 35 Jorge Reyes Jaramillo

BIOESTADSTICA p3 = Li +

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA x i

-----------------------f

p3

= 2600.5 +

64.56 44 --------------------- x 200 140

= 2629.87
CUADRO No. frecuen cia acumul ada (fa) 2153 2151 2142 2122 2046,3 2084 (p95) 2034 fa. m 1884 1594 1264 914 434 184 64,62 (p3) 44 fa. m 19 5

Intervalo ( gr.) 4801 - 5000 4601 - 4800 4401 - 4600 4201 -4400 4001 - 4200 3801 - 4000 3601 - 3800 3401 - 3600 3201 - 3400 3001 -.3200 2801 - 3000 2601 - 2800 2401 - 2600 2201 - 2400 2001 - 2200

frecuen cia (f) 2 9 20 38

50
150 290 330 350 480 250

140
25 14 5 2,153

64. 62 2,046. p95 = 95 (2.153+1)/100 30


p3 = 3 (2.153+1)/100

p95

= Li +

95(N-1) /100 fa.m --------------------------- x i f 2.044.4 2.034 ---------------------------- x 200 50

p3

= 4.000.5 +

= 4.042,10

36 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Ejercicio: Tomando como ejemplo la tabla que contiene los datos de los pesos de los recin nacidos calcule los percentiles: P5, P10, P25, P75 y P90. Reflexione: Cuntos nios estn sobre el P95? Cuntos nios estn bajo el percentil 3? Cuntos estn entre el percentil 25 y el percentil 75? Cuntos estn entre el percentil 5 y el 25? Qu significa, en el campo mdico cada uno de los percentiles y con todos estos daros escriba su conclusin?.

VARIANZA (S2) Y DESVIACIN ESTNDAR

(DE)

Hasta el momento hemos analizado las medidas de tendencia central que nos muestran ciertas caractersticas de un conjunto de datos. Pero obviamente, esconden las diferencias que pueden ser grandes. Por ejemplo, cuando se habla del ingreso percpita no se pueden apreciar las grandes asimetras que pueden existir. La varianza, informa, el grado de variacin de las observaciones -al cuadradoalrededor de la media o promedio. Esto tiene que ver con la distribucin de los datos y de la homogeneidad de la muestra. La desviacin estndar (DE) es el promedio de los cuadrados de la diferencia entre la media aritmtica de una muestra y cada uno de los valores que constituyen la muestra Por razones estadsticas el denominador debe ser (n-1) Para calcular la varianza en series simples usamos la expresin (xi -x) 2 Varianza S = --------------- ; n -1
c

DE =

S2

= xi=

Sumatoria Valor observado

x= media (n-1)= nmero de observaciones 1

Para calcular la varianza en series agrupadas usamos la expresin (x.i-x) 2 Varianza = -------------- = S2 n -1 x.i = Es la marca de clase o punto medio del intervalo Pasos a seguir:

1. Colocar secuencialmente los valores de las observaciones de la variable; es decir,


las frecuencias. 2. Obtener el promedio de los valores como lo hemos indicado anteriormente. 37 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

3. Sacar la diferencia entre el valor de cada uno de los valores y el promedio, para lo
que hay que restar a cada uno de los valores el promedio. Se obtienen resultados que pueden ser positivos o negativos, que si son sumados algebraicamente darn como resultado 0. Elevar al cuadrado las desviaciones reales del promedio. Sumar todas las desviaciones elevadas al cuadrado. Dividir la sumatoria de las desviaciones elevadas al cuadrado para el total de las observaciones menos 1, por razones estadsticas. Este resultado es la varianza Si de la varianza obtenemos la raz cuadrada obtenemos la desviacin estndar (DE) que es la que ms utilizaremos.

4. 5. 6.
7. 8.

Ejemplo: Encontrar la varianza y desviacin estndar de los pesos de 24 estudiantes

1. Calculamos el promedio. Para ello sumamos todas los pesos (1.448) y


procedemos a dividir para el nmero de observaciones, en este caso son 24. El resultado es 60,33 Kg. como promedio. 2. Luego restamos a cada peso el promedio, es decir, 60,33, tal como consta en la columna (xi x); 3. Luego multiplicamos el resultado de (xi x) por si mismo, es decir, elevamos al cuadrado, como consta en la columna (xi x)2; 4. Sumamos todos los valores de la columna (xi x)2 y dividimos por el nmero de observaciones, valor al que le restamos 1. En este caso 24 1 = 23

CLCULO DE LA VARIANZA
N o. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 38 Jorge Reyes Jaramillo Peso (kg.) 56 55 59 62 58 65 61 70 68 51 54 66 52 67 60 59 64 63 57 (xi - x) -4.333 -5.333 -1.333 1.667 -2.333 4.667 0.667 9.667 7.667 -9.333 -6.333 5.667 -8.333 6.667 -0.333 -1.333 3.667 2.667 -3.333 (xi - x ) 2 18.774889 28.440889 1.776889 2.778889 5.442889 21.780889 0.444889 93.450889 58.782889 87.104889 40.106889 32.114889 69.438889 44.448889 0.110889 1.776889 13.446889 7.112889 11.108889

BIOESTADSTICA 20 21 22 23 24 x =

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA 53 63 62 59 64 1,448 60.33 Kg. -7.333 53.772889 2.667 7.112889 1.667 2.778889 -1.333 1.776889 3.667 13.446889 0 617 .01 .33 26.84 Kg2.

617,33 / 24-1

Varianza = 26,84 Kg2., como se puede apreciar esta varianza se expresa en unidades al cuadrado. Desviacin Estndar: obtenemos la raz cuadrada de 26,84 Kg2, = 5,18 Kg. Analizar que significa este resultado. VARIANZA EN DATOS AGRUPADOS A continuacin vamos a realizar el clculo de la varianza considerando que las observaciones se han distribuido en una tabla de frecuencias. Obviamente, para sacar el promedio utilizamos el mismo procedimiento empleado para sacar el promedio en datos distribuidos en frecuencias, en las que hay que calcular el punto medio del rango. Ejemplo: PESOS DE 2.153 NIOS AL NACER 1 Intervalo ( gr.)
4801 - 5000 4601 - 4800 4401 - 4600 4201 -4400 4001 - 4200 3801 - 4000 3601 - 3800 3401 - 3600 3201 - 3400

2 f
2 9 20 38 50 150 290 330 350

3 Punto medio (xi) 4,900.5 0 4,700.5 0 4,500.5 0 4,300.5 0 4,100.5 0 3,900.5 0 3,700.5 0 3,500.5 0 3,300.5 0

4 f ( xi) 9,801.00 42,304.50 90,010.00 163,419.00 205,025.00 585,075.00 1,073,145. 00 1,155,165. 00 1,155,175. 00

5 (d) ( xi - x) 1,567.58 1,367.58 1,167.58 967.58 767.58 567.58 367.58 167.58 (32.42)

6 (d2) (xi - x ) 2 2457307.0 56 1870275.0 56 1363243.0 56 936211.05 64 589179.05 64 322147.05 64 135115.05 64 28083.056 4 1051.0564

7 f (xi - x ) 2 4914614.113 16832475.51 27264861.13 35576020.14 29458952.82 48322058.46 39183366.36 9267408.612 367869.74

39 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA 54019.056 4 186987.05 725,125.00 (432.42) 64 399955.05 378,070.00 (632.42) 64 692923.05 62,512.50 (832.42) 64 (1,032.42 1065891.0 32,207.00 ) 56 (1,232.42 1518859.0 10,502.50 ) 56 7,175,776. 50 (232.42) VARIANZA: 176.375,22 gr 2 1,488,240. 00 25929147.07 46746764.1 55993707.9 17323076.41 14922474.79 7594295.282 379,697,092. 43

3001 -.3200 2801 - 3000 2601 - 2800 2401 - 2600 2201 - 2400 2001 - 2200

480 250 140 25 14 5

3,100.5 0 2,900.5 0 2,700.5 0 2,500.5 0 2,300.5 0 2,100.5 0

2153
PROMEDIO: 3.332,92gr.

Varianza: 379.697,092,43 / 2.153

PROCEDIMIENTO: 1. En la columna (1) se hacen constar los intervalos; 2. En la columna (2) se anotan todas las frecuencias que corresponden a cada intervalo 3. En la columna (3) se ha obtenido el punto medio (como se indic anteriormente para sacar la media aritmtica) 4. En la columna (4) se ha multiplicado el punto medio de la columna (3) por cada una de las frecuencias de la columna (2). Todos estos valores se suman (7,175,776.50) y se divide para la sumatoria de las frecuencias (2153). As se obtiene el promedio o media aritmtica, en este caso: 3.332,92 gr. 5. En la columna (5) se resta el promedio (3.332,92) de cada uno de los puntos medio; en el caso del primero: 4900,5 3.332,92 = 1.567,58. Como puede apreciarse aqu hay valores positivos y negativos (aquellos que estn entre parntesis) A esta columna se la llama d por desviaciones 6. En la columna (6) cada uno de los valores obtenidos en la columna (5) se multiplican por si mismos; es decir, se elevan al cuadrado. Esta es la desviacin desde el punto medio. Para el primero nmero: (1.567,58 * 1.567,58) = 2.457.307,056, en este caso gr. 2. A esta columna se la llama d 2 que significa desviaciones al cuadrado. 7. En la columna (7) se multiplican los valores de la columna (6), es decir de las desviaciones al cuadrado por las frecuencias respectivas que estn en la columna (2). Para el primer ejemplo: 2.457.307,056 * 2 = 4.914.614,113. Todos estos valores se suman, en este caso el valor es de: 379,697,092.43 8. Si el valor de la sumatoria (379,697,092.43) se divide para el total de observaciones, es decir la sumatoria de la columna (2) 2153 - 1, lo que nos da: 176.439.17 gr. 2, que es el valor de la varianza. 9. Finalmente, si de este valor obtenemos la raz cuadrada, habremos determinado la desviacin estndar que es 420,04 gr. Luego de este procedimiento proceda a realizar las siguientes operaciones y ensaye los respectivos comentarios. 1. Al promedio de este grupo de datos sume y reste la desviacin estndar (420,04 gr.). Es decir, obtiene un valor superior e inferior. 40 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

2. Entre esos dos valores calcule cuantas observaciones estn presente cuntos nios se ubican en ese espacio?. qu porcentaje corresponde? 3. Luego al promedio, sume y reste dos desviaciones estndar. De igual manera cuntos nios se ubicaran en este espacio?. qu porcentaje corresponde?. Ejercicio: Los siguientes son valores de peso de nios varones de 6, 7, 8, 9, 10, 11 y 12 aos, con los cuales usted debe construir curvas aplicadas a su comunidad, calculando los siguientes percentiles: 5, 10, 25, 20, 75, 90 y 95. Previamente debe en cada grupo debe obtener lo siguiente: promedio, mediana, desviacin estndar. Utilice el programa Excel.

41 Jorge Reyes Jaramillo

BIOESTADSTICA 10.

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

peso de nios en kilogramos


6 aos 18.0 18.1 18.5 18.6 20.2 20.3 21.0 21.1 22.5 22.6 17.7 17.8 18.3 18.4 19.4 19.5 20.0 20.1 20.1 20.2 24.0 24.2 24.1 24.3 23.9 24.1 24.5 24.7 22.2 22.4 21.9 22.1 17.1 17.3 17.9 18.1 18.7 18.9 19.0 19.2 18.3 18.4 19.4 19.5 20.0 20.1 20.1 20.2 24.0 24.2 24.1 24.3 17.1 17.2 17.9 18.0 18.7 18.8 19.0 19.1 7 aos 18.6 18.7 19.1 19.2 20.8 20.9 21.6 21.7 23.1 23.2 18.3 18.4 18.9 19.0 20.0 20.1 20.6 20.7 20.7 20.8 24.6 24.8 24.7 24.9 24.5 24.7 25.1 25.3 22.8 23.0 22.5 22.7 17.7 17.9 18.5 18.7 19.3 19.5 19.6 19.8 18.9 19.0 20.0 20.1 20.6 20.7 20.7 20.8 24.6 24.8 24.7 24.9 17.7 17.8 18.5 18.6 19.3 19.4 19.6 19.7 8aos 19.9 20.1 20.4 20.6 22.1 22.3 22.9 23.1 24.4 24.6 19.6 19.8 20.2 20.4 21.3 21.5 21.9 22.1 22.0 22.2 25.9 26.2 26.0 26.3 25.8 26.1 26.4 26.7 24.1 24.4 23.8 24.1 19.0 19.3 19.8 20.1 20.6 20.9 20.9 21.2 20.2 20.4 21.3 21.5 21.9 22.1 22.0 22.2 25.9 26.2 26.0 26.3 19.0 19.2 19.8 20.0 20.6 20.8 20.9 21.1 9 aos 21.5 21.8 22.0 22.3 23.7 24.0 24.5 24.8 26.0 26.3 21.2 21.5 21.8 22.1 22.9 23.2 23.5 23.8 23.6 23.9 27.5 27.9 27.6 28.0 27.4 27.8 28.0 28.4 25.7 26.1 25.4 25.8 20.6 21.0 21.4 21.8 22.2 22.6 22.5 22.9 21.9 22.1 23.0 23.2 23.6 23.8 23.7 23.9 27.6 27.9 27.7 28.0 20.7 20.9 21.5 21.7 22.3 22.5 22.6 22.8 10 aos 23.1 23.7 23.6 24.2 25.3 25.9 26.1 26.7 27.6 28.2 22.8 23.4 23.4 24.0 24.5 25.1 25.1 25.7 25.2 25.8 29.1 29.8 29.2 29.9 29.0 29.7 29.6 30.3 27.3 28.0 27.0 27.7 22.2 22.9 23.0 23.7 23.8 24.5 24.1 24.8 23.5 24.0 24.6 25.1 25.2 25.7 25.3 25.8 29.2 29.8 29.3 29.9 22.3 22.8 23.1 23.6 23.9 24.4 24.2 24.7 11 aos 25.0 27.1 25.5 27.6 27.2 29.3 28.0 30.1 29.5 31.6 24.7 26.8 25.3 27.4 26.4 28.5 27.0 29.1 27.1 29.2 31.0 33.2 31.1 33.3 30.9 33.1 31.5 33.7 29.2 31.4 28.9 31.1 24.1 26.3 24.9 27.1 25.7 27.9 26.0 28.2 25.4 27.4 26.5 28.5 27.1 29.1 27.2 29.2 31.1 33.2 31.2 33.3 24.2 26.2 25.0 27.0 25.8 27.8 26.1 28.1 12 aos 28.1 31.7 28.6 32.2 30.3 33.9 31.1 34.7 32.6 36.2 27.8 31.4 28.4 32.0 29.5 33.1 30.1 33.7 30.2 33.8 34.1 37.8 34.2 37.9 34.0 37.7 34.6 38.3 32.3 36.0 32.0 35.7 27.2 30.9 28.0 31.7 28.8 32.5 29.1 32.8 28.5 32.0 29.6 33.1 30.2 33.7 30.3 33.8 34.2 37.8 34.3 37.9 27.3 30.8 28.1 31.6 28.9 32.4 29.2 32.7

42 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

DISTRIBUCIN NORMAL
Muchas variables, especialmente las continuas, tienen una distribucin normal, que es una curva simtrica en forma de campana con la mayora de valores concentrados cerca del promedio y pocos valores hacia los extremos. Desde ese razonamiento, tanto el promedio, la media y la moda, de una distribucin normal, se ubican en el pico ms alto de la curva. Si tomamos como ejemplo la talla en un extremo estarn los muy altos, en el otro los ms bajos. Si consideramos el ejercicio de los pesos de los recin nacidos, los de gran peso estarn al un extremos, los de bajo peso en el otro.

Es importante recordar que muchas mediciones naturales y fsicas se comportan aproximadamente como una distribucin normal, que se puede utilizar para aproximar probabilidades de otras distribuciones; y, que, la distribucin de medias muestrales y proporcin de grandes muestras, tienden a distribuirse en forma normal, como presentamos la siguiente grfica con los pesos de los recin nacidos.

43 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Aquella rea que est entre la curva y la lnea base, que contiene el 100 por ciento de todos los casos es una distribucin normal. Entonces, en una variable normalmente distribuida, el 95% de las mediciones tienen valores comprendidos aproximadamente entre dos desviaciones estndares en torno a la media; para ser ms precisos, el 95% de las mediciones son valores que estn dentro de 1,96 desviaciones estndares respecto al promedio. GRFICO No. DISTRIBUCIN NORMAL

Del rea total de la curva normal el 68,26% cae entre -1 DE (desviacin estndar) y + 1 DE de la media; el 95,44% del rea caen entre -2DE y +2 DE de la media: el 99,74% o casi todos los casos caen entre -3 DE y +3 DE de la media. Para la representacin grfica de la curva, por tratarse de variables cuantitativas continuas se elabora un histograma con los datos disponibles. De igual manera se calcula el promedio y la desviacin estndar, valores que son fundamentales para la lectura de dicha curva.

rea bajo la curva normal


El 68 % corresponde a 1 desviacin estndar; El 90 % a 1.65 desvo estndar o desplazamiento; El 95 % a 1.96; El 99 % a 2,58; El 99.9 % a 3.29 desvos estndar o puntos Z EJERCICIOS Con el cuadro de pesos que se anotan, realice lo siguiente, en cada grupo:

1. Calcule cuantos pesos se encuentran entre la X + / - , 1 DE; X + / 2 DE.


Convierta en porcentaje. 2. Haga un slo grfico. 44 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

3. Analice comparativamente las dos muestras PESO HOMBR ES 77 76 75 74 70 69 68 67 66 65 64 62 61 60 59 58 57 56 56 55 1295 64,75 48.087 5 6,93 ( kg) MUJER ES 71 70 69 68 67 66 65 64 62 61 61 59 58 57 56 55 54 54 53 53 1223 61,15 34.827 5 5,9

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 x

s
DE

45 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

PRESENTACIN DE DATOS
a. Tablas, que deben tener los siguientes elementos:
Nmero: indica el orden de las tablas

Ttulo: debe ser claro y conciso y debe responder al qu, cundo y dnde. Cuerpo de la tabla: las filas y columnas deben de tener ttulos, deben constar las unidades especficas de medidas. Debe consignar totales. Fuente: aqu se debe citar de donde se tomaron los datos. Elaborado por: La persona quien realiz la tabla. Los cdigos, observaciones o smbolos deben aplicarse en la parte inferior de la tabla.

b.

Grficos

DIAGRAMA POR SECTORES O PASTEL


Consiste en dividir el crculo en segmentos de acuerdo al porcentaje de cada categora o clase. Debe iniciarse en el punto que coincide con la posicin 12 en el reloj y se pondr primero el mayor porcentaje siguiendo las manecillas del reloj, para luego ir disminuyendo el tamao de los segmentos de acuerdo a su magnitud. Ejemplo: De una poblacin de cien estudiantes, 29 son hombre y 71 mujeres. Cul es el grfico? Grfico Nro. DISTRIBUCIN DE UNA POBLACIN X POR SEXO, AO 2004

H bres; om 29%

M ujeres; 71%

Fuente: Elaborado:

GRFICO DE BARRA
Las barras pueden ser simples o dobles, los datos cualitativos son igualmente bien representados por este tipo de grfico. Se utiliza cuando el nmero de clases o estratos es elevado. Si existe una gran desigualdad entre las cantidades (nmero de estratos superior a cinco). Este tipo de grficos se utilizan para identificar problemas, analizar datos por grupos priorizar problemas, seleccin de estrategias, medicin de cambios antes y despus, entre otros. Note que los rectngulos o columnas estn separados.

46 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

.Grfico Nro. DISTRIBUCIN DE UNA POBLACIN X POR ESTADO CIVIL, AO 2004

35 30 25

20 1 5 1 0 5 0 Casados Solteros U.L. Divorciados Viu dos

Fuente: Elaborado:

Ejercicio No. 1
Tomando como referencia los estudiantes del curso de especialidad, organice la informacin por tablas y el grfico que corresponda: De acuerdo al sexo, estado civil, profesin, relacin de dependencia. Obtenga las proporciones y porcentajes respectivos y compare.

Ejercicio No. 2
Revise la informacin de su diagnstico de salud, para observar las variables cualitativas con el propsito de establecer la forma como se construyeron, observar si su presentacin tablas y/o grficos responden a las caractersticas descritas y adems la forma como estn analizadas.

HISTOGRAMA
Usado para las variables numricas continuas, que son los ms indicados para ensear la variacin de un proceso ya que nos muestra la distribucin de todos los valores. Si los datos son agrupados alrededor de un valor central la distribucin es normal o de Gauss. Las ordenadas o eje Y representan las frecuencias absolutas Las abscisas o eje X estn determinadas por los lmites de clases La altura de la columna corresponde a la frecuencia de clases Las bases de las columnas no son separadas

Ejemplo

47 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA Grfico Nro.

Intervalo / libras 121-130 131-140 141-150 151-160 161-170 171-180 181-190 Total
Fuente: Elaborado

f 3 6 9 14 11 5 2 50

POLGONO DE FRECUENCIAS
Es otra forma de representar grficamente la distribucin de variables cuantitativas. A menudo se constituye a partir de un histograma. Se obtiene corriendo los puntos medios de la cima de los rectngulos del histograma. Ejemplo (iguales valores de los de arriba) Grfico Nro.

Fuente: Estadsticas Elaborado: YY

48 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

DIAGRAMA DE DISPERSIN
Es til para representar dos variables cuantitativas continuas relacionadas. Por ejemplo los grficos que comparan peso y edad de un grupo de personas. Estos grficos se llaman de dispersin porque los datos son dispersos entre los ejes del grfico, ya que cada valor x puede corresponder a un valor y Ejemplo Grfico Nro. RELACIN ENTRE PESO Y EDAD EN LA POBLACIN

Fuente: Elaboracin:

GRFICO LINEAL
Se utiliza para representar variables cuantitativas, especialmente datos como el nmero de consultas, tasas de incidencia, prevalencia, mortalidad. Representa entonces variables cuantitativas discretas, en relacin con el tiempo, de manera puntual. En fin consiste en un par de ejes cartesianos en cuyas abscisas eje x se ubican las variables en estudio y en las ordenadas ejes y se registran los cambios de la misma mediante una escala de tipo aritmtico. Grfico Nro. 4 NACIDOS VIVOS EN ECUADOR 1999 - 2008

Fuente: Elaboracin:

49 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

SEGUNDA PARTE
PRUEBAS DE SIGNIFICACIN
COMPARACIN DE PROMEDIOS: PRUEBA Z (Z DE PROPORCIONES)
En el ejercicio de la pgina 42, se establecieron los siguientes datos, respecto de los pesos de un grupo de 20 hombres y 20 mujeres, pertenecientes a una misma comunidad. Nos interesa conocer si, realmente la diferencia de los promedios es real. HOMBR MUJER ES ES 64,75 61,15 x Kg. Kg. 48.087 34.827 s 5 5 6,93 DE 5,9 Kg. Kg. Para ello se aplica una prueba de significacin estadstica llamada Prueba Z6, misma que, usualmente se calcula con un nivel de significancia de 0,05 (5%), o sea 1,96. Si el valor obtenido es igual o mayor a 1,96 se acepta la hiptesis alterna y se concluye que la diferencia es estadsticamente significativa con 95% de confianza (p<0,05) La frmula es la siguiente:

X1 - X2 z = -------------------DE12 + DE22

___ n1

___ n2

64,75 - 61,15 z = ------------------------------(6,93)2 + (5,9)2

3,6 = ----------- = 1,77 < 1,96 2,03

Puntuacin Z, es la medida que indica la direccin y el grado en que un valor individual se aleja de la media, en una escala de unidades de desviacin estndar.

50 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

20
En este caso el valor observado es menor a 1,96, por lo tanto diremos que la diferencia observada, no es estadsticamente significativa; es decir que estando presente, desde la perspectiva estadstica no existe. Uno de las explicaciones puede radicar en que el tamao de la muestra resulta pequea. Si en el mismo ejemplo duplicamos exactamente las muestras (es decir 40 para hombres y 40 para mujeres) y se mantiene igual promedio e igual desviacin estndar, obtenemos que el valor cambia; en este caso: 2,5 es mayor a 1,96. Qu quiere decir?. Simplemente que con este nmero de muestra, la diferencia si existe y es estadsticamente significativa. Para que usted pueda aplicar la prueba Z en cada muestra deben existir, al menos, 30 observaciones. (En muestras menores se aplica la prueba t7)

64,75 - 61,15 z = ------------------------------(6,93)2 + (5,9)2

3,6 = ----------- = 2,5 > 1,96 1,44

40
Es posible que con un nmero de 20 la diferencia sea representativa?. Si. Primero, si la diferencia de los promedios es mayor; o, si las desviaciones estndar (DE) son menores; o, si concurren los dos hechos; es decir, si los promedios son ms diferente y las muestras ms homogneas. Se puede, con esa misma muestra hacerlas ms homogneas?. Si se en ambas se comparan los recorridos intercuartlicos y ah se recalculan los promedios.

En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. (Wikipedia)

51 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

COMPARACIN DE DOS PROPORCIONES


Iniciemos con un ejemplo. En una determinada comunidad se reportan que el 50% de nios expuestos a un problema de contaminacin enfermaron; pero que, el 30%, de quienes no estuvieron expuestos tambin enfermaron. Se desea conocer si existe o no asociacin, estadsticamente significativa, con un nivel de significancia de 0,05 (5%) que se denota como p<0,05, es decir, 95% de confianza; es decir, si la exposicin a la contaminacin est asociada a la enfermedad que presentaron los nios. Para lograr determinar se aplica la prueba estadstica de Chi 2, que consiste en comparar las frecuencias observadas, lo que se ha determinado, con las frecuencias esperadas.

CUADRO No. FRECUENCIAS OBSERVADAS


ENFERMO EXPUESTO SANO

FRECUENCIAS ESPERADAS
ENFERMO SANO

25 (a)

25 (b)

50
(a+b)

(a) (55*50) / 150 18,33 (E) (a+c)(a+b)/total (c) (55*100) / 150 36,66 (E) (a+c)(c+d)/total 55

(b) (95*50) / 150 31,66 (E) (b+d)(a+b)/total (d) (95*100) / 150 63,33 (E) (b+d)(c+d)/total 95

NO EXPUESTO

30 (c)

70 (d)

100
(c+d)

55 (a+c)

95 (b+d)

150

(25 -18,33) / 18,33 = 2,427 2 (O E) / E (30-36,66) / 36,66 = 1,21


Fuente: Elaboracin:
2

(25-31,66) / 31,66 = 1,40

(70-63,33) / 63,33 = 0,7

2,427 + 1,4 + 1,21 + 0,7 = 5, 737 > 3, 84

PONER CUADRO PAG 56

52 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Cmo se calculan las frecuencias esperadas?. Como se aprecia en la tabla de 2x2, para calcular (a) en las frecuencias esperadas se multiplica (a+c) * (a+b) y se divide para el total; para (b), (b+d) (a+b) / total; y as, como se evidencia en el ejemplo. En otras palabras, para calcular (a) se multiplica el total de la primera columna por el total de la primera fila y se divide para el total de toda la tabla, y as en cada caso. Una vez que se han calculado las frecuencias esperadas se procede a aplicar la 2 frmula: (O E) / E, en cada una de las frecuencias observadas respecto de las frecuencias esperadas; y, se procede a la sumatoria total, que en el ejemplo es 5,737. Este valor es mayor a 3,84, que es un valor calculado para una tabla de 2x2, para un grado de libertad, en la prueba de chi2, con un nivel de confianza de 95%. Otra forma de calcular el chi2 es la siguiente: n.(ad bc ) 2 X2 = ------------------------------(a+c)(b+d)(a+b)(c+d) OBSERVADO 150 ( (25*70) (30 * 25 ) 2 X2 = ------------------------------------(55)(95)(50)(100) ESPERADO 150 ( (18,33*66,33) (33,66 * 31,66 ) 2 X2 = ------------------------------------------------(55)(95)(50)(100) 3 382.203,84 = ------------------- = 0,129 26 125.000 = 150 000.000 ------------------- = 5,74 26 125.000

53 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CORRELACIN LINEAL
Es usual en las investigaciones buscar la asociacin de variables. Por ejemplo, en las medidas antropomtricas se busca determinar si la talla est asociada con el peso; si el peso est asociado al permetro abdominal, si el segmento inferior est asociado con la talla, etc.; asimismo, en otros campos se buscan asociaciones el hematocrito con la hemoglobina, la rea con la creatinina y el cido rico, etc. La coeficiente de correlacin lineal de Pearson de dos variables, r, nos indica si los puntos tienen una tendencia a disponerse alineadamente (excluyendo rectas horizontales y verticales). En ese sentido, r es til para determinar si hay relacin lineal entre dos variables, en un nivel, por intervalos o razn, pero no servir para otro tipo de relaciones. Las observaciones pueden ser representadas en un diagrama de dispersin; en las que cada individuo es un punto cuyas coordenadas son los valores de las variables; ejemplo: a cada quien corresponde un peso y una talla. En breves trminos deberemos indicar que el sentido de regresin es el de prediccin de una medida basndonos en el conocimiento de otra. Desde esa perspectiva puede determinarse correlaciones directamente proporcionales: si aumento 1 en la una variable, aumenta 1 en la otra (perfecta); y, otras que se denominan inversamente proporcionales; es decir, si aumento 1, en la una variable, disminuye 1 en la otra. El r se define como adimensional, que slo toma valores en [-1,1]; cuando el resultado es r=0 se dice que las variables son incorreladas (no tienen correlacin) y, como sealamos la relacin lineal perfecta entre dos variables, se representa por r=+1 o r=-1. Cuanto ms cerca est r de +1 o -1 mejor ser el grado de relacin lineal, descartando las observaciones anmalas.
330 280 230 180 130 80 30 14 0 1 50 16 0 1 70 18 0

r= 0 ,1
19 0 2 00

1 30 1 20 1 10 1 00 90 80 70 60 50 40 30 1 40

r=0 ,4
150 1 60 170 180 190 200

1 10 1 00 90 80 70 60 50 40 30 140 150 160 170 180

1 00 90 80 70 60 50

r = 0 ,6
190 200

40 30 1 40 150 1 60 170 1 80

r = 0 ,8
190 200

54 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

NIVEL DE MEDICIN DE LAS VARIABLES: Intervalos o razn 8 Valor de Interpretacin r -1.0 Correlacin negativa perfecta (A mayor

X, menor Y, de manera proporcional. Es decir, cada vez que aumenta una unidad, Y, disminuye siempre una cantidad constante) Esto se aplica a menor X, mayor Y)

-0,90 -0,75 -0,50 -0,25 -0,10 0,00 0,10 0,25 0,50 0,75 0,90 1,00

Correlacin negativa muy fuerte Correlacin negativa considerable Correlacin negativa media Correlacin negativa dbil Correlacin negativa muy dbil No existe correlacin entre las variables Correlacin positiva muy dbil Correlacin positiva dbil Correlacin positiva media Correlacin positiva considerable Correlacin positiva muy fuerte Correlacin positiva perfecta (A mayor

X, mayor Y, de manera proporcional. Es decir, cada vez que aumenta una unidad, Y, aumenta siempre una cantidad constante)

Tratemos de analizar un ejemplo de peso respecto de la altura de un grupo de estudiantes de primaria.


TAL PESO LA (lbs) (cm. ) 1 132 120 2 130 125 3 141 131 4 135 119 5 120 125 6 118 119 7 128 131 8 134 124 9 131 130 10 139 126
N o. No .

11 12 13 14 15 16 17 18 19 20

TAL PES LA O (cm. (lbs) ) 133 120 131 125 142 131 136 119 121 125 119 119 129 131 135 124 132 130 140 126

No.

PESO (lbs)
21 22 23 24 25 26 27 28 29 30

TALL A (cm.) 121 126 132 120 126 120 132 125 131 127

131 129 140 134 119 117 127 133 130 138

n = 30

n (Exy)-(Ex)(Ey) r = ----------------------------------------

(n(Ex2)-(Ex)2) (n(Ey2)-(Ey)2)
8

Hernndez S., Roberto, Metodologa de la Investigacin, Quinta Edicin, 2010, pg. 312

55 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

30 (492.086)-(3.924) (3.760)

r = ---------------------------------------------------------------------

(30 (514.798)- 15397.776) (30(471.848)- 14137.600)


8.340

r = ----------- = 0,295
28.227,7

Ahora bien, este valor estara ubicado cercano a una correlacin lineal dbil; en otras palabras, la correlacin entre el peso y la talla de esta muestra sera dbil. Sin embargo, hay que calcular la significancia, es decir, p. Si es 0,05, la probabilidad de error es menor de 5% (*) y, si es de 0,01, la probabilidad de error es menor de 1% (**). Sin embargo digamos que una correlacin puede ser significativa, pero si es menor de 0,30 resulta dbil.9 Es necesario referirnos brevemente a la VARIANZA DE FACTORES COMUNES, que nos indica el porcentaje de variacin ocasionado por la variable 1 sobre la variable 2 y viceversa. A esto se denomina COEFICIENTE DE DETERMINACIN; para ello se eleva al cuadro el valor de r. En el ejemplo anterior: Si a r = 0,295 lo elevamos al cuadrado obtenemos el siguiente valor: r2= 0,087. Este valor multiplicamos por 100 y optemos 8,7%. En conclusin, de este ejemplo podemos decir que solamente la talla constituye el 8,7% de la variacin del peso; o que, el peso solamente explica el 8,7% de la talla. Tomemos un ejemplo: En una medicin de 487 recin nacidos a trminos se determina que el coeficiente de correlacin lineal, entre peso y talla es de r = 0,65 y r 2= 0,424. Queremos conocer, a partir de esa muestra la significancia de r y de r2; determinar la magnitud de la correlacin y el significado de r2, 0, 42*100= 42%.

Hernndez S., Roberto, Metodologa de la Investigacin, Quinta Edicin, 2010, pg. 313

56 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

nmero de recin nacidos evaluados sumatoria pesos sumatoria talla sumatoria cuadrados de pesos sumatoria cuadrados de tallas sumatoria de pesos por tallas r r2

487 1529307 23904 4895876083 1175687 75371865 0,651307319 0,424201223

En un estudio realizado en la ciudad de Loja, en 147 pacientes diabticos 10 de diferente sexo, tiempo de evolucin y tratamiento de la enfermedad, mediante la aplicacin de pruebas sanguneas se obtuvieron las siguientes correlaciones. VARIABLES
Correlacin AST vs. ALT Correlacin GGT vs. FA Correlacin AST vs. GGT Correlacin colesterol triglicricos Correlacin ALT vs. GGT Correlacin AST vs. FA Correlacin ALT vs. FA Correlacin colesterol - albmina Correlacin triglicridos albumina

r
0,885 0,577 0,466 0,417 0,415 0,202 0,155 0,078 -0,085

r2
0,78312 8 0,33328 1 0,21759 5 0,17396 7 0,17230 2 0,04097 8 0,02397 9 0,00605 7 0,00715 8

Realice el siguiente anlisis: 1. Escriba el significado de cada una de las correlaciones lineales y el coeficiente de determinacin; 2. Analice en su conjunto y trate de obtener conclusiones mediante asociaciones parciales que den cuenta por qu hay correlaciones altas, medias y prcticamente inexistentes; y, el significado de la correlacin negativa.

10

Tesis de postgrado de Gastroenterologa, Universidad Nacional de Loja, ASH.- Astudillo, Vernica, Dra.; 2012.

57 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

INTERVALO DE CONFIANZA PARA PROPORCIONES Y PROMEDIOS


Usualmente, la mayora de estudios que se realizan culminan en el clculo de uno o varios promedios o de una o varias proporciones, porcentajes o tasas. Lamentablemente, no se completa el estudio desde la perspectiva que lo que se obtuvo es un clculo matemtico, obtenido de una muestra, que puede tener, -realmente tiene- un error. Por ejemplo: el porcentaje de desnutricin infantil, de obesidad, de hipertensos, de diabticos tipo II, etc. La idea es que, cuando se tiene una proporcin, ejemplo: el 18% de la poblacin mayor de cuarenta aos, en la ciudad X, tiene diabetes mellitus tipo II, implica que un porcentaje es posible que est por debajo de 18% y otro sobre. El error estndar nos indica, con determinado nivel de confianza, usualmente 95%, el margen dentro del que puede estar esta proporcin (18%). A esto se llama intervalo de confianza, mismo que est determinado por lmites: uno superior y otro inferior. Por cierto esto, como veremos adelante, est determinado por el tamao de la muestra. De igual manera para el caso de los promedios o medias aritmticas. As, podemos determinar el intervalo de confianza de un determinado promedio, para lo que se debe combinar la informacin del error estndar de la media, la distribucin normal y la precisin magnitud dentro de la cual se quiere permanecer a cada uno de los lados de la media, para lo que se multiplica el error estndar de la media por Z 11. Recordemos entonces, que as se puede calcular el intervalo de confianza, que es un intervalo dentro del cual se puede encontrar un parmetro determinado y que es necesario incorporarlo a nuestros anlisis. Se aplica la siguiente frmula: IC = X Z (EEM) IC= Intervalo de confianza X = Media Z = Variacin estndar normal EEM = Error estndar de la media = Desviacin estndar / raz cuadrada del total de datos Partamos de un ejemplo: Se han pesado 20 varones y 20 mujeres obteniendo la informacin que se exponen en el cuadro. Deseamos calcular los intervalos de confianza para los promedios de hombres y mujeres, con una precisin de 1,96 (2 DE)

IC hombres = 64,75 + / - 1,96 (EEM)


EEM = DE/n = 6.93/20 = 1.55 d = Precisin = ( EEM )( Z) = d = (1,55) (1.96) = 3.04 IC al 95 % = 64,75 + / - 3,04 LCs = 64,75 + 3,04 = 61,71 LCi = 64,75 - 3,04 = 67,79. .
11

Cuadro No. HOMBR MUJER ES ES x 64,75 61,15 48.087 34.827 s 5 5 DE 6,93 5,9

Z Es el nmero de errores estndar que define el intervalo entre la media verdadera y la media obtenida en la muestra. Se usa para transformar los valores observados a la escala de la curva normal

58 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

IC hombres = 64,75 + / - 1,96 (EEM)


EEM = DE/n = 6.93/20 = 1.55 d = Precisin = ( EEM )( Z) d = (1,55) (1.96) = 3.04 IC al 95 % = 64,75 + / - 3,04 LCi = 64,75 + 3,04 = 61,71 LCs = 64,75 - 3,04 = 67,79.

IC mujeres = 61,15 + / - 1,96 (EEM)


EEM = DE/n = 5.9/20 = 1.32 d = Precisin = ( EEM )( Z) d = (1,32) (1.96) = 2.59 IC al 95 % = 61.15 + / - 2,59 Kg. LCs = 61.15 + 2,59 = 63,74 Kg. LCi = 61.15 - 2,59 = 58,56 Kg.

Podemos decir, con una seguridad del 95%, que el intervalo de confianza para el promedio de peso de los hombres (64,75 Kg.) se encuentra entre 61,71 Kg. y 67,79 Kg. En otras palabras, entre cien posibilidades, slo 5 orientaran a que el promedio este bajo 61,17 Kg. (2,5%) o sobre 67,79 Kg. (2,5%). De igual manera, el peso promedio de las mujeres (61,15 Kg.) se encuentra entre 63,74Kg. , lmite de confianza superior y 58,56 Kg., que es el lmite de confianza inferior.
LCS

LCS

LCI

LCI

Realice los siguientes ejercicios y extraiga las conclusiones: 1. Cul intervalo es mas amplio: el de hombres o de mujeres?. Cmo explica esta diferencia si las muestras son iguales? 2. Si el intervalo de confianza lo calcula con el 99% de seguridad, qu pasa con los lmites de confianza? Amenta, disminuyen, se mantienen iguales? 3. Si en lugar de tener una muestra de 20 hombres y 20 mujeres, manteniendo el mismo promedio y desviacin estndar, calculamos con 40 personas, en cada grupo, qu pasa con el EEM?; y, por ende qu pasa con el intervalo de confianza?. Se entrecruzan los lmites de confianza; en este caso, el LCI de hombres con el LCS de mujeres?

59 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

4. En el ejemplo que venimos analizando el promedio de peso de los hombres es


mayor al de las mujeres. Podra afirmar que esta estadsticamente significativa con una confianza del 95%). diferencia es

Ahora tratemos sobre los intervalos de confianza, al 95%, para el caso de proporciones. Igualmente analicemos un ejemplo. El 18% (p) de la poblacin mayor
de cuarenta aos, en la ciudad X, tiene diabetes mellitus tipo II. Deseamos conocer el intervalo de confianza de esta proporcin, a partir de que el anlisis se realiz en una muestra de 580 personas (n). En forma similar a los promedios aqu la frmula es la siguiente: p + / - = 1,96 p (1-p) / n p = proporcin n = nmero de la muestra 1,96 = nivel de confianza al 95% (2 desviaciones estndar) En el ejemplo p = 18% = 0,18 n = 580 1,96 = nivel de confianza al 95% 0,18 + / 0,18 + / 0,18 + / 0,18 + / 0,18 + / = 1,96 0,18 (1- 0,18) / 580 = 1,96 0,1476 / 580 = 1,96 2,5448 -04 = 1,96 x 0,01595 = 0,031262

LCS = 0,18 + 0,031 =0,211 x 100 = 21,1% LCI = 0,18 0,031 = 0,149 x 100 = 14,9% Cul es el significado?. En primer lugar anotemos que se trata de una proporcin 18%, obtenida de una muestra de 580 personas; esto significa que no se ha tomado a toda la poblacin. En consecuencia, este clculo tiene un determinado error: puede que la proporcin sea mayor o menor a la calculada. En este caso, el intervalo de confianza al 95% nos indica que en 100 veces que se produzca el clculo, hay 95 oportunidades que est dentro del intervalo 14,9% a 21,1% (o el equivalente a la proporcin respectiva). Dicho en otras palabras, hay un 5% de posibilidades que la proporcin calculada -18%- este bajo o sobre los lmites del intervalo calculado. Reflexione:

Qu significa el intervalo de confianza 14,9% a 21,1%?. A partir de la respuesta considera que es importante que todos los estudios de investigacin, en los que se calcule la proporcin, deban tener el intervalo de confianza?, por qu? Qu sucede con este intervalo de confianza, si en lugar del 95%, para ganar en precisin, se eleva a 99%?. Qu entiende por confianza?

60 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Realice el siguiente ejercicio. Otro estudio similar, con igual metodologa, en otro contexto, da cuenta que la proporcin de diabticos tipo II, mayores de 40 aos, se sita en el 13,5%. La muestra con la que se obtuvo esta proporcin fue de 1670 personas. La pregunta es la siguiente: las dos proporciones son estadsticamente diferentes con un nivel de significacin del 95%. por qu?. Realice un grfico que evidencie la comparacin. Intervalo de Confianza para el caso de tasas.- En el caso del clculo de intervalo de confianza para tasas, se sigue un procedimiento similar al de las proporciones, en general. Pongamos un ejemplo: En la provincia X la tasa de IRA es de 800 por cada 10000 habitantes; el clculo de la poblacin fue de 12000, a mitad de periodo. Cul es el intervalo de confianza?

t + / - = 1,96 t (1-t) / n
t = tasa expresada en proporcin n = nmero de la muestra 1,96 = nivel de confianza al 95% (2 desviaciones estndar) En el ejemplo t = 800 por 10000 = 0,08 n = 12000 1,96 = nivel de confianza al 95% 0,08 + / 0,08 + / 0,08 + / 0,08 + / 0,08 + / = 1,96 0,08 (1- 0,08) / 12000 = 1,96 0,0736 / 12000 = 1,96 6.1333 -6 = 1,96 x 2,476489 -3 = 4.8539 -3

LCS = 0,08 + 4.8539 -3 = 0,084859 x 10000 = 848,54 LCI = 0,08 4.8539 -3 = 0,075146 x 10000 = 751,46 Cul es el intervalo de confianza? Por qu puede decir que la operacin es correcta?. O, no lo es? Si la muestra es de diez veces menos, qu pasa con el intervalo de confianza?; y, si es 100 veces menos, es decir, 120 personas?. Obtenga sus conclusiones. Tomemos otro ejemplo. En la provincia del Azuay, en el ao 2008, se produjeron 3,073 defunciones, siendo la poblacin proyectada a mitad de periodo de 599,546 personas. En consecuencia la tasa de mortalidad por 1000 fue de 5.13. El intervalo de confianza de 95%. Aplicamos la siguiente frmula: d = nmero de defunciones n = poblacin total Reemplazamos: 1.000 IC = ----------- ( d + / - 1,96 d ) n

IC; LCS= 1000 / 599.546 (3073 + 1.96 3.073) = 1000 / 599.546 (3.181,65) = 5,3 IC; LCI= 1000 / 599.546 (3073- 1.96 3.073)= 1000 / 599.546 (3.181,65) = 4,94

61 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

El intervalo de confianza, para la tasa de mortalidad general en la provincia del Azuay, se sita entre 4,94 y 5,3 por 1000. Ahora bien, comparemos con dos tasas de mortalidad de dos provincias. En el ao 2007, en la provincia Loja, se produjeron 2.077 defunciones, siendo la poblacin estimada de 434.020 habitantes; en la provincia de Zamora Chinchipe, cuya poblacin estimada para el mismo ao fue de 85.571, se produjeron 267 defunciones. Se desea calcular si la diferencia es estadsticamente significativa, a un nivel de confianza del 95%.

R = t1 / t2

t1= Loja: t2= Zamora Chinchipe:

(2077/434020) 1000= 4,78 (267/85571)1000= 3,12

La razn de tasas: 4,78 / 3,12 = 1,53 Aplicando la frmula:

R + / - 1,96 R (1/d1) + (1/d2)

1,53 + / - 1,96 (1,53) (1 / 2077) + (1 / 267); 1,53 + 0,19 = 1,72 1,53 + / - 1,96 (1,53) (1 / 2077) + (1 / 267); 1,53 0,19 = 1,34 En este caso, como ambos resultados estn sobre la unidad podemos decir, con una confianza del 95% que la diferencia de las tasas es significativa, siendo la de Loja ms alta que la de la Provincia de Zamora Chinchipe, en el ao 2007. Si un lmite estuviera bajo la unidad (0, 9) y el otro sobre 1 ( 1,1) no existira diferencia significacin de las tasas. Realice varios ejercicio aplicables a las tasas de natalidad; mortalidad especfica. Compare si hay diferencia significativa entre las tasas de mortalidad infantil y general, de los aos 2000 y 2007 correspondiente a las provincias de Azuay y Zamora Chinchipe.

62 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

ESTANDARIZACIN DE TASAS
Para realizar la comparacin de tasas es necesario conocer si las poblaciones son similares o diferentes. Trabajemos con el siguiente ejemplo de datos registrados hipotticos. En la poblacin A la tasa bruta, o tasa cruda de mortalidad es de 5.15 por 1000 habitantes; en la poblacin X es de 4,18, por 1000. Conocemos previamente que las poblaciones por grupos etareos son diferentes. Para ello, en primer lugar procedemos a calcular las tasas especficas para cada una de las poblaciones. POBLACIN A
GRUPOS ETAREOS DEFUNCIO NES POBLACIN TASA 1000

POBLACION X
DEFUNCI ONES POBLACIN TASA 1000

0 a 15 15 a 44 45 a 64 65 y + Sumatoria TASA BRUTA O CRUDA


FUENTE ELABORACIN I

233 582 431 1.827 3.073 5.13

206.197 297.339 39.170 56.840 599.546

1,13 1,96 11,00 32,14

43 78 127 110 358 4.18

32.517 21.393 23.960 7.701 85.571

1.32 3.65 5.30 14.28

A continuacin pasamos a estandarizar las poblaciones, para lo que sumamos la poblacin A con la poblacin X. ESTANDARIZACIN DE LAS POBLACIONES
GRUPOS ETAREOS POBLACIN "A" POBLACIN "X" POBLACIN ESTANDAR

0 a 15 15 a 44 45 a 64 65 y + Sumatoria
FUENTE ELABORACIN

206,197 297,339 39,170 56,840 599,546

32,517 21,393 23,960 7,701 85,571

238,714 318,732 63,130 64,541 685,117

Una vez realizada esta operacin procedemos a calcular las defunciones esperadas, utilizando la poblacin estandarizada y las tasas de mortalidad especficas observadas en cada una de las poblaciones. El resultado es que se cuentan con las defunciones esperadas tanto en la poblacin A como en X, lo que nos permite obtener las tasas ajustadas para cada poblacin.

63 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CLCULO DE LAS DEFUNCIONES ESPERADAS


GRUPOS ETAREOS POBLACION ESTANDAR TASA OBSERVADA POBLACIN "A" DEFUNCIONES ESPERADAS "A" TASA OBSERVADA DEFUNCIONES POBLACIN ESPERADA "X" "X"

0 a 15 15 a 44 45 a 64 65 y + Sumatoria Tasa ajustada


FUENTE ELABORACIN

238.714 318.732 63.130 64.541 685.117

1.130 1.957 11.003 32.143 5,346

270 624 695 2075 3663

1.322 3.646 5.301 14.283 3,991

316 1162 335 922 2734

Finalmente comparamos las tasas ajustadas con las crudas, en las que detectamos como en el caso de la poblacin A, la tasa ajustada es mayor que la tasa cruda; pero sucede lo inverso con la poblacin X. POBLACIN "A"
TASA AJUSTADA TASA CRUDA FUENTE ELABORACIN

POBLACIN "X"

5.35 5.13

3.99 4.18

En el ejemplo, con las tasas ajustadas


TASA AJUSTADA A
t = 5.35 por 1000 = 0,00535 n = 599,546 1,96 = nivel de confianza al 95% 0,00535+ / - 1,96 0,00535 (1- 0,00535) / 599,546 0,00535+ / - 1,96 8.87567843 -9 0,00535+ / - 1.846516 -4 LCS = (0,00535+ 1.846516 -4 ) 1000 =5,5346 LCI = (0,00535 1.846516 -4 ) 1000 =5.1653

TASA AJUSTADA X
t =3.99 por 1000 = 0,00399 n = 85,571 1,96 = nivel de confianza al 95% 0,00399+ / - = 1,96 0,00399 (1- 0,00399) / 85,571 0,00399+ / - = 1,96 4.644 -8 0,00399+ / - = 4.223788631 -4 LCS = (0,00399+4.223788 -4 ) 1000 =4.41238 LCI= (0,003994.223788 -4 ) =1000 =3.56762

TASA CRUDA A
t = 5.13 por 1000 = 0,00513 n = 599,546 1,96 = nivel de confianza al 95% 0,00513+ / - = 1,96 0,00513 (1- 0,00513) / 599,546 0,00513+ / - = 1,96 8.512579685 -9 0,00513+ / - = 1.808367388 -4 LCS = (0,00513+ 1.80836 -4 ) 1000 =5,31 LCI = (0,00513 1.80836 -4 ) =1000 =4,94916

TASA CRUDA X
t = 4.18 por 1000 = 0,00418 n = 85,571 1,96 = nivel de confianza al 95% 0,00418+ / - = 1,96 0,00418 (1- 0,00418) / 85,571 0,00418+ / - = 1,96 4.864413879 -8 0,00418+ / - = 4.32286 -4 LCS = (0,00418+ 4.32286 -4 ) 1000 =4,612286 LCI = (0,00418 4.32286 -4 ) =1000 =3,747714

64 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

65 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

TERCERA PARTE
MEDIDAS DE FUERZA DE ASOCIACIN
Iniciemos recordando brevemente lo que son las dos principales medidas epidemiolgicas, la prevalencia e incidencia.

PREVALENCIA
En trminos generales se dice que la prevalencia es el nmero de casos o eventos, de una determinada enfermedad, que se registran en una poblacin, en un momento dado en el tiempo, que permite aprecia la frecuencia con la que existe en el momento, independientemente de cundo se haya originado. Valga aclarar que la prevalencia no debera considerarse como una tasa ya que no considera ni el inicio ni el final de una enfermedad; as, su denominador no se corresponde necesariamente con la poblacin en riesgo, aquella poblacin que est expuesta.

PREVALENCIA: Medida del nmero total de casos existentes, llamados casos prevalentes, de una enfermedad en un punto o periodo de tiempo y en una poblacin determinados, sin distinguir si son o no casos nuevos. La prevalencia es un indicador de la magnitud de la presencia de una enfermedad u otro evento de salud en la poblacin. (OPS, Mdulos de
principios de Epidemiologa para el Control de Enfermedades, Segunda Edicin, 2002)

Para calcular la prevalencia se determina el nmero de sujetos en quienes se determina que presentan el evento estudiado y se procede a relacionar con el total de individuos que forman el grupo observado. En otras palabras, se obtiene un cociente que se expresa en forma de proporcin o porcentaje. Comnmente se reconocen dos tipos de prevalencia: prevalencia puntual y prevalencia de periodo. La prevalencia puntual (prevalencia de punto) se caracteriza porque se realiza en un periodo corto de tiempo; y, se emplea para conocer la prevalencia de una enfermedad, en una determinada poblacin, en un momento determinado, sin importar cuando se haya producido. Casos de una enfermedad, en un momento dado = ----------------------------------------------------------------- x Poblacin total en estudio en ese momento Propongamos algunos ejemplos: La prevalencia de Diabetes Mellitus tipo II en personas mayores de 40 aos, en la ciudad de Zamora, en el mes de mayo de 2010.

Prevalencia Puntual
100

66 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

La prevalencia de caries dental, en nios de edad escolar, en la comunidad de San Lucas, en el mes de abril de 2010. La prevalencia de poliparasitosis intestinal, en lactantes mayores, en la comunidad de Chicaa, junio 2010.

La prevalencia de perodo, en cambio, nos permite establecer el nmero de casos existentes as como los casos nuevos producidos durante ese perodo; es decir, determina la cantidad de casos existentes durante un perodo determinado, pero los distingue a los antiguos de los que van apareciendo, con lo que se resuelve el problema de la aparicin de casos nuevos cuando se est ejecutando el estudio. Esto nos permite, de alguna manera, combinar la magnitud del problema que expresa fundamentalmente la prevalencia, con la velocidad de aparecimiento. En este caso, puede utilizarse la prevalencia de periodo, ya sea por una elevada frecuencia de aparicin de la enfermedad o porque el estudio no se puede realizar en un corto perodo de tiempo.

Casos antiguos + casos nuevos en un perodo dado

Prevalencia de perodo = ------------------------------------------------------------------- x 100


Poblacin total en estudio en ese perodo

Ejemplos: Se investiga, en varias poblaciones de la amazona la prevalencia de anemia asociada a uncinariasis. Considerando la dispersin que existe se ha propuesto un periodo de investigacin de la prevalencia de cuatro meses. En ese periodo es posible que se produzcan nuevos casos. La prevalencia, al expresar la cantidad de casos de una enfermedad en un momento dado, orienta la elaboracin de los programas de salud preventivos, asistenciales y de control; permite establecer comparaciones entre poblaciones similares; evaluar acciones de salud; y, suministra la informacin que puede convertirse en punto de inicio para desarrollar investigaciones ms profundas, sean cuantitativas o cualitativas. Anote varios ejemplos de la importancia de la prevalencia para el desarrollo de acciones de salud:

67 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

INCIDENCIA
En general, la incidencia de la enfermedad nos indica la frecuencia de casos nuevos que se presentan en una poblacin durante un perodo determinado de tiempo, que, naturalmente, se ver influenciado por la duracin, motivo por el cual se debe expresar siempre en un periodo de observacin.

INCIDENCIA: Es la medida del nmero de casos nuevos, llamados casos incidentes, de una enfermedad originados de una poblacin en riesgo de padecerla, durante un periodo de tiempo determinado. La incidencia es un indicador de la velocidad de ocurrencia de una enfermedad u otro evento de salud en la poblacin y, en consecuencia, es un estimador del riesgo absoluto de padecerla.
(OPS, Mdulos de principios de Epidemiologa para el Control de Enfermedades, Segunda Edicin, 2002)

La incidencia puede calcularse de las siguientes formas: Incidencia acumulada, tasa de incidencia y densidad de incidencia. La incidencia acumulada, representa la proporcin de individuos sanos que contraen la enfermedad en un perodo de tiempo determinado y se puede calcular aplicando la siguiente frmula. Casos nuevos = ----------------------------------------------------------------- x K Nmero de individuos al comienzo del perodo

Incidencia Acumulada

Ejemplo: En la comunidad X , al 1ro de enero se registran 6500 personas y, al 31 de diciembre 6800. Durante el periodo de la investigacin ( 1 ao ) se registran 120 casos de la enfermedad y. Cul es la incidencia acumulada, en el periodo, por 1000 habitantes?. 120 Incidencia acumulada= ------------------- x 1000; = 18,46 6500 Qu significado tiene este resultado? La Tasa de Incidencia, relaciona el nmero de casos nuevos que se presentan en un tiempo determinado; es decir, en la tasa de incidencia el denominador es el tiempo en riesgo de la poblacin estudiada. Sin embargo, la medicin del tiempo de riesgo es difcil calcular, ya que no es posible excluir el tiempo en que los individuos que se enferman ya no estn en riesgo; e, identificar el perodo de exposicin de cada uno de los miembros de la poblacin estudiada. Por este motivo, usualmente el tiempo en riesgo se determina mediante una aproximacin. Entonces se determina la poblacin del rea estudiada a mitad del periodo (30 de junio); sin embargo, como esto resulta muy difcil, se la obtiene como promedio de la poblacin observada inicialmente (1ro. De enero) con la poblacin a final del ao (31 de diciembre), considerando que la duracin del perodo 68 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

generalmente es de un ao. Realmente, la poblacin a la mitad del periodo de observacin, es utilizada como estimacin de la poblacin media. Casos Nuevos ----------------------------------------------------------------- x K Nmero de individuos a mitad del perodo

Tasa de Incidencia =

Ejemplo: En la misma comunidad del ejemplo anterior, determinar la tasa de incidencia por 1000. 120 Tasa de Incidencia = ---------------------- x 1000; = 18,04 (6500+6800)/2 Qu significado tiene este resultado? K, es una constante que puede ser cualquier mltiplo de 10, 100, 1.000, 10.000, etc., que se utiliza para poder realizar comparaciones entre poblaciones de diferente tamao absoluto. Vale enfatizar que no debe ser mayor que la poblacin total en riesgo. Ahora analicemos la Densidad de Incidencia, considerada como la "verdadera tasa de incidencia", porque se conocen los tiempos en riesgo de cada uno de los individuos y no se recurre a una aproximacin como lo es la tasa de incidencia acumulada. Se utiliza cuando la poblacin observada es inestable en el tiempo, es decir, cada sujeto ha estado "en riesgo" o expuesto al evento de inters por perodos de tiempo distintos, ya sea por abandono del estudio, por contraer la enfermedad, etc. Es una medida til para el seguimiento de poblaciones dinmicas en las que ingresan y salen individuos; de all que la unidad de tiempo es personas-unidad de tiempo utilizada para el estudio (personas-aos, personas-das, etc.). Una persona-ao representa un individuo en riesgo de desarrollar la enfermedad durante un ao. La principal utilidad de la incidencia es que permite medir el riesgo que un grupo de individuos desarrolle una enfermedad. Matemticamente es el nmero de nuevos casos registrados, dividido por la suma de los perodos de tiempo en riesgo correspondientes a todos los individuos en estudio.
Nmero de casos que aparecen en una poblacin durante un periodo de tiempo

DI

-------------------------------------------------------------Suma para cada individuo de la poblacin, del tiempo durante el que estuvo en riesgo de que apareciera el efecto

Ejemplo: Supongamos que en una comunidad de trabajadores florcolas se hace el seguimiento por diez aos, de veinte personas que trabajaron expuestas a determinados agroqumicos, durante distintos perodos de tiempo y que desarrollaron una determinada enfermedad relacionada con la exposicin a estos productos. Se registr la siguiente informacin: Las personas signadas con los nmeros 3, 9, 12 desarrollaron la enfermedad en el sexto ao;

69 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Las personas signadas con los nmeros 6, 14, 15 y 16, desarrollaron la enfermedad a los 8 aos; Las personas 1 y 13 se perdieron a los tres aos; Las personas 7, 10 y 19 se perdieron al sptimo aos; y, El resto de personas no presentaron la enfermedad en el periodo de estudio.

Se desea conocer la densidad de incidencia en el periodo. Es til representar la informacin en un grfico, en el que los puntos representan las personas que desarrollaron la enfermedad, las cruces las personas que se perdieron para el seguimiento; la lnea sin ninguna marca aquellos que no han presentado la enfermedad. Grfico No. DURACIN DE LA EXPOSICIN AL TRABAJO EN FLORCOLAS Perso nas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 AOS DE SEGUIMIENTO 1 2 3 4 5 6 7 8 9 10

Datos: 70 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

a) 7 personas desarrollaron la enfermedad; b) 5 personas se perdieron de la observacin; y, c) 8 personas no desarrollaron la enfermedad. Calculamos el nmero de personas / ao, as:

Las personas 1 y 13 se les sigui durante 3 aos; esto quiere decir 3 aos cada
una, lo que da un total de 6 personas/ao;

Las personas 7, 10 y 19, se les sigui durante 7 aos. Con igual razonamiento,

esto nos da un total de 21 personas / ao (3 x 7); Las personas 3, 9 y 12 desarrollaron la enfermedad a los 6 aos cada una, lo que nos da un total de 18 personas / ao (3 x 6); Las personas 6, 14, 15 y 16 desarrollaron la enfermedad a los 8 aos de seguimiento, cada una, lo que nos da un total de 32 personas / ao (4 x 8); y, Las restantes 8 personas, en los diez aos no desarrollaron la enfermedad, lo que nos da un total de 80 personas/ ao (8 x 10)

La sumatoria de todos estos parciales nos da 157 personas / ao que fueron seguidas durante el periodo. Esto quiere decir que se han producido 7 casos nuevos en 157 personas/ao. Entonces procedemos a calcular aplicando la frmula de la densidad de incidencia. DI = 7 (desarrollaron la enfermedad) ----------------------------------------------------- x 1000; = 44,5 157 personas / ao

Qu significa?. Que se producen 45 casos nuevos por cada 1000 personas / ao expuestas. Retomemos las mediciones anteriores, con este mismo ejemplo. Cul sera la incidencia acumulada? Se determinan 7 casos nuevos en 20 personas inicialmente expuestos. Esto nos da 0,35, que multiplicado por la constante 1000, significa que la tasa de incidencia acumulada es de 350 por cada 1000 personas. Analice: Qu significa cada uno de los resultados?. Por qu la diferencia?. En sntesis, la densidad de incidencia, tiene una unidad: personas-unidad de tiempo (personas-ao, persona-mes, personas-da), por lo que, la suma persona- tiempo indica la suma de todos los perodos de tiempo por persona estudiados. Como lo hemos indicado, el perodo de tiempo de observacin se calcula para cada persona de forma individual, sumndose los de todas las personas del estudio mientras estn en riesgo (o sea, mientras est dentro del estudio y no ha contrado la enfermedad).

La principal utilidad de la incidencia es que permite medir el riesgo que un grupo de individuos desarrolle una enfermedad.

71 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Pongamos otro ejemplo: En un ingenio azucarero existen 45 empleados administrativos, que tienen un horario regular de 8 horas da; y, 350 trabajadores agrcolas con una jornada/promedio de 6 horas/da. Se ha registrado que el nmero de accidentes laborales en los administrativos fue de 6; y, en los trabajadores de 40, durante el ltimo semestre. Se desea conocer la densidad acumulada y de incidencia accidentes / personas / horas semestre.
SECCI N NMERO DE PERSONA L CANTIDA D DE ACCIDEN TADOS (AO) INCIDENCIA ACUMULAD A CANTIDAD PERSONAL/HO RA EXPUESTOS / SEMESTRE JORNADA LABORAL DENSIDAD DE INSIDENCIA (accidentes / persona-Horas /semestre)

Admini strativo s Trabaj adores agrcol as

45 350

6 40

6/45 * 100 43.200,0 = 13,3 % 40/350 100 = 11,42% * 252.000,0

8 hrs. / d 6 hrs. / d

6 / 43.200 * 1000 = 0,14 40 / 252.000 * 1000 = 0,16

De acuerdo a estos resultados, la incidencia acumulada fue de 13,3 por cada 100 administrativos; y, de 11,42 por cada 100 trabajadores agrcolas; sin embargo, la densidad de incidencia de accidentes, persona/horas/semestre fue ligeramente mayor en los trabajadores Ejemplo: En la comunidad C se registra al 1ro. de enero del ao 2009, 15.400 habitantes y, al 31 de diciembre 14.500 habitantes. En el curso de este ao se han observado 15 casos de la enfermedad X. La distribucin de la aparicin de esos casos en funcin del tiempo est representado por el siguiente diagrama

CASOS DE UNA ENFERMEDAD "X" DETERMINADOS EN LA COMUNIDAD "C"


Pers onas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 72 Jorge Reyes Jaramillo AO 2008 11 12 1 2 3 4 AO2009 / MESES 5 6 7 8 9 10 11 12 AO 2010 1 2

BIOESTADSTICA 15

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

CAS SDEN UMO O E NA E LA COMUNIDAD"Z / PACIE E H PIT N " NT S OS ALIZ ADOS PE S O UB R O CT RE N AS 30 31 A B C D E F G H I J K L LL M N O P Q R S T V W X Y Z ME DEN S OVIE RE/ DIAS MB 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 DICIE . MB 1 2

Calcule: Tasa de incidencia durante el ao 2009 Tasa de incidencia por semestre, en 2009 Tasa de prevalencia de punto al 1 de julio (30 de junio) de 2009 Tasa de prevalencia de punto a enero de 2010 Tasa de prevalencia de periodo, durante el ao 2009 Incidencia acumulada durante el ao 2009 Incidencia acumulada del 1ro de enero al 30 de septiembre de 2009 Densidad de incidencia, entre noviembre de 2008 y febrero de 2010 (persona/mes)

A partir del ejemplo de neumonas, calcular:


Nmero de casos incidentes de neumona en el mes de noviembre Nmero de casos incidentes de neumona, en el mes de noviembre, por sexo Nmero de casos prevalentes (general y por sexo) al da 15 de noviembre Incidencia acumulada (general y por sexo) en el mes de noviembre Punto de prevalencia, en el da 7 y 21 (general y por sexo) Densidad de incidencia acumulada en la primera y segunda quincena (general y por sexo)

Ejercicio
Calcule la prevalencia, incidencia e incidencia acumulada de las principales patologas sujetas a vigilancia epidemiolgica en las provincias de la Regin Sur del Ecuador. 73 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

RIESGO EPIDEMIOLGICO
RIESGO RELATIVO
El riesgo relativo, identifica la magnitud o fuerza de la asociacin, lo que permite comparar la frecuencia con que ocurre el evento entre los que tienen el factor de riesgo y los que no lo tienen. Reflexionemos: En una determinada comunidad, las personas expuestas a un determinado factor desarrollan una enfermedad y otras no; pero en aquellas que no han estado expuestas, asimismo, unas desarrollan la enfermedad y otras no presentan. Realmente, ese factor es responsable del aparecimiento del fenmeno?. El Riesgo Relativo es una medida relativa del efecto; indica cunto ms veces tiende a desarrollar el evento en el grupo de sujetos expuestos al factor de exposicin o factor de riesgo en relacin con el grupo no expuesto. El riesgo relativo (RR) no tiene dimensiones; el rango de su valor oscila entre 0 e infinito. Cuando el valor del RR=1 indica que no hay asociacin entre la presencia del factor de riesgo y el evento; mientras ms se aleja de este valor, en el caso de ser el RR>1, indica que existe asociacin positiva, es decir, que la presencia del factor de riesgo se asocia a una mayor frecuencia de suceder el evento; y, si el RR<1, nos indica que existe una asociacin negativa, es decir, que no existe factor de riesgo, que lo que existe es un factor protector. El RR est indicado para los estudios prospectivos como son el estudio de cohortes y el ensayo clnico. As, de una determinada poblacin se extraen dos muestras sin enfermedad o en las que no haya sucedido el evento: una expuesta al factor de riesgo y otra sin tal exposicin, para que de cada muestra se calcule la incidencia acumulada de expuestos y se calcula su cociente12. El riesgo relativo es el resultado de dividir el riesgo en el grupo con el factor de exposicin o factor de riesgo para el riesgo en el grupo de referencia, que no tiene el factor de exposicin, como ndice de asociacin. RR= incidencia acumulada en expuestos / incidencia acumulada en no expuestos

ENFERMOS SANOS TOTAL EXPUESTOS NO EXPUESTOS TOTAL a c a+c IE RR = ----------; I NO E


12

b d b+d a/a+b -----------c/c+d

a+b c+d n

El riesgo relativo no debera utilizarse en los estudios de casos y controles o retrospectivos ya que no es posible calcular las tasas de incidencia. En estos casos utilizaremos la odds ratio.

74 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Cuando hablamos de la diferencia entre la incidencia de enfermedad en expuestos y no expuestos al factor de riesgo, nos estamos refiriendo al RIESGO ATRIBUIBLE; es decir, la diferencia entre ambos valores proporciona el valor del riesgo de enfermedad en la cohorte expuesta, que se debe exclusivamente a la exposicin al factor de riesgo. Por lo tanto, es una medida que informa del efecto absoluto del factor de riesgo que produce la enfermedad, es decir, el "exceso" de riesgo de enfermar, entre los expuestos, atribuible al factor de riesgo. Se calcula:

RA = Ie Io
RA = Riesgo Atribuible Ie: Incidencia en expuestos. Io: Incidencia en no expuestos. Asimismo, en el curso de anlisis se habla de la PROPORCIN DE RIESGO ATRIBUIBLE 13, que no es sino el producto de dividir el riesgo atribuible para la incidencia de la enfermedad en el grupo de los expuestos. En definitiva, se puede demostrar el impacto del factor de riesgo entre los expuestos a l, para ser utilizado en acciones de prevencin. Se calcula: RA% = (RA/Ie) x 100 RA % = Riesgo Atribuible Ie = Incidencia en expuestos Anotemos brevemente que el NDICE DE INTERVENCIN, es el nmero de sujetos en los que hay que impedir la exposicin para evitar una enfermedad. Se calcula: II = 1/RA

RIESGO ABSOLUTO
Usualmente se reporta la incidencia de cierta entidad nosolgica en una comunidad. Esta incidencia, casos nuevos, se denomina riesgo absoluto. Dicho de otra manera: mide la incidencia del dao en la poblacin total, mientras que el riesgo relativo compara la frecuencia con que ocurre el dao entre los que tienen el factor de riesgo y los que no lo tienen. En sntesis, el riesgo absoluto es la probabilidad que tiene un sujeto de sufrir un evento a lo largo de cierto tiempo14. Recuerde:
13

Se denomina tambin fraccin etiolgica. El riesgo absoluto puede indicar la magnitud del riesgo de un grupo de personas con una cierta exposicin, pero debido a que no tiene en cuenta el riesgo de enfermedad en sujetos no expuestos, no indica si la exposicin se asocia a un mayor riesgo de la enfermedad.
14

75 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

El riesgo absoluto mide la incidencia del dao en la poblacin total; es decir el nmero de casos nuevos; mientras que el riesgo relativo compara la frecuencia con que ocurre el dao entre los que tienen el factor de riesgo y los que no lo tienen. El riesgo absoluto puede indicar la magnitud del riesgo de un grupo de personas con una cierta exposicin, pero debido a que no tiene en cuenta el riesgo de enfermedad en sujetos no expuestos, no indica si la exposicin se asocia a un mayor riesgo de la enfermedad. En sntesis, el riesgo absoluto es la probabilidad que tiene un sujeto de sufrir un evento a lo largo de cierto tiempo

Odds ratio
La odds15 es el cociente entre la probabilidad de que un evento suceda y la probabilidad de que no suceda. Es una medida de tamao de efecto que tiene la misma interpretacin que el riesgo relativo y en determinadas circunstancias constituye una buena aproximacin a ste, especialmente cuando la frecuencia de la enfermedad es baja. Por ejemplo, en la siguiente tabla: Tanto la frmula de la OR de un estudios de cohorte como la de uno de casos y controles puede leerse como:
CASOS EPUESTOS NO EXPUESTOS TOTAL a c a+c NO CASO b d b+d TOTAL a+b c+d N

OR = a

d/ b

En definitiva, corresponde a la razn de productos cruzados en una tabla de 2x2. En forma similar al RR, el OR cuando tiende a 1, indica que existe ausencia de la asociacin exposicin al factor y enfermedad; esto significa que la cantidad de veces que el evento ocurra ante la presencia de otra variable versus las veces que ocurra en ausencia de esa variable, o sea 1:1; es lo mismo que decir que, aparecer tantas veces cuando la variable est presente como cuando la variable no se presente. El OR mayor a 1, indica exposicin al riesgo y un OR menor a 1, efecto protector. Lo que en definitiva no es ms que una forma de expresar la proporcin de veces que un suceso ocurra frente a que no ocurra. De tal manera que un OR = 2,5 debemos leerlo como 2,5:1, mejor an dado que un efecto aparece ante la presencia de otra variable es de 2,5 veces ms que si esta variable no est presente. Entonces es posible transformar esta medicin en probabilidades mediante la frmula:
15

Trmino en ingls de traduccin discutida; se ha traducido como disparidad, razn de posibilidades, razn de oportunidades, oportunidad, razn de momios, razn de probabilidades. La odds ratio ha sido traducida al castellano con mltiples nombres como: razn de chances, razn de productos cruzados, razn de disparidad, razn de predominio, proporcin de desigualdades, razn de oposiciones, oposicin de probabilidades contrarias, cociente de probabilidades relativas, oportunidad relativa. Es una medida epidemiolgica utilizada en los estudios epidemiolgicos y en los metaanlisis.

76 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Probabilidad = OR / OR + 1
Desde la perspectiva de las probabilidades en el caso del OR = 1, la probabilidad es del 50%, (1 / 1+1), es decir, que existen en este ltimo caso las mismas probabilidades que el evento ocurra estando o no la otra variable en estudio presente. Si el OR es de 2.5 ( 2,5 / 2,5 +1= 0,714 x 100) la probabilidad es de 71,4%. En este sentido, si el valor del OR es de 2, no se puede decir que los expuestos tengan dos veces ms riesgo que los no expuestos. Si aplicamos la frmula: 2 / 2+1, el resultado es de 66,67%. En general, tanto en el RR como en el OR, si se obtiene un valor de 3,90 por ejemplo de desarrollar una gastroenteritis, se puede decir, que en las personas que estuvieron expuestos al factor de riesgo, tienen la probabilidad de desarrollar esa enfermedad 2,90 veces ms respecto de quienes no estuvieron expuestos. Finalmente, recordemos que la Odds ratio permite: 1. Reconocer la naturaleza como factor de riesgo o de proteccin de una exposicin. 2. Identificar la magnitud o fuerza de la asociacin, lo que permite hacer comparaciones. 3. Su valor es independiente de la incidencia de la condicin en estudio. 4. De gran utilidad en estudios de casos y controles 5. Su valor suele ser semejante al del RR. Para ejemplificar lo dicho tomemos el ejemplo citado en la Unidad 3, de los Mdulos de principios de epidemiologa para el control de enfermedades, de OPS16.

BROTE DE CLERA EN TRES CASEROS RURALES, SELVA AMAZNICA: Junio 1991


Supuesto factor de riesgo agua no tratada pescado crudo pescado cocinado arroz recalentado tamal de arroz fruta sin lavar
Fuente: OPS

ENFERMARON (n=125) No Expuesto expuesto s s 111 14 7 118 17 47 24 71 108 78 101 54

NO ENFERMARON (n=1636) No Expuesto expuesto s s 1093 543 14 1622 198 522 272 683 1438 1114 1364 953

Con estos datos, se trata de determinar si existe alguna asociacin entre la exposicin a los supuestos factores de riesgo y la presencia del clera en la poblacin.
16

Organizacin Panamericana de la Salud, Oficina Regional de la Organizacin Mundial de la Salud, Mdulos de principios de epidemiologa para el control de enfermedades, Unidad 3, Medicin de las condiciones de salud y enfermedad en la poblacin, Segunda Edicin, 2002, pgs. 60, 61, 62, 72.

77 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Agua no tratada
expuesto no expuesto caso 111 14 no caso 1093 543 1204 557 1761 3,68 RR OR

Arroz recalentado
expuesto no expuesto caso 47 78 no caso 522 1114 569 119 2 176 1

RR OR

125 1636 (111/1204/14/55 7) (111*543)/ (1093*14)

3,94

125 1636 (47/569/78/1192 ) 1,28 (47*1114)/ 1,29 (522*78)

Pescado crudo
Expuesto no expuesto caso 7 118 125 RR OR no caso 14 1622 1636 21 1740 1761 4,90 RR OR

Tamal de arroz
expuesto no expuesto caso 24 296 146 101 1364 5 176 125 1636 1 (24/296/101/1465 1,1 ) 7 1,1 (24*1364)/ 9 (272*101) no caso 272

(7/21/118/1740) (7*1622)/ (14*118)

6,87

Pescado cocinado
Expuesto no expuesto caso 17 108 no caso 198 1438 215 1546

Fruta sin lavar


expuesto no expuesto caso 71 754 100 54 953 7 176 125 1636 1 1,7 (71/754/54/1007) 4 1,8 (71*953)/ 3 (683*54) no caso 683

RR OR

125 1636 1761 (17/215/108/154 6) 1,13 (17*1438)/ 1,14 (198*108)

RR OR

Formulemos otro ejemplo: En una poblacin de 2500 personas comprendidas entre 45 y 65 aos de edad, con un porcentaje de mujeres de 52 %, se determina que el 20% presentan diabetes mellitus tipo II. Investigaciones iniciales mostraron que del grupo que presentaba la afeccin, el 60% eran mujeres; el 75% consumen dieta hipercalrica hidrocarbonada; el 80% tenan una vida sedentaria.; el 80% tenan antecedentes familiares de diabticos, especialmente por lnea materna. En el grupo de control, constituido por un porcentaje igual al del grupo de casos, de caractersticas similares al universo de estudio, se determin, que un 50% consuman una dieta balanceada, el 45% tenan 78 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

una actividad fsica normal; el 25% tena antecedentes familiares de diabticos. Determinar, en orden de prioridad el riesgo relativo (RR) y la razn de ventajas (OR) en cada uno de los factores de riesgo mencionados.

ESTUDIO DE COHORTE CONDICIN BIOLGICA DE LA SEDENTARISMO PERSONA


SEXO mujeres hombres no diabti diabti co co 300 200 260 240 560 440 1000 Vida sedentaria actividad fsica normal no diabti diabti co co 400 275 560

RR OR

500 500 (300/560/200/44 0) (300*240)/ (260*200)

1.18 1.38

RR OR

100 225 440 500 500 (400/560/100/44 3.14 0) (400*225)/ 3.27 (275*100)

DIETA HIPERCALRICA E HIDROCARBONADA


DIETA hipercalric ae hidrocarbo nada balanceada no diabti diabti co co

ANTECEDENTES FAMILIARES DE DIABETES COMO FACTOR DE RIESGO


ANTECEDE no diabti NTE diabti co FAMILIAR co SI 400 125 525

RR OR

375 250 560 125 250 440 500 500 1000 (375/560/125/44 2.36 0) (375*250)/ 3.00 (250*125)

NO

RR OR

100 375 475 500 500 (400/525/100/47 3.62 5) 12.0 (400*375)/ 0 (125*100)

Resumen: Como se puede apreciar el factor antecedentes familiares de diabticos ocupa el primer lugar (de acuerdo a estas medidas de fuerza de asociacin, en el OR), seguido del sedentarismo.

79 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

FACTOR
ANTECEDENTES FAMILIARES DE DIABETES COMO FACTOR DE RIESGO SEDENTARISMO DIETA HIPERCALRICA E HIDROCARBONADA CONDICIN BIOLGICA DE LA PERSONA

RR
3,14 3,14 2,36 1.18

IC

OR
12,00 3,27 3,00 1,38

IC

Analice: Cul es el significado de cada uno de los valores de RR, para este ejemplo?. Escriba. Cul es el significado de cada uno de los valores de OR?. Escriba. Despus de volver a realizar las operaciones, qu similitudes y diferencias aprecia entre los resultados de cada uno de los RR y OR? Ahora bien, tanto el RR como el OR tienen implcito el respectivo error estndar. Es posible calcular los intervalos de confianza. En este caso si los valores (lmite de confianza superior y lmite de confianza superior, estn los dos, o bajo 1 (valor < a la unidad) o sobre 1, tendrn significancia estadstica; pero si el inferior est bajo la unidad y el superior sobre uno (Ej. 0,8 y 1,2) no hay significacin estadstica (95%, p<0,05)

EVALUACIN DE PRUEBAS
SENSIBILIDAD Capacidad de detectar a los verdaderamente enfermos. Ejemplo: Se aplica una prueba diagnstica para el embarazo a 100 mujeres en las cuales haya certeza del embarazo y se analiza cuantas detecta la prueba. Si detecta 95, diremos, entonces que la prueba tiene una sensibilidad del 95%, si detecta 85, ser del 85%. A Sensibilidad = ------------ x 100 A + C

ESPECIFICIDAD Capacidad de detectar como sanos a los que verdaderamente lo estn. Si de 100 mujeres, en las que hay la certeza de que no estn embarazadas, luego de aplicar la prueba se encentra cinco resultados positivos y 95 negativos, se dice que la especificidad de la prueba es de 95%, puesto que de 100 personas sanas, en el caso, no embarazadas, detect 95. D 80 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

Especificidad = ------------ x 100 B + D VALOR PREDICTIVO Capacidad para detectar en una comunidad, luego de aplicar una prueba determinada, cuantos de los que aparecen como positivos, son verdaderamente enfermos. A Valor predictivo = ------------ x 100 A + B

RELACIONES DE LA PREVALENCIA Y EL VALOR PREDICTIVO El valor predictivo vara segn la prevalencia de la enfermedad. As, en una zona de la costa, con alta prevalencia de dengue o malaria, respecto de la sierra, el valor predictivo de la prueba ser mayor y viceversa. Prevalencia Sensibilidad ySensibilidad de especificidad especificidad enfermedad del 95% 99% 0,1 1,0 2,0 5,0 50,0 1,9 16,1 27,9 50,0 95,0 9,0 50,0 66,9 83,9 99,0 y del

Guerrero, Gonzlez, Medina: 1981

81 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

APNDICE

82 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

83 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

84 Jorge Reyes Jaramillo

BIOESTADSTICA

DESCRIPTIVA Y EPIDEMIOLOGIA BSICA

85 Jorge Reyes Jaramillo

Potrebbero piacerti anche