Sei sulla pagina 1di 18

UNIVERSIDAD AUSTRAL DE CHILE

BIOESTADÍSTICA
FACULTAD DE MEDICINA Prof: FRANCISCO
MARIN H.
INSTITUTO DE SALUD PUBLICA

RESUMEN DE DATOS EN SALUD. LOS ESTADÍGRAFOS

¿Recuerda qué es una variable?... pues bien, las variables en la práctica


toman valores respecto a los cuales se puede estudiar una o más de las
siguientes características:

1. Frecuencia
2. Valores representativos
3. Variabilidad
4. Forma de la distribución de frecuencias.

Respecto a frecuencias... se supone que usted ya manejo las medidas


de intensidad, por lo tanto nos referiremos ahora a :

1. ESTADIGRAFOS DE POSICION

Su objetivo es “resumir” los valores de una variable por medio de un


“valor” representativo, es decir, indican cuál es el “centro” de la distribución
de frecuencias de la variable.

Existen muchos estadígrafos de posición, pero los más utilizados en el


área de la salud son media aritmética, media geométrica, media armónica,
mediana, moda y percentiles.

1.1 Modo, moda o valor modal. (Md)

No confunda “lo más


Moda es el valor de una frecuente”, es decir, lo que
variable dada, que se repite un más se repite con “la
mayor número de veces mayoría” ¿Queda claro?
Pregunte.

1
¿Cómo se calcula la moda?. Depende del tipo de variables (al igual que
en las otras medidas de tendencia central)

1.1.1 Variables cualitativas

En un estudio se encontró que las motivaciones del adolescentes para


beber alcohol eran : curiosidad (40,0%), invitación (30,4%), agrado (17,5%),
olvidar problemas (3,8%), imitación (2,8%), obligación (1,7%), y otras
motivaciones (3,8%). ¿Cuál es la motivación modal? Interprétela.

1.1.2 Variables cuantitativas discretas

En este caso la determinación de la moda se hace igual que en el


ejemplo anterior.

Determine e interprete la edad modal en su curso.

1.1.3 Variables cuantitativas continuas.

Por definición, en este caso los valores de las variables están


agrupadas en intervalos. Por este motivo, lo primero, que se debe hacer es
determinar en qué intervalo se encuentra el valor modal. ¿Sospecha cómo
se hace esto?

Luego debe hacer una interpolación para determinar qué valor del
intervalos es el modo. Para ello existen diversas técnicas, siendo la más
utilizada, la que se puede resumir en la siguiente expresión:

Límite
inferior Amplitud Frecuencia absoluta del
intervalo
Md = del + del x siguiente al modal.
intervalo intervalo
modal Suma de frecuencias de los
inter-
valos anterior y siguiente al
modal

2
En forma resumida

fi + 1
Md = Linf + Ci
fi + 1 + fi - 1

NOTA: Conviene que Ci sea constante, porque en caso contrario se puede


llegar a conclusiones erróneas.

Ejemplo: Los datos siguientes corresponden a la consulta psiquiátrica en


un trimestre, clasificada según edad y diagnóstico en un hospital
de Concepción.

GRUPO DE DIAGNOSTICO
EDAD TOTAL
( años) Esquizofrenia Neurosis Alcoholism Otros
s o

15 – 24 25 13 0 39 77
25 – 34 65 30 5 67 167
35 – 44 28 28 18 49 123
45 – 54 33 16 13 38 100
55 – 64 11 7 5 21 44
65 -+ 6 2 2 23 33

TOTAL 168 96 43 237 544

Para calcular la edad modal del total de la consulta psiquiátrica se


puede seguir los siguientes pasos :

a) Encontrar el intervalo modal. La frecuencia máxima es f 2 = 167 por lo


tanto el intervalo modal es el segundo.

b) Determinar el límite inferior del intervalo modal Linf = 25

3
c) Calcular la amplitud del intervalo modal ( Ci ) C2 = 35 – 25 = 10 (OJO)

d) Buscar la frecuencia del intervalo siguiente de aquel que contiene a la


moda ( f i + 1 )
f3 =123

e) Buscar la frecuencia del intervalos anterior al intervalo modal


(f i - 1 )
f1 = 77

f) Calcular la moda.

Md = 25 + 10 123 = 25 + 6,2
123 + 77

Md = 31,2 años.

Esto significa que la edad más frecuente entre las personas que
consultaron por problemas psiquiátricos fue 31,2 años.

¿Cuán real le parece este resultado?

Practique calculando e interpretando la moda de la edad en los


distintos diagnósticos.

1.1.4 Algo para pensar

 ¿Qué ocurrirá en el ejemplo sí un paciente tuviera 99 años? ¿Cambiaría


la edad modal?
 ¿Cuántas modas puede tener una distribución?
 ¿A qué tipo de variable se puede aplicar la moda?
 ¿En qué unidades se expresa este estadígrafo?

4
1.2 MEDIANA (Me)

MEDIANA es aquel valor de la variable que supera a no más de


la mitad de las observaciones y es superada por no más de la
mitad de ellas, es decir, es un valor que divide la distribución
en mitades respecto al número de casos

Aunque este estadígrafo se puede determinar en el caso de variables


cualitativas ordenables, sólo estudiaremos el caso de variables cuantitativas.

1.2.1 Datos No agrupados

Es este caso se ordenan los datos y el que está al centro corresponde a


la mediana.

Ejemplo:

7 35 40 27 18 15 13

Ordenando se tiene:

7 13 15 18 27 35 40

¿Cuál es la mediana en este caso?

Si hubiera dos valores centrales ¿Cuál sería el valor de la mediana?

5
1.2.2 Datos discretos agrupados.

Suponga que se dispone de la siguiente información:

NUMERO DE NUMERO DE NUMERO ACUMULADO


HIJOS FAMILIAS DE FAMILIAS
Xi fi Fi

0 8 8
1 12 20
2 25 45
3 24 69
4 25 94

TOTAL 94

Primero se establece cuántas observaciones hay en cada mitad, o sea,


n/2 =94/2 = 47. Luego se busca la frecuencia acumulada (Fi),
inmediatamente superior a n/2, que en este caso corresponde a F4 = 69.

El valor de la variable (Xi) que tiene la frecuencia acumulada


determinada anteriormente (F4 = 69), es la mediana, o sea, Me = 3.

¿Cómo se interpreta este resultado?

1.2.3 Datos agrupados en intervalos o clases

Al igual que cuando se calcula la moda, en este caso lo primero que se


debe hacer, es determinar en que intervalo se encuentra la mediana.

Esto se logra utilizando el procedimiento presentado en el punto


anterior. Luego se aplica la siguiente fórmula de interpolación:

n -F i-1

Me = L inf + Ci
2
fi

donde:

 Linf : Límite real inferior de la clase de la mediana


6
 n : Número total de observaciones.
 Fi-l : Suma de todas las frecuencias que preceden a la clase de la
mediana.
 fi : Frecuencia de la clase de la mediana
 Ci : Amplitud de la clase de la mediana.

Para aclarar lo expuesto, utilizaremos los datos del punto 1.1.3, con
que se ejemplificó el cálculo de la moda.

GRUPO DE
EDAD CASOS Fi
(años) fi

15 – 24 77 77
25 – 34 167 -----
35 – 44 123 367
45 – 54 100 -----
55 – 64 44 511
65 y + 33 544

TOTAL 544

En primer lugar, se debe determinar en qué intervalo se encuentra la


mediana, para ello calculamos n/2 = 544/2 = 272. Luego se calcula la
frecuencia acumulada ( Fi ). ¡HAGALO¡ A continuación se busca la Fi
inmediatamente superior a n/2 = 272. En este caso dicha frecuencia toma el
valor , lo cual nos indica que la mediana se encuentra en el
intervalo. Finalmente se aplica la fórmula de interpolación.

Me = 35 + 10 272 – 244 = 35 + 2,3 = 37,3


años
123

¡” Interprete el resultado obtenido”!

7
1.2.4 Otro momento para pensar.

 ¿Qué ocurriría con el valor de la mediana, si una de las edades fuera


99?
 ¿Puede tomar valores negativos?
 ¿En qué unidades se expresa?
 ¿Cuántas medianas puede tener una distribución?
 ¿Cuándo conviene utilizarla?

1.3 PERCENTILES ( Pp)

No siempre interesa conocer “el Valor central” de una distribución de


frecuencias; a veces es necesario saber cuáles son los valores de la variable
que “dividen” la distribución en cuartos (CUARTILES), décimos (DECILES) o
quinto (QUINTILAS). Pero en el área de la salud, es frecuente que se necesite
conocer valores que dividen la distribución en cien partes iguales en cuanto
a frecuencia. Dichos valores reciben el nombre de PERCENTILES.

Ejemplos:

 Percentil 75 ( P75 ): es un valor de la variable que deja el 75% de las


observaciones bajo él y al restante 25% sobre él
 Percentil 33 ( P33 ): supera a 1/3 de las observaciones y es superado por
los 2/3 de ellas.
 Percentil 50 ( P50 ): ¿A qué corresponde?

Aunque se pueden calcular en las mismas situaciones que la mediana,


sólo son útiles para datos agrupados.

Se calculan igual que la mediana, pero reemplazando n/2 por np/100


donde n es el número de datos y p corresponde al número del percentil.

8
Ejemplo:

Los datos siguientes corresponden a defunciones ocurridas en la ciudad


de Santiago durante un mes, de hace tres décadas.

EDAD DEFUNCIONES
Nº %
(años) Fi

15 – 24 40 4,1 40
25 – 34 67 6,9 107
35 – 44 143 14,7 250
45 – 54 180 18,5 430
55 – 64 270 27,7 700
65 – 74 275 28,2 975

TOTAL 975 100,1

Calcularemos : P , P50 y P75


25

*P 25 np/100 = 975  25/100 = 243,75

P 25 = 35 + 10 243, 75 – 107 = 35 + 9,6 = 44,6 años


143

* P50 np/100 = 975  50/100 = 487,5

P50 55 + 10 487,5 – 430 = 55 + 2,1 = 57,1 años


270

P 75 np/100 = 975  75/100 = 731,25

P 75 = 65 + 10 731,25 – 700 = 65 + 1,1 = 66,1 años


275

9
En resumen:

P25 = 44,6 años: P50 = 57,1 años y P75 = 66,1 años. Lo cual significa
que del total de fallecidos estudiados el :

 25% no superó los 44,6 años.

 50% no superó los 57,1 años.

 75% no superó los 66,1 años.

Por supuesto que esto mismo usted lo puede decir de muchas otras
formas. ¡Usted elige!

1.4 MEDIA ARITMÉTICA O PROMEDIO (X ó  )

MEDIA ARITMECA es el valor que tendría una variable si no


hubiera variabilidad entre sus distintos valores, es decir, es el
centro de gravedad de la distribución de frecuencias de variable.

1.4.1 Datos no agrupados

Este procedimiento usted lo ha aplicado muchas veces. Primero se


suman los datos (lo cual se simboliza  Xi). Luego se determina el número
de datos (n) y finalmente se hace la división correspondiente. En símbolos.

X =  Xi
n

10
Ejemplo:

Se desea calcular el promedio de los siguientes valores de


hemoglobina (gr/100 c.c.):

10,8; 15,6; 14,9; 13,0; 13,5; 14,0; 13,6; 13,2; 12,5; 11,2

x = 132,3/10 = 13,2 gr/100 c.c.

Interprete el resultado obtenido.

1.4.1 Variable discretas

Es similar al caso anterior, pero como cada valor de la variable se


repite un cierto número de veces ( frecuencia ), en vez de sumar varias veces
el mismo número o dato, se multiplica por la frecuencia del valor
correspondiente.

Donde:
X =  xi fi
 fi = n = número de datos
 fi fi = número de veces que se
repite el dato i.

NOTA: siempre se debe efectuar primero los productos (Xifi) y luego la


suma de ellos. NUNCA OPERAR AL REVES

11
Ejemplo:

CANTIDAD DE VITAMINA Nº DE MUESTRAS CON TOTAL DE VITAMINA


(mg/100 ml) UNA DETERMINADA A EN UN DETERMINADO
CANTIDAD DE VITAMINA NIVEL

Xi fi Xi fi

54 9 486
55 15 825
56 20 1120
57 15 855
58 10 580
59 1 59

TOTAL  fi = 70  Xifi = 3.925

X=  Xi fi = 3925 = 56 mg/100 ml
ƒ 70

¿Qué significa este valor?

1.4.3 Variable continuas

En este caso se puede operar igual que en el caso anterior, si se utiliza


un valor que represente a cada intervalo; dicho valor se llama “marca (o
centro) de clase” y es el promedio entre los límites reales del intervalo. El
hecho de utilizar el centro del intervalo como valor de las observaciones del
grupo o clase, se basa en la suposición que los valores individuales se
distribuye en forma simétrica alrededor del promedio, de modo que las
subestimaciones que se producen se compensan con las sobreestimaciones.
Mientras mayor es el numero de observaciones, mejor será la compensación
cuando esta suposición es correcta.

Ejemplo:

12
HEMOGLOBINA NUMERODE MARCA TOTAL HEMOGLO-
gr/100 c.c. OBSERVACIONES BINA A UN NIVEL
DE CLASE
Xi ( 1 ) fi ( 2 ) DADO
Xci ( 3 )
Xci fi ( 4 )

11 – 12,9 2 12 24
13 – 14,9 5 14 70
15 – 16,9 78 16 1248
17 – 18,9 226 18 4068
19 – 20,9 80 20 1600
21 – 22,9 7 22 154

TOTAL n = 398 TOTAL 7164

Los datos aparecen en las columnas (1) y (2)

El procedimiento es el siguiente:

a) Determinar el centro de clase Xci para cada intervalo (columna 3)


b) Multiplicar cada centro de clase por la frecuencia correspondiente.
(col4)
c) Sumar los productos obtenidos en columna 4.
d) Dividir la suma anterior por el total de datos.

X = 7164/398 = 18 gr/100 c.c.

X =  Xci fi

 fi

1.4.4 Más para pensar

 ¿Qué ocurrirá con el promedio si el primer y último intervalo no están


bien definidos?

13
 ¿Se puede calcular en variables cualitativas?

 ¿Qué ocurriría en el ejemplo anterior si hubiera un valor igual a 50?

 Para que tenga sentido práctico, debe utilizarse en distribuciones


simétricas. ¿Qué se puede hacer en caso contrario?

 Cuando los datos son promedios, su media aritmética NO es la suma de


los datos dividida por el número de datos. Cada promedio debe ser
multiplicado por el número de datos que le dio origen ( y se divide por el
número de datos originales).

 Si los datos se distribuyen exponencialmente se debe utilizar la media


geométrica.

 Si los datos son cuocientes se debe utilizar la media armónica.

 La media geométrica de un conjunto de n valores positivos se calcula


como la raíz de índice “n” del producto de los valores dados.

 La media armónica se calcula como el valor recíproco de la media


aritmética de los valores recíprocos de la variable.

1.4.5 Criterios para elegir estadígrafos de posición.

a) Según tipo de variable:


- Cualitativa no ordenable:
- Cualitativa ordenable
- Cuantitativa discreta:
- Cuantitativa continua:

b) Según forma de la distribución:


- Simétrica:
- Exponencial:
- Cuocientes:
- Otros casos:

2. ESTADIGRAFOS DE DISPERSION

Intensidad, tendencia central, posición, medias... de distintos tipos,


etc., son términos que usted ya deglutió y está digiriendo (¿?). Entonces
puede que esté en condiciones de responder algunas interrogantes : ¿Es
usted una persona promedio ¿ ¿cuál es la duración más frecuente de un
beso? ¿Cuál es la mediana de su tiempo de estudio semanal? ¿Su PGP refleja
14
su esfuerzo? ¡Responda! ¡Tiene toda la razón! Falta precisión ....
¡depende! ....

No basta resumir información de acuerdo a lo ya revisado, para tener


una idea completa acerca de un hecho. Falta considerar otros aspectos entre
los cuales está la variabilidad. ¿Qué es la variabilidad?

Observe los tríos siguientes:

9 8 7 6 5 4 3 2 1
9 9 9 9 9 9 9 9 9
9 10 11 12 13 14 15 16 17

¿En qué se parecen estos tríos de números?

¡De acuerdo! ... entonces difieren en la variabilidad o dispersión, que


puede ser resumida por medio ¿De qué cree usted? ¡Consulte dudas!

NOTA: En este curso respetamos su desviación respecto al promedio.

A continuación revisaremos los estadígrafos de dispersión más


utilizados en el áreas de la salud.

2.1 Amplitud. (llamada erróneamente rango)

Se calcula mediante la diferencia entre los valores máximo y mínimo de


un conjunto de datos.

15
Ejemplo:

Número de hijos por familia:

5, 7, 9, 10, 10, 11, 11, 13, 15

Amplitud : 15 – 5 = 10

 Se usa cuando se trata de pocos datos o si interesa conocer la


dispersión total.

 No se basa en todas las observaciones

 Debe utilizarse en combinación con otros indicadores.

2.2 Desviación estándar

Es el promedio de las desviaciones respecto a la media aritmética y se


simboliza por “s” cuando se trabaja con una muestra y por  cuando se
dispone de información poblacional.

2.2.1 Datos no agrupados

2 2
 =  Xi 2 s=  Xi - ( Xi)2
N
n–1 n (n-1)

Ejemplo:

4, 8, 10,11,17

16
Supongamos que se trata de una población

Xi Xi2

4 16
8 64
10 10
11 121
17 289

50 590

2
 = 590 50 = 118 - 100 =18 = 4,2
5 5

Supongamos ahora que se trata de una muestra

S= 590 ( 50) 2 = 147,5 - 125 = 22,5 =


4,7
4 5*4

Datos agrupados

Si se trata de variables discretas bastará multiplicar los valores de la


variable por su respectiva frecuencia, o sea reemplazar

 Xi2 y Xi por Xi2 fi y Xi fi respectivamente

En el caso de variables continuas, se reemplaza Xi por la marca


de clase Xci.

2.2.3 Consideraciones
17
 El cuadrado de la desviación estándar se llama varianza
 La desviación estándar se basa en todas las observaciones
 El resultado es siempre positivo
 Está relacionada con la curva normal.
 No conviene utilizarla en distribuciones en que no corresponde aplicar
la media aritmética. En ese caso se puede utilizar un conjunto de
percentiles.

2.3 Coeficiente de variación (C V)

Muestra de variabilidad en forma adimensional

Desviación estándar
CV= x 100
Media aritmética

 Permite comparar la variabilidad relativa de dos distribuciones.


 En su cálculo participan todos los datos.

SUFICIENTE

LO ULTIMO. Las medidas de dispersión presentadas ¿A qué tipo de variables


son aplicables? ¿Correcto! Pero conviene tener presente que también existen
estadigrafos de dispersión para los otros tipos de variables, pero no son de
uso frecuente.

18

Potrebbero piacerti anche