Sei sulla pagina 1di 62

UNIVERSIDAD SAN PEDRO

FACULTAD DE MEDICINA HUMANA


ESCUELA PROFESIONAL DE MEDICINA
BIOESTADISTICA Y DEMOGRAFIA
TABLAS DE DISTRIBUCION DE FRECUENCIAS

19/05/2018
DOCENTE: MIGUEL ANGEL FALCON POVIS
I. ESTADISTICA DESCRIPTIVA
Tablas de distribución de frecuencias.
• (Frecuencias relativas y relativas acumuladas. )Graficas
estadísticas
• Histogramas
• Polígonos
• Ojivas
• Grafico de Torta o Pastel
Medidas de tendencia central
• Media
• Mediana
• Moda
• percentiles y cuartiles
Medidas de dispersión
• Rango
• Varianza
• desviación estándar
• coeficiente de variación
• Diagrama de cajas.
Actividad: Práctica en sala de cómputo. instrucciones sobre manejo de
paquete estadístico para descripción de datos
1. Introducción:
• La palabra "estadística" suele utilizarse como
colección de datos numéricos.- esto es el
significado más vulgar de la palabra estadística.
Se sobrentiende que dichos datos numéricos
han de estar presentados de manera ordenada
y sistemática. Una información numérica
cualquiera puede no constituir una estadística,
para merecer este apelativo, los datos han de
constituir un conjunto coherente, establecido de
forma sistemática y siguiendo un criterio de
ordenación
Introducción:
En si, es una serie de técnicas ligadas con
el fin de recolectar puede ser por medio
de test, encuestas, censos, entre otras
formas, un conjunto de datos. Luego
organizar de manera cuantitativa o
cualitativamente, según sea el caso.
Presentar ya sea por tablas o por gráficos
y finalmente analizar el conjunto de datos
para sacar conclusiones y así poder tomar
una buena decisión.
Introducción:
• A su vez, cada elemento de la
población tiene una serie de
características que pueden ser
objeto del estudio estadístico.
Así por ejemplo si consideramos
como elemento a una persona,
podemos distinguir en ella los
siguientes caracteres:
• Sexo, edad, nivel de estudios,
profesión, peso, altura, color de
pelo, etc.
• Luego por tanto de cada
elemento de la población
podremos estudiar uno o más
aspectos cualidades o
caracteres.
Variables y Atributos.
• Como hemos visto, los
caracteres de un
elemento pueden ser de
muy diversos tipos, por
lo que los podemos
clasificar en: dos
grandes clases:
• Variables cuantitativas.
• Variables cualitativas o
atributos
Variables cuantitativas.
• Las variables cuantitativas son las que se describen por
medio de números, como por ejemplo el peso, altura, edad,
número de suspensos…
• A su vez este tipo de variables se puede dividir en dos
subclases:
• Cuantitativas discretas. Aquellas a las que se les puede
asociar un número entero, es decir, aquellas que por su
naturaleza no admiten un fraccionamiento de la unidad, por
ejemplo número de hermanos, páginas de un libro, etc.
• Cuantitativas continuas: aquellas que no se pueden
expresar mediante un número entero, es decir, aquellas
que por su naturaleza admiten que entre dos valores
cualquier la variable pueda tomar cualquier valor
intermedio, por ejemplo peso, tiempo. Etc.
• No obstante en muchos casos el tratamiento estadístico
hace que a variables discretas las trabajemos como si
fuesen continuas y viceversa.
• Los atributos son aquellos caracteres que para su
definición precisan de palabras, es decir, no le podemos
asignar un número. Por ejemplo sexo profesión, estado
civil, etc. A su vez las podemos clasificar en:
• Ordenables: aquellas que sugieren una ordenación, por
ejemplo la graduación militar, el nivel de estudios, etc.
• No ordenables: aquellas que sólo admiten una mera
ordenación alfabética, pero no establece orden por su
naturaleza, por ejemplo el color de pelo, sexo, estado
civil, etc.
• CENSO. Decimos que realizamos un censo cuando se
observan todos los elementos de la población estadística
TABLAS DE
DISTRIBUCION
DE
FRECUENCIAS.
Método Estadístico
El método estadístico es un conjunto de procedimientos que se emplean para describir
y determinar las características de las series de datos, relativas a los fenómenos reales.

El método estadístico contempla las siguientes etapas:


1. Recopilación de datos
2. Organización de los datos
3. Análisis de las series de datos
4. Presentación de resultados
5. Formulación de conclusiones

Plantear/diseñamos Recopilación
hipótesis de datos

Se emplean
parámetros
o medidas
estadísticas
que valoren
Conocemos los valores, una
su estructura, Analizamos/ característic
tendencia, variabilidad Formulamos
presentamos los a
para compararlos y conclusiones
resultados
poder inferir las
características de la
población
Presentación Ordenada de Datos
Una vez recogida y procesada la información, es necesario presentar los resultados
de manera adecuada, de forma tal que contribuya a una mejor comprensión y
exposición de dichos resultados, en función de los objetivos del trabajo.

Un instrumento es la
Número de orden Distribución de frecuencias
Tabla 1.
Título Localización anatómica de los nódulos
en la glándula mamaria.
HREGB".
2014
Encabezado NO. DE
LOCALIZACIÓN %
CASOS
Cuadrantes superiores 164 47.7
Cuadrantes inferiores 30 8.7
Retroareolar 8 2.3 Cuerpo de
Bilateral 142 41.3
la tabla

TOTAL 344 100.0

Fuente: Historias Clínicas Fuente


Columna Matriz
La tabla de Distribución de frecuencias, ofrece la información
necesaria para hacer las representaciones gráficas y facilitar los cálculos del
cual se obtendrán los estadísticos muestrales de la población estudiada.
Tabla 2
Hábito de Fumar según Sexo
Hospital "Aleida Fernández“
1998
TIPO MASCULINO FEMENINO TOTAL
Fumadores 60 15* 75

No Fumadores 20 60 80
Total 80 75 115

*Se incluyen dos pacientes en que el dato no aparece en la historia clínica


Mutuamente
exclusivas Habito de Fumas según Sexo
"Hospital Aleida Fernandez"

80 60 60
60
40 20
15
20
Exhaustivas
0
Fumadores No Fumadores
Masculino Femenino
De acuerdo a la forma de los datos
# de Hijos de pacientes con 6, 2, 1, 1, 2, 2, 3, 4, 2, 3, 0, 2, 1, 0, 3, 2, 1, 5, 4,
TBC 1, 3 , 5, 1, 0, 4, 4, 3, 1, 3, 3,

TABLA N° 3.
NUMERO DE HIJOS DE LOS PACIENTES CON TBC
HOSPITALIZADOS EN EL CENTRO MEDICO YUGOSLAVO
JUNIO 2014
N.Hijos Frecuencia Porcentaje
(xi) Fi %
Se calcula: (1/30) x 100
6 1 3%
5 2 6%
4 4 14%
3 7 23%
2 6 20%
1 7 24%
0 3 10%
Se ubica cada clase TOTAL 30 100

Toma como base los 30


Número de hijos por clase pacientes estudiados
Datos agrupados por clase
8, 1, 2,7,11,18,20,28,23,30,32,15,31,30,32,46,39,78,38,35,30,38,50,40,41,40,45,46,41,
49,47,46,45,37,41,42,5,49,41,42,50,60,59,57,51,50,39,52,58,61,68

TABLA N°4.
PACIENTES HOSPITALIZADOS EN
EL CENTRO MEDICO LA ESPERANZA POR EDAD.
ABRIL 2013
1°Rango de la amplitud:
INTERVALO DE CLASE EDAD
N U M E RO 78-1+1 = 78
(Años cumplidos)
00 - 09 05 2°Dividimos 78/5 y 78/10
Reglas para agrupar las 10 - 19 03 nos da 15,6 y 7,8
puntuaciones de las 20 - 29 03
30 - 39 12
El intervalo de clase debe
variables: 40 - 49 16 tener 10 de amplitud
50 - 59 8
1° Aconsejable que los 60 - 69 3 3°Para el 1er. Intervalo debe
intervalos de clase 70 + 1 contener el valor mínimo
contengan 1,2,3,5,10 20 Luego 1er Interv. 0 - 9
TOTAL 51
unidades de la escala
4°Debemos recordar que los
2° El # de intervalos debe intervalos son cerrados
variar entre 5,10 y 20 por la izqu. y abiertos por
la derecha.
Tipos de Tablas estadísticas
Tablas de una entrada
Tabla de una entrada o de entrada simple cuando representan una sola variable o característica
de la realidad. En la columna matriz van las clases en que se presenta las variaciones de la
característica en estudio
Tabla 5.
Localización anatómica de los
nódulos en la glándula mamaria.
Hosp. «III ESSALUD". 2014
Localización No. de casos
Columna Matriz
Cuadrantes superiores 164
Externo 114
Interno 50
Cuadrantes inferiores 30
Externo 17
En esta columna Interno 13
van las clases Retroareolar 8
para cada variación Bilateral 142
de la
característica TOTAL 344
en estudio
* Fuente: Historias Clínicas
Tablas de dos entradas
En estas tablas se presentan dos variables de la realidad, las clases de una de
ellas van en la columna matriz (vertical) y las clases de la segunda en el
encabezado (horizontal).
Tabla 6. Embarazadas hipertensas por grupos

En esta fila van las segunda clase para cada variación

Total de Total
Grupos etáreos Total
Embarazadas hipertensas
15-19 1 244 51 1295
En esta
columna 20-24 2 626 269 2895
van la 25-29 3 305 211 3516
primera
Clases 30-34 1 740 215 1955
para cada 35-39 902 161 1063
variación
40 y más 204 49 244
Total 10 021 957 10968
Incidencia: 9,5 % = 28 años
Fuente: Datos obtenidos del libro de partos y de las historias clínicas.

Las sumas deben coincidir


Tablas complejas
TABLA N° 7:
Pacientes atendidos por Hepatitis Viral por nivel de instrucción,
según zona de procedencia y sexo.

Presenta en forma simultánea a tres o más variables

TIPO DE RESIDENCIA
NIVEL DE
INSTRUCCION URBANA URBANO MARGINAL RURAL TOTAL

MASC FEM MASC FEM MASC FEM

Analfabeto 6 4 22 06 01 03 42

Primaria 9 6 23 25 07 03 73

Secundar. 3 2 06 05 03 03 22

Superior 0 0 01 02 01 00 04

TOTAL 18 12 52 38 12 09 141

FUENTE: HREGB. Oficina de Estadística.


Las sumas deben coincidir
Usos de la Tabla de frecuencias
TABLA N° 3.
NUMERO DE HIJOS DE LOS PACIENTES CON TBC
HOSPITALIZADOS EN EL CENTRO MEDICO YUGOSLAVO
JUNIO 2014

Hijos Frecuencia Porcentaje. Porcen ¿Qué porcentaje de pacientes


(xi) fi % Acumul con TBC tienen 4 o más hijos?
6 1 3 3
5 2 6 9
4 4 14 23
¿Cuántos pacientes con 3 7 23 46 ≥40% = 23 %
2 6 20 66
TBC tienen menos de 3
1 7 24 90
hijos? 0 3 10 100 ¿Cuántos hijos de pacientes
=Frec.pacientes con 1 hijo + TOTAL 30 100 con TBC son al menos el
frec.pacientes con 2 hijos + 40% inferior o igual ?
(frec.pacientes con 0 hijos =3
= 7 + 6 + 3 = 16 pacientes Frecuencia absoluta

¿Qué % de pacientes con TBC ¿Qué % de hijos de pacientes


tiene entre 3 y 5 hijos? Frecuencia Relativa con TBC son más de 4 ?

= 23%+14%+6%= 43% = 9%
Frecuencia Acumulada
Gráficos de una Distribución de Frecuencias
Pacientes Hospitalizados Centro Médico La Esperanza
Por Edad
1998
TABLA N°4.
PACIENTES HOSPITALIZADOS EN 18

EL CENTRO MEDICO LA ESPERANZA POR EDAD. 16

ABRIL 1998 14

Frecuencia
12

Punto 10
EDAD FRECUENCIA
Medio 8

00-09 5 5 4

10-19 3 14 0

00-09 10-19 20-29 30-39 40-49 50-59 60-69 70+


20-29 3 24 Edad
30-39 12 34
40-49 16 44
50-59 8 54
60-69 3 64
70+ 1 74
TOTAL 51

Las tablas de frecuencias y las representaciones


gráficas son dos maneras equivalentes de
presentar la información.
Las dos exponen ordenadamente la información
recogida en una muestra.
Características generales de una Distribución de Frecuencias

Atendiendo a su Forma

FORMA SIMETRICA O DE CAMPANA


Las observaciones equidistan del
máximo central, tienen la misma
frecuencia.
E. Distribución de ancianos según Edad

FORMA MULTIMODAL
Se Representa cuando en número de
unidades de información incluida en
la clase varía de una a otra.
(esta curva tiene mas de dos máximos)
TIPO DE SESGO
POSITIVO O NEGATIVO
Esta forma se presenta cuando el centro de gravedad fluctúa de un lado a otro.
Generalmente se presenta cuando el límite Inferior ó superior se controla teóricamente
por un valor de especificación cuando no se presentan valores inferiores o superiores a
cierto valor.

Sesgada a la Derecha Sesgada a la Izquierda


(Sesgo +) (Sesgo -)

Ejem. Estadía de pacientes en UCI


CRITERIOS PARA COMPARAR DISTRIBUCIONES DE FRECUENCIAS
Gráfico 2.
Gráfico 1. Distribución de frecuencias según grupos
Distribución de los RN según puntaje ECEN. de peso de los RN nutridos y desnutridos.
MINSA 2013-2014

La distribución de los puntajes ECEN (Evaluación


clínica del estado nutricional) de la muestra es
similar a una Distribución Normal. Se observa a
la izquierda los valores con menor puntaje que
corresponde a los desnutridos
Atendiendo a su Forma
TABLA N° 3.
NUMERO DE HIJOS DE LOS PACIENTES CON TBC
HOSPITALIZADOS EN EL CENTRO MEDICO CARRANZA
JUNIO 1999

# Hijos Número de Hijos de los Pacientes con TBC


(xi)
fi hospitalizados Centro Médico Carranza
Junio1999

6 1 8
5 2 7
4 4 6
5
Frecuencia

3 7
2 6 4
3
1 7
2
0 3
1
0
TOTAL 30
6 h. 5 h. 4 h. 3 h. 2 h. 1 h. 0 h.
# de Hijos

Según el histograma podemos identificar la


mayor acumulación o concentración de datos
se encuentra centrado entre 2 y 3 hijos.
TIPOS DE GRÁFICOS

TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)

Distribución de las unidades de


análisis de acuerdo a variable 1
Distribución de las unidades de análisis de
acuerdo a variable 1 D
10% A
20%

C
D A 40% B
10% 20% 30%

Distribución de las unidades de


análisis de acuerdo a variable 1
C B
40% 30%
D A
10% 20%

C
B
40%
30%
TIPOS DE GRÁFICOS
TIPOS DE GRÁFICOS 2. Gráfico de Barras

Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a


variable 1
de acuerdo a variable 1

D
500

variable 1
400 C
300

B
200

100 A

0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1

C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos. 25
TIPOS DE GRÁFICOS

TIPOS DE GRÁFICOS 3. Histograma


Histograma Histograma
Distribución de los hijos de trabajadores
de la empresa de acuerdo a edad - Permite la representación de la
15
frecuencia de una variable
Cuantitativa.
Frecuencia

10

- El eje x se refiere a la variable.


- El eje y se refiere a la frecuencia


0 (Nº , %).
7 8 9 10 11 12 13 14

edad
edad - Cada barra representa la
frecuencia de la variable en la
Ejemplo población en estudio (o la
En el gráfico se puede observar el número muestra).
de hijos , de menor edad (7-8 años), las de -El histograma se puede construir
mayor edad (13-14 años); y además que la desde los datos de la tabla de
mayoría de hijos de los trabajadores están frecuencia de la variable en
entre los 10 y 12 años. estudio.
TIPOS DE GRÁFICOS

TIPOS DE GRÁFICOS 5. Polígono de Frecuencia

Distribución de los hijos de trabajadores


-Esta representación se
basa en el Histograma.
de la empresa de acuerdo a edad
15
-Sólo es útil para
variables cuantitativas.
Frecuencia

10

edad

-El eje x se refiere a la


5
variable.
0
- El eje y se refiere a la
7 8 9 10 11 12 13 14

edad frecuencia (Nº , %).


-Los puntos que
permiten la unión de las
líneas representa el
centro de clase (o marca
de clase). 27
TIPOS DE GRÁFICOS
TIPOS DE GRÁFICOS 5. Diagrama de Caja

Edad de las personas que se realizaron


angioplastía entre 1980 y 2000
- Permite identificar
100 gráficamente la mediana, los
90 cuartiles 1 y 3 (percentiles 25
80 y 75), mínimo y máximo de
70 una variable.
60
- Sólo es útil para variables
Edad

50

40
cuantitativas.
30
-El eje x permite identificar la
20
población en estudio.
10
0
N= 584 1473
- El eje y representa los
Mujeres Hombres valores de la variable en
28
estudio.
TIPOS DE GRÁFICOS
TIPOS DE GRÁFICOS 6. Otros

Número de alumnos matriculados en la Número de alumnos matriculados en la


Carrera A según año de ingreso Carrera B según año de ingreso

100 100
Nº de alumnos

Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso

Número de alumnos matriculados en las Carreras


según año de ingreso
Nº de alumnos
200
Nº de alumnos

año de ingreso Carrera A Carrera B


1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
2003 70 75 0
1998 1999 2000 2001 2002 2003

Carrera B año ingreso


Carrera A
TABLAS DE DISTRIBUCION DE FRECUENCIAS

• La tabla de distribución de
frecuencias permite ordenar el
número de individuos que
pertenecen a cada categoría de la
variable. La frecuencia de
observaciones en cada categoría
puede expresarse como una
frecuencia absoluta (total de
observaciones en una determinada
categoría) o como una frecuencia
relativa (proporción o porcentaje en
que un atributo o cualidad se
manifiesta dentro de una
determinada categoría.
Como confeccionar una Tabla de
Frecuencias
• Tomemos, por ejemplo, una población formada por
500 personas, que estudiaremos en función de la
variable "gravedad de la enfermedad".
• Si decimos que, del total de la población (500), 200
personas están enfermas, estamos definiendo la
frecuencia absoluta de enfermos (f = 200).
• La frecuencia relativa puede expresarse como una
proporción o como porcentaje, en ambos casos
estaremos diciendo lo mismo de maneras diferentes.
• Como proporción:
dividiendo el número de
casos por el total de los
casos examinados. En
nuestro ejemplo sería
200/500 = 0,4 de los
sujetos están enfermos.
• Como porcentaje:
multiplicando este
número por 100, 0,4 x
100 = 40% de los sujetos
están enfermos.
• Si de las 200 personas enfermas 50
están graves, podremos elegir dos
alternativas diferentes para calcular la
frecuencia relativa (fr) de casos
graves:
• Frecuencia relativa de casos graves
en relación al total de individuos
estudiados:
• dividir la cantidad de casos graves
(50) por el total de la población
examinada (500), en cuyo caso la
frecuencia relativa es igual a 0,1
(proporción) o 10% (porcentaje).
TABLAS DE DISTRIBUCION DE FRECUENCIAS

TENEMOS LOS SIGUIENTES


TIPOS DE FRECUENCIA:
• FRECUENCIA ABSOLLUTA.
• FRECUENCIA RELATIVA.
• FRECUENCIA RELATIVA PORCENTUAL.
• FRECUENCIA ABSOLUTA ACUMULADA
ASCENDENTE.
• FRECUENCIA ABSOLUTA ACUMULADA
DESENDENTE.
• Frecuencia Absoluta: fi
La frecuencia absoluta de una variable estadística, es el
número de veces que aparece en la muestra dicho valor de
la variable, la representaremos por fi
• Frecuencia Relativa: FR o Fi
La frecuencia absoluta, es una medida que está influida
por el tamaño de la muestra, al aumentar el tamaño de la
muestra aumentará también el tamaño de la frecuencia
absoluta. Esto hace que no sea una medida útil para poder
comparar. Para esto es necesario introducir el concepto de
frecuencia relativa, que es el cociente entre la frecuencia
absoluta y el tamaño de la muestra. La denotaremos por
FR.
𝒇𝒊
𝑭𝑹 =
𝒏
FRECUENCIA RELATIVA PORCENTUAL: 𝑭𝑹 % o 𝑃𝑖

• La frecuencia relativa es
un tanto por uno, sin
embargo, hoy día es
bastante frecuente hablar
siempre en términos de
tantos por ciento o
porcentajes, por lo que
esta medida resulta de
Pi  Fi 100%
multiplicar la frecuencia
relativa por 100. La
denotaremos por Pi.
Frecuencia Absoluta Acumulada ascendente 𝑭𝒊 (+)
o 𝑵𝒊 :
• Para poder calcular este tipo de frecuencias hay
que tener en cuenta que la variable estadística
ha de ser cuantitativa de orden continuo o
cualitativa ordenable. En otro caso no tiene
mucho sentido el cálculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la
variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual
que el de la variable y lo representaremos por
Fi.
Frecuencia Relativa Acumulada ascendente: 𝑭𝑹 (+) o 𝑭𝒊

• Al igual que en el caso


anterior la frecuencia
relativa acumulada es
igual a la frecuencia
absoluta acumulada Ni
ascendente dividido por
el tamaño de la muestra,
Fi 
y la denotaremos por Fi N
Frecuencia Porcentual Acumulado ascendente:𝑷𝒊

• Análogamente se define
el porcentaje acumulado
y lo vamos a denotar por

Pi  Fi 100%
Pi como la frecuencia
relativa acumulada por
100.
Frecuencia absoluto Acumulado descendente:𝒇𝒊 (−)

• 𝑓𝑖 ()=
𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎𝑙 𝑡𝑎𝑚ñ𝑜 𝑑𝑒
𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎, luego se van restando con
los valores obtenidos de la frecuencia
absoluta fi.
Frecuencia relativo acumulado descendente:𝒇𝑹 (+)

𝒇𝒊 (+)
• 𝑓𝑅 (+)=
𝑛
Frecuencia porcentual acumulado descendente:𝒇𝑹 (%)

• 𝒇𝑹 % = 𝒇𝑹 (+) . 100
Ejemplo
• Veamos esto con un ejemplo: tomamos para ello los
datos relativos a las personas activas.
Personas Número
activas familias
Xi Ni Fi Pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50

• En este ejemplo se puede ver fácilmente como se


calculan estas frecuencias.
Tablas de frecuencias

• Existen dos formas diferentes de tablas de


frecuencia, teniendo …
1. Que la variable estadística tome pocos valores
diferentes (ya sea grande o pequeño el tamaño
de la muestra).
2. Que, en una muestra de gran tamaño, la
variable estadística tome muchos valores
diferentes, ya se trate de variable estadística
discreta como de variable estadística continua
(este último caso es el más habitual).
En el primer caso no
es necesario agrupar
los datos, y la tabla
de distribución
presenta el siguiente
aspecto (ordenando
los datos de menor a
mayor) :
• En el segundo caso por tratarse de variable continua o
discreta pero con un número de datos muy grande, es
aconsejable agrupar los datos en clases.
• Agrupamos los valores de la variable estadística en
intervalos de clase contiguos y elegidos
convenientemente para no perder mucha información. No
existe un criterio claro de cuál debe ser el número de
intervalos que debemos escoger, Norcliffe establece que el
número de clases debe ser, aproximadamente igual a la
raíz cuadrada positiva del número de datos. Normalmente,
el número de intervalos de clase se suele fijar entre 5 y 15
y de tal manera que en cada clase se tengan, al menos, 5
observaciones. De todas formas el investigador los
acomodará a las condiciones especificas del problema
estadístico objeto de estudio (se tomarán tantos intervalos
solapados como sean necesarios para recubrir todo el
recorrido de la variable).
• Los extremos de los intervalos de clase se denominan
extremos de clase y sus puntos medios marcas de clase
(valor que nos representa la información que contiene un
intervalo).
• Como cada observación debe quedar perfectamente
encasillada en uno y sólo un intervalo de clase, debemos
decidir a qué intervalos pertenecen los extremos de las
clases, por lo que habrán de tomarse intervalos
semiabiertos o tomando el extremo de cada clase con un
decimal más que las observaciones. Con el fin de que la
clasificación esté bien hecha, los intervalos se deben
construir de manera que el límite superior de una clase
coincida con el límite inferior de la siguiente, y además,
adoptando el criterio de que los intervalos sean cerrados por
la izquierda y abiertos por la derecha.
• Por otro lado tenemos la amplitud de cada intervalo, que
puede ser constante o variable. Si procuramos que todas
las clases tengan la misma amplitud y los límites de cada
clase sean números redondos (múltiplos p. ej. de 5)
conseguiremos simplificar mucho los cálculos (siempre y
cuando no se pierda demasiada información con estas
consideraciones).
• Debemos observar un hecho importante, se entiende que
cuando hacemos una agrupación en intervalos de clase,
para nosotros solamente cuenta el número de
observaciones que caen dentro de cada uno de los
intervalos y no la colocación en su interior, es decir,
suponemos que la distribución de estos valores en el
intervalo es homogénea, en esto radica la pérdida de
información que supone agrupar los datos de las
observaciones.
Tabla de
frecuencias
de una
variable
estadística
agrupada
en
intervalos.
(Frecuencias relativas y relativas
acumuladas.)Graficas estadísticas

Ejemplo. Datos f (en Fr(%)


• En la siguiente (vacunas) miles) (redondeado
tabla se muestra el
total de vacunas BCG 47 17
aplicadas durante
el verano de 2014 SABIN 111 41
en un
DPT 73 27
departamento de
la República
SARAMPION 41 15
Peruana.
TOTAL 272 100
• Bacillus de Calmette y Guérin, más conocida por
su sigla BCG, es la vacuna contra la tuberculosis.
• En todo el mundo, se emplean dos tipos de vacuna contra
la poliomielitis. La vacuna Salk contra la poliomielitis consiste
en una dosis inyectada de poliovirus inactivados o muertos. La
segunda vacuna fue una vacuna oral desarrollada por Albert
Sabin usando poliovirus atenuados. Los ensayos clínicos de la
vacuna Sabin iniciaron en 1957 y fue autorizada en 1962.
• DPT (o en ocasiones DTP) es una mezcla de
tres vacunas que inmunizan contra la difteria, Bordetella
pertussis (la tos ferina) y el tétanos. Los niños deben recibir 5
dosis de DPT: a los 2 meses de edad, luego a los 4 meses, a
los 6 meses, a los 18 meses (éstas van incluidas en la vacuna
llamada pentavalente), y a los 4-6 años solamente como DPT1
• Vacuna DT es la denominación para la vacuna contra
la difteria y el tétanos.
Por ejemplo, en un estudio se realizó una encuesta
a 120 pacientes diabéticos y se determinó el "número de
hospitalizaciones que refería haber presentado en el
último año". Los datos fueron volcados en la tabla que se
presenta a continuación (Tabla 9).
Tabla 9. Tabla de frecuencias del "Número de
hospitalizaciones en el último año"
Número de Nº de Frecuencia relativa Frecuencia
hospitalizaciones individuos (f) % acumulada %
(fr%) (fa%)

0 22 18,4 % 18,4 %
1 39 32,5 % 50,9 %
2 31 25,8 % 76,7 %
3 16 13,4 % 90,1 %
4 8 6,6 % 96,7 %
5 3 2,5 % 99,2 %
6 1 0,8 % 100,0 %
TOTAL 120 100%

Si quisiéramos establecer cuántos de los 120 pacientes diabéticos


encuestados referían haber presentado 1 o menos de 1 internación en
el último año, sabríamos por la tabla, que fue del 50.9%.
Pensar y resolver:
Ejercicio: confección de una tabla de frecuencia para una variable
continua

Los datos corresponden a la edad de los Realice la siguiente actividad


hijos de los trabajadores de una clínica
1) Construya un Diagrama
2) ¿Cuál es la variable?; ¿Cuál es la Unidad de
análisis?; ¿Cuánto vale n?; ¿Cuál es el rango de la
variable?.
3) Sobre una Tabla de frecuencia: ¿Cuántos
intervalos podría construir?; ¿Cuál es la amplitud
de cada intervalo?; ¿Cuántas medidas de
frecuencia puede obtener para cada intervalo?.
Datos ordenados de menor a mayor
4) Construir tabla de frecuencia para la variable:
Intervalos, centro de clase, amplitud, frecuencias.
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5 Diagrama de Tallo y Hoja: permite organizar los datos de
8,7 10,2 10,6 10,8 11,8 13,9 una variable medida sobre un conjunto de individuos. Su
utilidad viene dada cuando no contamos con herramientas
9,3 10,3 10,6 10,9 11,9 -
automáticas para ordenar los datos.
9,5 10,3 10,6 11,0 12,0 -
54
Pensar y resolver:
1. Clasifica las siguientes variables según el criterio que hemos
estudiado: Gravedad de un infarto (leve, moderado, fuerte),
Numero de ataques de asma semanales, Sexo, Presión
arterial, Estatura, Peso, Estado de dolor tras la toma de un
fármaco (Peor, Igual, Mejor), Provincia, Edad, Numero de
preguntas acertadas en un test, Grupo sanguíneo.
2. Se desea realizar un estudio sobre hipertensión arterial en
población anciana. Queremos estudiar este problema y que
características de los pacientes pueden tener relación o no con
el. Identifica las unidades experimentales del estudio y las
variables de interés.

55
3. Si quisiéramos investigar una enfermedad podríamos
estar interesados en establecer el sexo de las personas
afectadas, su edad, profesión, ingresos, hábitos
alimentarios, etc. Todas éstas son características de las
personas enfermas que permiten caracterizar mejor a
quiénes afecta la enfermedad en cuestión. A que clase de
variables correspondería:
4. Si quisiéramos investigar la ocurrencia de tuberculosis en
una ciudad, será interesante determinar, entre otras cosas,
las características relacionadas con el lugar en el que
sucede el evento, como domicilio y zona de residencia de
las personas afectadas. Que variables serìa necesario
estudiar para realizar una responsable investigación.

56
5. La frecuencia de la enfermedad cardiovascular en las mujeres jóvenes
es mucho menor respecto de la de las mujeres mayores de 50 años. Este
patrón de la enfermedad corroborado por diferentes estudios, permitió
observar que su frecuencia aumenta a partir de los 50 años,
probablemente debido a la menopausia y al descenso de los niveles de
estrógenos. Este hallazgo hace suponer la presencia de un efecto
protector de las hormonas sexuales femeninas en el desarrollo de la
enfermedad cardiovascular. Sin embargo, también se podría pensar que
esa diferencia en la frecuencia de la enfermedad podría ser explicada por
otros factores: por ejemplo, las mujeres mayores de 50 años están
habitualmente menos predispuestas a hacer ejercicios físicos, o no tienen
tanto interés en "los kilos de más" y llevan una dieta menos equilibrada,
etc. Todos estos factores están también asociados con una mayor
frecuencia de enfermedad cardiovascular.
• Pensar y resolver:
• Relea el ejemplo anterior, relativo a las enfermedades cardiovasculares
en mujeres mayores de 50 años e indique cuál/es sería/n la/s variable/s
dependiente/s y la/s independiente/s, según las distintas posibilidades
enunciadas.
Sexo
• Al igual que la edad, el sexo es otra variable que se debe considerar.
Casi todas las enfermedades ocurren de forma diferente de acuerdo al
sexo de las personas. Podríamos citar la mayor frecuencia del cáncer
de pulmón en los hombres o del cáncer de mama en las mujeres. A
menudo, encontrará en sus investigaciones variaciones en la
frecuencia de la enfermedad de acuerdo al sexo.
• Sin embargo, siempre debe tener en cuenta que en la mayoría de las
poblaciones los dos sexos también difieren en cuanto a la distribución
por edades. Siempre debe mirar con cuidado las diferencias
encontradas entre las distintas frecuencias de la enfermedad en
estudio de acuerdo al sexo y edad.

58
6. Interprete la siguiente Tabla 1 identificando variaciones en la
distribución de la enfermedad según sexo y edad. Resuma los
hallazgos que considere más importantes.
Tabla 1.
Distribución por sexo y edad de 1 859 casos de Tuberculosis declarados en
la Ciudad (X), durante 2014.
0- 4 5 - 14 15 - 24 25 - 34 35 - 44 45 - 54 55 - 64 65 y
mas

Hombres 1 326 72 57 109 364 263 225 94 142


(71,3%)

Mujeres 533 52 47 99 134 64 37 24 76


(28,7%)

Total 1 859 124 104 208 498 327 262 118 218
(100%) (6,7%) (5,6%) (11,2%) (26,8%) (17,6%) (14,1%) (6,3%) (11,7%)

59
Pensar y resolver
Lea atentamente el caso que se describe a continuación:
• " Dos médicos investigaban la prevalencia de enfermedad coronaria y
los probables factores de riesgo asociados a esta condición en hombres
entre 25 y 65 años de edad de un barrio de la ciudad de Bahía Blanca.
Para ello, entrevistaron personas con enfermedad coronaria e indagaron:
edad, sexo, antecedentes previos de enfermedad coronaria, tabaquismo
(al que clasificaron en leve, moderado y severo de acuerdo a la cantidad
de cigarrillos/día) y a la actividad física practicada por ellos (simplemente
establecieron dos categorías: actividad física presente; actividad física
ausente). Registraron, también, en todos los individuos la presión arterial
y les realizaron un análisis de sangre con el objeto de medir la
concentración sanguínea de colesterol».
Ahora le sugerimos que:
1) Seleccione al menos seis variables.
2) Identifique la variable dependiente.
3) Reconozca las distintas escalas de medición que requieren los distintos
tipos de variables.
GRACIAS POR
TU ATENCION

Potrebbero piacerti anche