Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
19/05/2018
DOCENTE: MIGUEL ANGEL FALCON POVIS
I. ESTADISTICA DESCRIPTIVA
Tablas de distribución de frecuencias.
• (Frecuencias relativas y relativas acumuladas. )Graficas
estadísticas
• Histogramas
• Polígonos
• Ojivas
• Grafico de Torta o Pastel
Medidas de tendencia central
• Media
• Mediana
• Moda
• percentiles y cuartiles
Medidas de dispersión
• Rango
• Varianza
• desviación estándar
• coeficiente de variación
• Diagrama de cajas.
Actividad: Práctica en sala de cómputo. instrucciones sobre manejo de
paquete estadístico para descripción de datos
1. Introducción:
• La palabra "estadística" suele utilizarse como
colección de datos numéricos.- esto es el
significado más vulgar de la palabra estadística.
Se sobrentiende que dichos datos numéricos
han de estar presentados de manera ordenada
y sistemática. Una información numérica
cualquiera puede no constituir una estadística,
para merecer este apelativo, los datos han de
constituir un conjunto coherente, establecido de
forma sistemática y siguiendo un criterio de
ordenación
Introducción:
En si, es una serie de técnicas ligadas con
el fin de recolectar puede ser por medio
de test, encuestas, censos, entre otras
formas, un conjunto de datos. Luego
organizar de manera cuantitativa o
cualitativamente, según sea el caso.
Presentar ya sea por tablas o por gráficos
y finalmente analizar el conjunto de datos
para sacar conclusiones y así poder tomar
una buena decisión.
Introducción:
• A su vez, cada elemento de la
población tiene una serie de
características que pueden ser
objeto del estudio estadístico.
Así por ejemplo si consideramos
como elemento a una persona,
podemos distinguir en ella los
siguientes caracteres:
• Sexo, edad, nivel de estudios,
profesión, peso, altura, color de
pelo, etc.
• Luego por tanto de cada
elemento de la población
podremos estudiar uno o más
aspectos cualidades o
caracteres.
Variables y Atributos.
• Como hemos visto, los
caracteres de un
elemento pueden ser de
muy diversos tipos, por
lo que los podemos
clasificar en: dos
grandes clases:
• Variables cuantitativas.
• Variables cualitativas o
atributos
Variables cuantitativas.
• Las variables cuantitativas son las que se describen por
medio de números, como por ejemplo el peso, altura, edad,
número de suspensos…
• A su vez este tipo de variables se puede dividir en dos
subclases:
• Cuantitativas discretas. Aquellas a las que se les puede
asociar un número entero, es decir, aquellas que por su
naturaleza no admiten un fraccionamiento de la unidad, por
ejemplo número de hermanos, páginas de un libro, etc.
• Cuantitativas continuas: aquellas que no se pueden
expresar mediante un número entero, es decir, aquellas
que por su naturaleza admiten que entre dos valores
cualquier la variable pueda tomar cualquier valor
intermedio, por ejemplo peso, tiempo. Etc.
• No obstante en muchos casos el tratamiento estadístico
hace que a variables discretas las trabajemos como si
fuesen continuas y viceversa.
• Los atributos son aquellos caracteres que para su
definición precisan de palabras, es decir, no le podemos
asignar un número. Por ejemplo sexo profesión, estado
civil, etc. A su vez las podemos clasificar en:
• Ordenables: aquellas que sugieren una ordenación, por
ejemplo la graduación militar, el nivel de estudios, etc.
• No ordenables: aquellas que sólo admiten una mera
ordenación alfabética, pero no establece orden por su
naturaleza, por ejemplo el color de pelo, sexo, estado
civil, etc.
• CENSO. Decimos que realizamos un censo cuando se
observan todos los elementos de la población estadística
TABLAS DE
DISTRIBUCION
DE
FRECUENCIAS.
Método Estadístico
El método estadístico es un conjunto de procedimientos que se emplean para describir
y determinar las características de las series de datos, relativas a los fenómenos reales.
Plantear/diseñamos Recopilación
hipótesis de datos
Se emplean
parámetros
o medidas
estadísticas
que valoren
Conocemos los valores, una
su estructura, Analizamos/ característic
tendencia, variabilidad Formulamos
presentamos los a
para compararlos y conclusiones
resultados
poder inferir las
características de la
población
Presentación Ordenada de Datos
Una vez recogida y procesada la información, es necesario presentar los resultados
de manera adecuada, de forma tal que contribuya a una mejor comprensión y
exposición de dichos resultados, en función de los objetivos del trabajo.
Un instrumento es la
Número de orden Distribución de frecuencias
Tabla 1.
Título Localización anatómica de los nódulos
en la glándula mamaria.
HREGB".
2014
Encabezado NO. DE
LOCALIZACIÓN %
CASOS
Cuadrantes superiores 164 47.7
Cuadrantes inferiores 30 8.7
Retroareolar 8 2.3 Cuerpo de
Bilateral 142 41.3
la tabla
No Fumadores 20 60 80
Total 80 75 115
80 60 60
60
40 20
15
20
Exhaustivas
0
Fumadores No Fumadores
Masculino Femenino
De acuerdo a la forma de los datos
# de Hijos de pacientes con 6, 2, 1, 1, 2, 2, 3, 4, 2, 3, 0, 2, 1, 0, 3, 2, 1, 5, 4,
TBC 1, 3 , 5, 1, 0, 4, 4, 3, 1, 3, 3,
TABLA N° 3.
NUMERO DE HIJOS DE LOS PACIENTES CON TBC
HOSPITALIZADOS EN EL CENTRO MEDICO YUGOSLAVO
JUNIO 2014
N.Hijos Frecuencia Porcentaje
(xi) Fi %
Se calcula: (1/30) x 100
6 1 3%
5 2 6%
4 4 14%
3 7 23%
2 6 20%
1 7 24%
0 3 10%
Se ubica cada clase TOTAL 30 100
TABLA N°4.
PACIENTES HOSPITALIZADOS EN
EL CENTRO MEDICO LA ESPERANZA POR EDAD.
ABRIL 2013
1°Rango de la amplitud:
INTERVALO DE CLASE EDAD
N U M E RO 78-1+1 = 78
(Años cumplidos)
00 - 09 05 2°Dividimos 78/5 y 78/10
Reglas para agrupar las 10 - 19 03 nos da 15,6 y 7,8
puntuaciones de las 20 - 29 03
30 - 39 12
El intervalo de clase debe
variables: 40 - 49 16 tener 10 de amplitud
50 - 59 8
1° Aconsejable que los 60 - 69 3 3°Para el 1er. Intervalo debe
intervalos de clase 70 + 1 contener el valor mínimo
contengan 1,2,3,5,10 20 Luego 1er Interv. 0 - 9
TOTAL 51
unidades de la escala
4°Debemos recordar que los
2° El # de intervalos debe intervalos son cerrados
variar entre 5,10 y 20 por la izqu. y abiertos por
la derecha.
Tipos de Tablas estadísticas
Tablas de una entrada
Tabla de una entrada o de entrada simple cuando representan una sola variable o característica
de la realidad. En la columna matriz van las clases en que se presenta las variaciones de la
característica en estudio
Tabla 5.
Localización anatómica de los
nódulos en la glándula mamaria.
Hosp. «III ESSALUD". 2014
Localización No. de casos
Columna Matriz
Cuadrantes superiores 164
Externo 114
Interno 50
Cuadrantes inferiores 30
Externo 17
En esta columna Interno 13
van las clases Retroareolar 8
para cada variación Bilateral 142
de la
característica TOTAL 344
en estudio
* Fuente: Historias Clínicas
Tablas de dos entradas
En estas tablas se presentan dos variables de la realidad, las clases de una de
ellas van en la columna matriz (vertical) y las clases de la segunda en el
encabezado (horizontal).
Tabla 6. Embarazadas hipertensas por grupos
Total de Total
Grupos etáreos Total
Embarazadas hipertensas
15-19 1 244 51 1295
En esta
columna 20-24 2 626 269 2895
van la 25-29 3 305 211 3516
primera
Clases 30-34 1 740 215 1955
para cada 35-39 902 161 1063
variación
40 y más 204 49 244
Total 10 021 957 10968
Incidencia: 9,5 % = 28 años
Fuente: Datos obtenidos del libro de partos y de las historias clínicas.
TIPO DE RESIDENCIA
NIVEL DE
INSTRUCCION URBANA URBANO MARGINAL RURAL TOTAL
Analfabeto 6 4 22 06 01 03 42
Primaria 9 6 23 25 07 03 73
Secundar. 3 2 06 05 03 03 22
Superior 0 0 01 02 01 00 04
TOTAL 18 12 52 38 12 09 141
= 23%+14%+6%= 43% = 9%
Frecuencia Acumulada
Gráficos de una Distribución de Frecuencias
Pacientes Hospitalizados Centro Médico La Esperanza
Por Edad
1998
TABLA N°4.
PACIENTES HOSPITALIZADOS EN 18
ABRIL 1998 14
Frecuencia
12
Punto 10
EDAD FRECUENCIA
Medio 8
00-09 5 5 4
10-19 3 14 0
Atendiendo a su Forma
FORMA MULTIMODAL
Se Representa cuando en número de
unidades de información incluida en
la clase varía de una a otra.
(esta curva tiene mas de dos máximos)
TIPO DE SESGO
POSITIVO O NEGATIVO
Esta forma se presenta cuando el centro de gravedad fluctúa de un lado a otro.
Generalmente se presenta cuando el límite Inferior ó superior se controla teóricamente
por un valor de especificación cuando no se presentan valores inferiores o superiores a
cierto valor.
6 1 8
5 2 7
4 4 6
5
Frecuencia
3 7
2 6 4
3
1 7
2
0 3
1
0
TOTAL 30
6 h. 5 h. 4 h. 3 h. 2 h. 1 h. 0 h.
# de Hijos
C
D A 40% B
10% 20% 30%
C
B
40%
30%
TIPOS DE GRÁFICOS
TIPOS DE GRÁFICOS 2. Gráfico de Barras
D
500
variable 1
400 C
300
Nº
B
200
100 A
0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
D -Cuando una variable es cuantitativa se puede utilizar
este tipo de gráfico sólo si la variable se ha
variable 1
C
transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
A
en Excel), y en algunos casos son muy útiles para
0 20 40 60 80 100 describir el comportamiento de una variable en distintos
% unidad de análisis grupos. 25
TIPOS DE GRÁFICOS
10
edad
edad - Cada barra representa la
frecuencia de la variable en la
Ejemplo población en estudio (o la
En el gráfico se puede observar el número muestra).
de hijos , de menor edad (7-8 años), las de -El histograma se puede construir
mayor edad (13-14 años); y además que la desde los datos de la tabla de
mayoría de hijos de los trabajadores están frecuencia de la variable en
entre los 10 y 12 años. estudio.
TIPOS DE GRÁFICOS
10
edad
Nº
50
40
cuantitativas.
30
-El eje x permite identificar la
20
población en estudio.
10
0
N= 584 1473
- El eje y representa los
Mujeres Hombres valores de la variable en
28
estudio.
TIPOS DE GRÁFICOS
TIPOS DE GRÁFICOS 6. Otros
100 100
Nº de alumnos
Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso
• La tabla de distribución de
frecuencias permite ordenar el
número de individuos que
pertenecen a cada categoría de la
variable. La frecuencia de
observaciones en cada categoría
puede expresarse como una
frecuencia absoluta (total de
observaciones en una determinada
categoría) o como una frecuencia
relativa (proporción o porcentaje en
que un atributo o cualidad se
manifiesta dentro de una
determinada categoría.
Como confeccionar una Tabla de
Frecuencias
• Tomemos, por ejemplo, una población formada por
500 personas, que estudiaremos en función de la
variable "gravedad de la enfermedad".
• Si decimos que, del total de la población (500), 200
personas están enfermas, estamos definiendo la
frecuencia absoluta de enfermos (f = 200).
• La frecuencia relativa puede expresarse como una
proporción o como porcentaje, en ambos casos
estaremos diciendo lo mismo de maneras diferentes.
• Como proporción:
dividiendo el número de
casos por el total de los
casos examinados. En
nuestro ejemplo sería
200/500 = 0,4 de los
sujetos están enfermos.
• Como porcentaje:
multiplicando este
número por 100, 0,4 x
100 = 40% de los sujetos
están enfermos.
• Si de las 200 personas enfermas 50
están graves, podremos elegir dos
alternativas diferentes para calcular la
frecuencia relativa (fr) de casos
graves:
• Frecuencia relativa de casos graves
en relación al total de individuos
estudiados:
• dividir la cantidad de casos graves
(50) por el total de la población
examinada (500), en cuyo caso la
frecuencia relativa es igual a 0,1
(proporción) o 10% (porcentaje).
TABLAS DE DISTRIBUCION DE FRECUENCIAS
• La frecuencia relativa es
un tanto por uno, sin
embargo, hoy día es
bastante frecuente hablar
siempre en términos de
tantos por ciento o
porcentajes, por lo que
esta medida resulta de
Pi Fi 100%
multiplicar la frecuencia
relativa por 100. La
denotaremos por Pi.
Frecuencia Absoluta Acumulada ascendente 𝑭𝒊 (+)
o 𝑵𝒊 :
• Para poder calcular este tipo de frecuencias hay
que tener en cuenta que la variable estadística
ha de ser cuantitativa de orden continuo o
cualitativa ordenable. En otro caso no tiene
mucho sentido el cálculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la
variable, es el número de veces que ha
aparecido en la muestra un valor menor o igual
que el de la variable y lo representaremos por
Fi.
Frecuencia Relativa Acumulada ascendente: 𝑭𝑹 (+) o 𝑭𝒊
• Análogamente se define
el porcentaje acumulado
y lo vamos a denotar por
Pi Fi 100%
Pi como la frecuencia
relativa acumulada por
100.
Frecuencia absoluto Acumulado descendente:𝒇𝒊 (−)
• 𝑓𝑖 ()=
𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑣𝑎𝑙𝑜𝑟 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎𝑙 𝑡𝑎𝑚ñ𝑜 𝑑𝑒
𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎, luego se van restando con
los valores obtenidos de la frecuencia
absoluta fi.
Frecuencia relativo acumulado descendente:𝒇𝑹 (+)
𝒇𝒊 (+)
• 𝑓𝑅 (+)=
𝑛
Frecuencia porcentual acumulado descendente:𝒇𝑹 (%)
• 𝒇𝑹 % = 𝒇𝑹 (+) . 100
Ejemplo
• Veamos esto con un ejemplo: tomamos para ello los
datos relativos a las personas activas.
Personas Número
activas familias
Xi Ni Fi Pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50
0 22 18,4 % 18,4 %
1 39 32,5 % 50,9 %
2 31 25,8 % 76,7 %
3 16 13,4 % 90,1 %
4 8 6,6 % 96,7 %
5 3 2,5 % 99,2 %
6 1 0,8 % 100,0 %
TOTAL 120 100%
55
3. Si quisiéramos investigar una enfermedad podríamos
estar interesados en establecer el sexo de las personas
afectadas, su edad, profesión, ingresos, hábitos
alimentarios, etc. Todas éstas son características de las
personas enfermas que permiten caracterizar mejor a
quiénes afecta la enfermedad en cuestión. A que clase de
variables correspondería:
4. Si quisiéramos investigar la ocurrencia de tuberculosis en
una ciudad, será interesante determinar, entre otras cosas,
las características relacionadas con el lugar en el que
sucede el evento, como domicilio y zona de residencia de
las personas afectadas. Que variables serìa necesario
estudiar para realizar una responsable investigación.
56
5. La frecuencia de la enfermedad cardiovascular en las mujeres jóvenes
es mucho menor respecto de la de las mujeres mayores de 50 años. Este
patrón de la enfermedad corroborado por diferentes estudios, permitió
observar que su frecuencia aumenta a partir de los 50 años,
probablemente debido a la menopausia y al descenso de los niveles de
estrógenos. Este hallazgo hace suponer la presencia de un efecto
protector de las hormonas sexuales femeninas en el desarrollo de la
enfermedad cardiovascular. Sin embargo, también se podría pensar que
esa diferencia en la frecuencia de la enfermedad podría ser explicada por
otros factores: por ejemplo, las mujeres mayores de 50 años están
habitualmente menos predispuestas a hacer ejercicios físicos, o no tienen
tanto interés en "los kilos de más" y llevan una dieta menos equilibrada,
etc. Todos estos factores están también asociados con una mayor
frecuencia de enfermedad cardiovascular.
• Pensar y resolver:
• Relea el ejemplo anterior, relativo a las enfermedades cardiovasculares
en mujeres mayores de 50 años e indique cuál/es sería/n la/s variable/s
dependiente/s y la/s independiente/s, según las distintas posibilidades
enunciadas.
Sexo
• Al igual que la edad, el sexo es otra variable que se debe considerar.
Casi todas las enfermedades ocurren de forma diferente de acuerdo al
sexo de las personas. Podríamos citar la mayor frecuencia del cáncer
de pulmón en los hombres o del cáncer de mama en las mujeres. A
menudo, encontrará en sus investigaciones variaciones en la
frecuencia de la enfermedad de acuerdo al sexo.
• Sin embargo, siempre debe tener en cuenta que en la mayoría de las
poblaciones los dos sexos también difieren en cuanto a la distribución
por edades. Siempre debe mirar con cuidado las diferencias
encontradas entre las distintas frecuencias de la enfermedad en
estudio de acuerdo al sexo y edad.
58
6. Interprete la siguiente Tabla 1 identificando variaciones en la
distribución de la enfermedad según sexo y edad. Resuma los
hallazgos que considere más importantes.
Tabla 1.
Distribución por sexo y edad de 1 859 casos de Tuberculosis declarados en
la Ciudad (X), durante 2014.
0- 4 5 - 14 15 - 24 25 - 34 35 - 44 45 - 54 55 - 64 65 y
mas
Total 1 859 124 104 208 498 327 262 118 218
(100%) (6,7%) (5,6%) (11,2%) (26,8%) (17,6%) (14,1%) (6,3%) (11,7%)
59
Pensar y resolver
Lea atentamente el caso que se describe a continuación:
• " Dos médicos investigaban la prevalencia de enfermedad coronaria y
los probables factores de riesgo asociados a esta condición en hombres
entre 25 y 65 años de edad de un barrio de la ciudad de Bahía Blanca.
Para ello, entrevistaron personas con enfermedad coronaria e indagaron:
edad, sexo, antecedentes previos de enfermedad coronaria, tabaquismo
(al que clasificaron en leve, moderado y severo de acuerdo a la cantidad
de cigarrillos/día) y a la actividad física practicada por ellos (simplemente
establecieron dos categorías: actividad física presente; actividad física
ausente). Registraron, también, en todos los individuos la presión arterial
y les realizaron un análisis de sangre con el objeto de medir la
concentración sanguínea de colesterol».
Ahora le sugerimos que:
1) Seleccione al menos seis variables.
2) Identifique la variable dependiente.
3) Reconozca las distintas escalas de medición que requieren los distintos
tipos de variables.
GRACIAS POR
TU ATENCION