Sei sulla pagina 1di 40

Curso de Bioestadística I

Mtra. Ma. Del Rocio Taboada Castillo


rox_279@Hotmail.com
1.1 Definición de estadística
• La estadística, es la ciencia que permite la:
• recopilación
• organización
• presentación
• análisis e
• interpretación de datos numéricos

con el fin de realizar una toma de decisión más efectiva.

• “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de


las Ciencias de la Vida donde la variabilidad no es la excepción sino la
regla”.
1.2. Utilidad e importancia de la estadística

Los métodos estadísticos se utilizan para:

» Propósitos descriptivos: para organizar y resumir datos numéricos a través


de gráficas y tablas que presentan medidas descriptivas.

» Estimación de parámetros de una población a partir de una muestra

» Se aplican en:
• Educación » Mercadotecnia
• Organismos políticos » Contabilidad
• Instituciones de salud » Control de calidad
» Estudios de consumidores
• Instituciones de educación
» Análisis de resultados en deportes
• Instituciones políticas

» Con el propósito de tomar de decisiones fundamentadas.


1.4. Conceptos importantes
• Fenómenos determinísticos: Su resultado final es el mismo y por lo tanto se puede
modelar.
Ejemplos:
o Área del cuadrado = Lado * 4
o Área del círculo =  * r2
o Calcular la cantidad de agua para realizar un baño garrapaticida en un
estanque con un área determinada es un fenómeno determinístico.

• Fenómenos aleatorios: Tiene muchos resultados finales.


Ejemplo:
o Peso al nacer (Kg) =  + raza de la madre + edad de la madre + número de
parto + índice nutricio de la madre + error aleatorio.

• Regularidad estadística: Consiste en estudiar un fenómeno aleatorio muchas veces


en condiciones semejantes, la proporción con la que ocurren los diferentes
resultados se estabilizan.
1.4. Conceptos importantes
• Población: Conjunto de todos los elementos que cumplen ciertas propiedades, entre las
cuales se desea estudiar un determinado fenómeno

• Muestra: Es un subconjunto de la población

• La Muestra es representativa de una población cuando cada uno de los elementos que
la forman cumplen ciertas propiedades de la población y de las cuales se estudiara un
determinado fenómeno, ha sido escogido aleatoriamente (al azar).

• Variable: Propiedad o cualidad que presentan los elementos de una población que se
desea estudiar

• Variabilidad

• En una población los individuos o elementos difieren entre sí, es decir, existe cierta
variabilidad entre los diferentes individuos que componen una población
1.4. Conceptos importantes

• Muestra aleatoria: Es aquella en la que todos los individuos de la población tienen


la misma probabilidad de ser seleccionados.

Una muestra aleatoria permite estimar características de la población.

• Parámetros: Son valores numéricos que caracterizan a la población .

• Estadística o estadístico: Es una función numérica de los datos, basado en el


calculo de los datos de la muestra. Las estadísticas sirven a nivel descriptivo para,
para resumir información de un conjunto de datos, y a nivel inferencial, para
estimar parámetros.
Proceso de análisis estadística
Estadísticos

Gráficas

Cuadros
resumen
índices
indicadores
Resultados
** fácil de
Información
cualitativa interpretar **
proceso

Información validada,
estandarizada

http://www.respyn.uanl.mx/iv/1/ensayos/bioestadistica.html
1.5 Tipos de variable y Escalas de Medición.

• Variable

• Es una característica medible o contable en las unidades de estudio.

• Propiedad de interés, que se presenta en diferentes modalidades en


la población en estudio.

• Es una característica que toma valores distintos que cambian de un


individuo a otro.
1.5 Tipos de variable y Escalas de Medición.
•Tipos de variable

• Variable Cualitativa, describen


cualidades de los individuos.

• Variable Cuantitativa, describen


cantidades de la característica.
1.5 Tipos de variable y Escalas de Medición.

• Valores que toma la variable

• Discreta, Identifican modalidades (categorías) que cambian de unidad


en unidad y no existen puntos intermedios. La variable bajo estudio es
contable.

• Continua, Identifica modalidades que cambian de un objeto a otro en


forma ininterrumpida, es decir entre dos valores hay un sin número de
valores intermedios. La variable bajo estudio es medible.
1.5 Tipos de variable y Escalas de Medición.

• Medir!!!

• Significa tipificar, etiquetar, clasificar en diferentes modalidades.

• Cuantificar a las diferentes formas con que se presenta una variable.

• Medir consiste en asignar números o nombres a las modalidades con que


se presentan las características los fenómenos naturales.
1.5 Tipos de variable y Escalas de Medición.

• Escalas de medición

•En la investigación es fundamental definir cuales son las características


(variables) a estudiar.

•Los procedimientos de medición que se emplearan para conocerlos.

•Los diferentes procedimientos de medición para una característica pueden


llevarnos a distintos resultados.

De aquí la importancia de conocer los niveles de medición


1.5 Tipos de variable y Escalas de Medición.

• Escalas de medición
Hay varias formas de medir las características de los fenómenos
aleatorios y se les llaman Escalas de medición.

» Nominal
» Ordinal
» Absoluta
» Intervalo
» Razón
¿Qué características se identifican en las 2 variables?

1.Distribución según estado civil


1. Casado 224
2.Distribución por sexo
2. Soltero 39
1. Hombres 109
3. Unión libre 125
4. Viudo 18 2. Mujeres 88
5. Divorciado 22
Escala Nominal
• Categorías diferentes.

• Las categorías son mutuamente excluyentes.*

• La identificación se pueden usar nombres, letras o números, son


intercambiables sin alterar la información.

• No tiene sentido realizar operaciones aritméticas

• Pueden emplearse las estadísticas descriptivas como frecuencia y moda.

• El medir con una escala nominal es el nivel mínimo de medición.

* Dados 2 eventos cualesquiera se dice que son mutuamente excluyentes si y solo si la intersección de los 2 conjuntos es el conjunto vacío.
Y aquí, ¿Qué tenemos?
¿Qué características se identifican en las
variables?
Distribución de la condición económica de los habitantes de un municipio X

1. Mala 2. Regular 3. Buena 4. Muy Buena 5. Excelente

20 35 50 44 21

Distribución del Índice de Masa


Corporal
Normal 150
Sobrepeso 250

Obesidad 100
Escala Ordinal
• Al igual que en la escala nominal se determina la pertenencia de las unidades a
categorías.

• Las categorías guardan un orden.

• Las categorías que se forman deben ser mutuamente excluyentes, estas categorías
presentan un orden

• Se utilizan nombres o números para identificar las categorías, tomando en cuenta el


orden que se les ha asignado.

• No se debe hacer operaciones aritméticas con ellos.

• Se pueden calcular la frecuencia de cada categoría, la mediana y la moda.


Distribución de la temperatura en regiones
Regiones Centígrados °C Fahrenheit °F
1 38 100.4
2 38.5 101.3
3 39 102.2

Distribución de la estatura de los niños


de la primaria “Morelos”
Regiones Estatura
1 50
2 38.5
3 45
4 80

N alumnos 90
Escala de Intervalo
• Cuantificar el cambio de intensidad de una modalidad a otra, es decir, la distancia
entre dos medidas cualesquiera, pero no la magnitud de la intensidad.

• Asignan números a las modalidades pero estos no representan la magnitud, solo


sirven para evaluar cambios de intensidad

• El cero y la unidad de medida son arbitrarios que se eligen en base en conveniencias


práctica.
• Se pueden realizar sumas o restas con los números, no tiene sentido la división entre
dos números o modalidades pero si la diferencia.

• Pueden obtenerse todas las estadísticas paramétricas (media, desviación estándar,


coeficiente de variación, etc.).
Distribución del peso de niños al nacer (gramos)

3102 3114 4114 4124

3102 1597 3115 2104

3105 2818 3815 1997

3113 2918 2210 3786

2100 3598 1114 3518


Escala de Razón
• Las modalidades representan cambios graduales en la intensidad de la
característica.

• Existe un estado donde la característica no existe, se denota con el


número cero.

• En esta escala el cero es fijo, la unidad de medida es arbitraria.

• Existe un orden en las diferentes modalidades de la característica.

• Se puede establecer relación de razón entre las magnitudes de las


modalidades.

• Se puede realizar cualquier operación aritmética.


Escala Absoluta

Numero de crisis asmática, mensual

3 35 20 1
8 5 27 0
2 8 5 28
20 3 9 14
12 11 30 7
Escala Absoluta

• Cuando la característica que se mide corresponde a un conteo se utiliza la


escala absoluta.

• Se asigna números enteros positivos, incluyendo al cero, a las unidades de la


característica estudiada.

• El cero es fijo y la unidad de medida es fija.

• Se pueden establecer relaciones de razón entre las magnitudes de las


modalidades.

• Se pueden realizar cualquier operación aritmética.


1. Ejercicio 1: Identificar el tipo de variable y la escala
de medición; en el ámbito estadístico

A partir de los datos capturados de tus compañeros:

• Identifica el tipo de variable, la escala, el valor que toma, etc.


Nombre de la Tipo de variable Escala de medición Valor que toma Descripción
variable

En STATA:
• Identificar el tipo de variable que maneja el software , así como los valores
que se manejan en las variables numéricas.
Clasificación de la estadística

• Descriptiva:
• Frecuencias
• Medidas de tendencia central
media
mediana
moda
• Medidas de dispersión
varianza
desviación estándar
Rango
» Grafica

𝒙
𝒔ො
• Inferencial: 𝒓ො
• Pruebas de hipótesis 𝝁
• Intervalos de Confianza 𝝈
• Modelación 𝝆
Estadística Descriptiva
2.1 Distribución de frecuencias.

• Es una tabla que divide los valores de los datos en clases o grupos e
indica la cantidad de valores observados que se encuentran en cada
clase.
• Ventaja: Se comprende con rapidez y se interpreta con facilidad

Clases
2.1 ¿Cómo se interpreta?

Se realiza un estudio con 40 personas para conocer la reacción sistémica a la


picadura de una abeja. Se toma el tiempo en minutos, en el que aparecen las
primeras reacciones a la picadura.

Frecuencia Frecuencia Frecuencia


Clase Frec abs Frec relativa
% acum acum %
3.75 - 5.95 2 0.05 5 0.05 5
5.95 - 8.15 4 0.10 10 0.15 15
8.15 - 10.35 10 0.25 25 0.40 40

10.35 - 12.55 16 0.40 40 0.80 80


12.55 - 14.75 6 0.15 15 0.95 95
14.75 - 16.95 2 0.05 5 1 100

Total 40 1 100
hist tiempo, start(0) width(2.2)
2.1 ¿Cómo se interpreta?

hist tiempo,percent

40
30
Percent

20
10
0
5 10 15
tiempo

Ejercicio 2:Práctica en Excel


age freq

0 28
2.1 Otro ejemplo [http://www.stata-journal.com/sjpdf.html?articlenum=gr0003] pag69

5 46
10 58
16 20
density hist age, start(0) width(5)
17 31 0.080
0.070

.08
18 64 0.060
0.050
20 149

.06
0.040
0.030
25 316

Density
0.020

.04
60 103
0.010
0.000
[0-5) (5-10) [10-15) [15-20) (20-25) [25-30) [60 y
80 más]

.02
0
0 20 40 60
age
2.1 Tablas cruzadas o de contingencia
Variable 2

c1 c2 c3 …. cn
𝑛
r1 x11 x12 x13 x1n ෍ 𝒙1𝑛
𝑖=1
Variable 1

𝑛
r2 x21 x22 x23 x2n ෍ 𝒙2𝑛
𝑖=1
𝑛
r3 x31 x32 x33 x3n ෍ 𝒙3𝑛
𝑖=1


𝑛
rm xm1 xm2 xm3 xmn ෍ 𝒙𝑚𝑛
𝑖=1
𝑚 𝑚 𝑚 𝑚
෍ 𝒙𝑚1 ෍ 𝒙𝑚2 ෍ 𝒙𝑚3 ෍ 𝒙𝑚𝑛
𝑗=1 𝑗=1 𝑗=1 𝑗=1

Marginales
2.1 Tablas cruzadas o de contingencia

Escolaridad

hombre mujer Total hombre mujer Total hombre mujer Total


No. No. No. % % % % % %

Ninguna o básica 21881.2 24099.4 45980.6 70.5 69.4 70 47.6 52.4 100
Media superior 4987.1 6648.0 11635.1 16.1 19.2 17.7 42.9 57.1 100
Superior o posgrado 4152.4 3962.3 8114.6 13.4 11.4 12.3 51.2 48.8 100
Total 31020.7 34709.7 65730.4 100 100 100 47.19 52.8 100

Índice de Masa Corporal


hombre mujer Total hombre mujer Total hombre mujer Total
No. No. No. % % % % % %

Normal 11140.9 8937.6 20078.5 36.8 27 31.7 55.5 44.5 100


Sobrepeso 11680.8 11328.0 23008.9 38.6 34.2 36.3 50.8 49.2 100
Obesidad 7443.6 12877.8 20321.4 24.6 38.9 32 36.6 63.4 100
Total 30265.4 33143.4 63408.8 100 100 100 47.7 52.3 100
2.2 Medidas de tendencia Central

• Media aritmética (media): Es la suma de todas las observaciones, dividida entre


El mejor
el número de datos estimador

Media muestral Media poblacional


𝑥 𝑥𝑖
𝑥ҧ = σ𝑛𝑖=1 𝑛𝑖 𝜇 = σ𝑁 𝑖=1 𝑁

• Mediana: Es el valor que se ubica exactamente a la mitad de los datos ordenados


siempre y cuando el numero de datos es impar. Pero cuando el número de datos
es par el valor de la mediana corresponde al promedio de las dos observaciones
centrales con datos ordenados.

• Moda: Se define como el valor que ocurre con mayor frecuencia, pico de la
campana formada a partir del histograma de frecuencias
Campana

con sesgo a la derecha exacta con sesgo a la izquierda

Moda Media Moda Media Moda


Mediana Mediana
Media Mediana

con sesgo a la derecha simétrica con sesgo a la izquierda

Distribución de datos
2.2 Medidas de tendencia Central
• Media ponderada: La media aritmética le da el mismo peso a cada una de las
observaciones, lo cual no siempre es lo más adecuado. La media ponderada permite darle
más peso a algunas observaciones que a otras.

σ𝑛𝑖=1 𝑤𝑖 𝑥𝑖
𝑥ҧ𝑝 =
σ𝑛𝑖=1 𝑤𝑖

donde wi es el ponderador de la i-ésima observación y Xi la observación i-ésima

• Ejemplo: En una materia dada se asignan pesos de importancia, de la siguiente forma:


Unida I (20% del curso), Unidad II (25% del curso), Unidad III (20% del curso), Unidad IV
(15% de la calificación), Unidad V (20% de la calificación ). Si las calificaciones de un alumno
son 8 en la primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta unidad
y 8 en la última unidad. Es decir, se tienen la siguiente tabla:
Unidad Ponderacion (Wi) Datos (Wi) 𝟖 𝟎. 𝟐 + 𝟓 𝟎. 𝟑𝟓 + 𝟖 𝟎. 𝟐 + 𝟏𝟎 𝟎. 𝟏𝟓 + 𝟖(𝟎. 𝟏) 𝟕. 𝟐𝟓
ഥ𝒑 =
𝒙 = = 𝟕. 𝟐𝟓
I 20% = 0.2 8 𝟎. 𝟐 + 𝟎. 𝟑𝟓 + 𝟎. 𝟐 + 𝟎. 𝟏𝟓 + 𝟎. 𝟏𝟎 𝟏. 𝟎
II 25% = 0.35 5
III 20% = 0.2 8
IV 15% = 0.15 10
V 20% = 0.10 8
2.2 Medidas de Localización: Cuantiles
Los CUANTILES separan a los datos ya ordenados en grupos de igual tamaño. Existen
varios tipos de cuantiles de los cuales los percentiles, deciles y cuartiles son de los más
comunes por su uso.

• Los percentiles dividen la cantidad total de los datos en 100 partes del mismo tamaño
y cada una abarca el 1% de las observaciones. La mediana marca el 50° percentil.

• Los deciles dividen la cantidad total de los datos en 10 partes iguales y cada una
comprende el 10% de las observaciones. La mediana describe el 5° decil.

• Los cuartiles dividen la cantidad total de los datos en cuatro partes del mismo tamaño
y cada una comprende el 25% de la observaciones. La mediana marca el segundo
cuartil, debajo del cual cae el 50% de los valores.
2.2 Medidas de Localización: Cuartiles

• Los Cuartiles

𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑞𝑢𝑒 𝑠𝑒 𝑛+1


𝑷𝒓𝒊𝒎𝒆𝒓 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 = 𝑸𝟏 =
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 4

𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑞𝑢𝑒 𝑠𝑒 2 𝑛+1


𝑺𝒆𝒈𝒖𝒏𝒅𝒐 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 = 𝑸𝟐 =
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 4

𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑑𝑎𝑡𝑜 𝑞𝑢𝑒 𝑠𝑒 3 𝑛+1


𝑺𝒆𝒈𝒖𝒏𝒅𝒐 𝒄𝒖𝒂𝒓𝒕𝒊𝒍 = 𝑸𝟑 =
𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 4

Q3−Q1
𝑫𝒆𝒔𝒗𝒊𝒂𝒄𝒊ó𝒏 𝒅𝒆 𝒍𝒐𝒔 𝒄𝒖𝒂𝒓𝒕𝒊𝒍𝒆𝒔 =
2

25% de 𝑹𝒂𝒏𝒈𝒐 𝒊𝒏𝒕𝒆𝒓𝒄𝒖𝒂𝒓𝒕𝒊𝒍 = Q3−Q1


los
valores 25% de
los
valores
25% de los valores
25% de los valores

0 10 20 30 40 50 60 70 80

Q1 Q2 Q3
2.2 Medidas de Dispersión

• Varianza: es el promedio del cuadrado de las desviaciones de las observaciones,


a la media. Por lo que la medida obtenida tiene unidades cuadradas.
El mejor
estimador

Varianza muestral Varianza poblacional

σ𝒏 𝒙 𝟐
𝒊=𝟏 𝒙𝒊 −ഥ σ𝒏 𝒙 𝟐
𝒊=𝟏 𝒙𝒊 −ഥ
𝒔ො 𝟐 = ෝ𝟐
𝝈 = 𝒔𝟐 = 𝝈𝟐 =
𝒏−𝟏 𝒏−𝟏

• Desviación estándar: se define como la raíz cuadrada de la varianza, y a


diferencia de la varianza esta da una medida en unidades originales. La ventaja
de esto es que se puede determinar cuántas observaciones están a 1 desviación
estándar de la media, a 2 desviaciones estándares de la media, etc.

σ𝒏𝒊=𝟏 𝒙𝒊 − 𝒙
ഥ 𝟐
𝒔ො = 𝝈
ෝ=
𝒏−𝟏
2.2 Medidas de Dispersión
• Rango: se define como la diferencia entre la medida mayor y la menor. Por lo tanto, nos
informa qué tantos valores abarcan los datos.

𝑹 = 𝐦𝐚𝐱 𝒗𝒂𝒍𝒐𝒓 − 𝐦𝐢𝐧(𝒗𝒂𝒍𝒐𝒓)

• Coeficiente de variación: es la relación entre la desviación típica (estándar) de una muestra y su


media. Y suele expresarse en porcentajes
𝒔ො
𝑪𝑽 = ഥ𝒙*100

El coeficiente de variación permite comparar las dispersiones de dos distribuciones


distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan
entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.


Ejercicio 3: ¡Explora!

Ejemplo: Los siguientes datos muestran el registro de ventas (en miles de


pesos), de 20 farmacias en la Ciudad de México y zona metropolitana:

99.8 42.9 44.2 31.7 88.2 35.6 25.1


40.2 26.9 32.3 36.8 37.8 5.6 39.7
29.3 28.9 55.2 45.2 25.4 50.6

• Calcule medidas de tendencia central. Interprete


• Calcule medidas de dispersión. ¿Son las ventas muy variables respecto a
lo normal?
• Que porcentaje de farmacias aproximadamente venden entre 12.9 M$ y
46.8M$.

Potrebbero piacerti anche