Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Bioestadística
Mientras que, para una investigación de tipo experimental, se emplean las técnicas
estadísticas de la estadística inferencial, la cuales se dividen en técnicas paramétricas y no
paramétricas.
¿Qué es la probabilidad?
Toda variable aleatoria tiene o posee una distribución de probabilidad que describe su
comportamiento, la distribución de probabilidad permite determinar las probabilidades
correspondientes con subintervalos de valores.
Esto es lo que llamaríamos a una distribución de probabilidad para la suma de dos dados.
Observe su simetría es idéntica tanto para la izquierda como a la derecha de la barra central
con el valor de 7 como centro, si trazamos una línea que toque el punto máximo de cada
barra se obtiene lo siguiente figura.
Esta figura recibe el nombre de campana de Gauss, y puede cambiar si se varia la media
aritmética y la varianza o su desviación estándar.
Es el juego de las canicas que son lanzadas desde la parte de arriba se agrupan formando una campana.
Este teorema estipula que, si tomamos muchas muestras de tamaño “n”, de una población,
que siga una distribución, con una media y varianza finitas, entonces:
σ
2. La desviación estándar de una distribución de las medias se aproximará a
√n
(desviación estándar de la población entre la raíz del número de muestras.
DEFINICIONES
¿Qué es un parámetro?
¿Qué es un estadístico?
Es una regla o formula aplicada a una muestra para determinar el valor de un parámetro
poblacional.
Tipos de estimación
La estimación puntual consiste en utilizar una formula o regla para calcular el parámetro
poblacional con los valores de la muestra. es decir, un estadístico muestral (media
aritmética, varianza, etc.) que se emplea para calcular parámetros (media poblacional,
varianza poblacional, etc.)
La estimación por intervalos consiste en calcular un rango de valores en los que se espera,
con cierto valor de nivel de confianza que se encuentre contenido en el intervalo el
parámetro poblacional.
Supongamos que tenemos una población de N = 5 niños y que nuestras muestras son de
tamaño n = 2. Es claro que para un problema de este tamaño simplemente tomamos las
alturas de los cinco niños, las sumamos, dividimos por cinco y se acabó.
Pero el objeto de este análisis es sólo el de entender algunos aspectos importantes del
problema original a través de este ejemplo. La siguiente tabla muestra las alturas de los
cinco niños:
1.20+1.18+1.32+1.23+1.285
μ= =1.242
5
( 1.2-1.242
σ=
√ ¿2 +(1.18-1.242)2 +(1.32−1.242)2 +(1.23−1.242)2 +(1.285−1.242)2 ¿=0.05154
5
Ahora cuantas muestras se pueden formar con esa población de 5 niños tomando dos a la
vez sin repetición.
{52}= 2 !( 5!−2
5!
!)
=
5 x 4 x 3 x 2 x 1 5 x 4 x 3 x 2 x 1 120
2 x 1(3 !)
= =
2 x 1(3 x 2 x 1) 2(6)
=10 muestras posibles1.
1 Se lee como numero factorial, en el ejemplo 5!, se lee como cinco Factorial y es la multiplicación sucesiva del cinco hasta el 1, 5x4x3x2x1= 120
Lógicamente, para cada una de estas muestras tenemos una media ^x diferente.
1.2+1.18
Para la muestra uno compuesta de {1,2}, su media es ^x = =1.19 00
2
1.2+1.32
Para la muestra dos compuesta de {1,3}, su media es ^x = =1.26 00
2
1.32+1.28
Para la muestra nueve compuesta de {3,5} su media es ^x = =1.300
2
1.23+ 1.28
Para la muestra diez compuesta de {4,5} su media es ^x = =1.2550
2
μx =
∑ ^x = 12.42 =1.242
∑ n 10
Observe hasta aquí se cumple el primer punto del teorema del límite central.
Ahora calculemos el error estándar de la distribución de medias, el cual mide nuestro grado
de incertidumbre respecto a la capacidad de la media muestral para estimar la media
poblacional.
Para la distribución de media el error muestra bien dado por muestra medias medias
2
^x ^x 2
^x 1 1.1900 1.4116
x^ 2 1.2600 1.5876
3 1.2150 1.4762
∑¿ 4 1.2400 1.5376
¿ 5 1.2500 1.5625
¿2 6 1.2050 1.4520
∑ ¿−¿ 7
8
1.2300
1.2750
1..5129
1.6256
n¿ 9 1.3000 1.6900
¿ 10 1.2550 1.5750
σ x=√¿ Total 12.4200 15.4356
sustituyendo
12.4200
¿
¿
¿2
¿
10 ( 15.4356 )−¿
¿
σ x=√¿
En resumen, nos dice que, la media de la distribución muestral siempre coincide con la
media de la población y que el error estándar de la media es siempre menor que la
desviación estándar de la población.
σ x=
σ
√ n√∗
N −n 0.05154
N −1
=
√ 2
∗
√
5−2 0.05154
5−1
=
√ 2
3
√
∗ =0.03156
4
σ
2. La desviación estándar de una distribución de las medias se aproximará a
√n
(desviación estándar de la población entre la raíz del número de muestras).
En conclusión
La importancia del teorema del límite central es que nos permite, emplear valores de las
muestras, para hacer inferencias, para conocer los valores o parámetros de la población, sin
conocer la forma de la distribución de frecuencias.
Referencias
La gráfica de la distribución normal tiene la forma de una campana, por este motivo también
es conocida como la campana de Gauss.
La tabla de la distribución normal presenta los valores de probabilidad para una variable
estándar Z, con media igual a 0 y varianza igual a 1.
Dada una variable de media μ y desviación típica σ, se denomina valor tipificado z, de una
observación x, a la distancia (con signo) con respecto a la media, medido en desviaciones
típicas, observe la figura
x−μ
Z=
σ
Ejemplo.
30−25
Z= =1.29
3.86
Este valor de Z nos dice que la edad de 30 años está a 1,29 desviaciones estándar sobre el
promedio.
Ahora bien, la tabla de la distribución normal, entrega valores de probabilidad para los
distintos valores de Z.
Características
En la primera columna de la tabla aparece el entero y primer decimal del valor de Z, vemos
que los valores van desde -3,4 a 3,3. (Véase Tabla en la página siguiente).
Para encontrar el valor de Z = 1,96 buscaremos 1,9 en la primera columna de la tabla y 0,06
en la primera fila de la tabla. Trazaremos líneas, perpendiculares desde esos valores y
llegaremos a un número en el cuerpo de la tabla (véase la tabla más abajo, que tiene
marcadas las dos perpendiculares de las que hablamos. El número que encontramos y que
está destacado es: 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el valor Z = 1,29 tiene una
probabilidad asociada de 0,9014. Entonces, la probabilidad P(x<30) de encontrar una
persona con edad de 30 años o menos, en este grupo humano, es 0,9014 o 90.14%.
15 20 17.5 25 25.5 30 35
Suponga que la longitud de las fresas de un huerto está distribuida normalmente con una µ=
3.2 cm y una σ = 1.8 cm ¿Cuál es la probabilidad de que una fresa de esta población,
seleccionada al azar, tenga las medidas siguientes? a) Mas de 4.5 cm, b) Mayor a 1.78 cm,
c) Entre 2.9 y 3.6 cm
Solución
Calculando
x−μ 4.5−3.2 1.3
Z= , Z= = =0.7222
σ 1.8 1.8
Los valores mayores a 4.5 están representados por el área sombreada. Por lo tanto, el valor
encontrado de Z = 0.72, es el área no sombreada con valor en tabla de 0.7642 o 76.42 %,
por lo tanto, hay que restar 1 para determinar el área sombreada.3
Probabilidad de que la fresa sea mayor a 4.5 cm, P (x > 4.5) está dada por
Calculando
3 Recuerda que toda el área bajo la curva vale 1, sacamos complementos restando.
Los valores mayores a 1.78 cm están representados por el área sombreada. Por lo tanto, el
valor encontrado de z = -0.79, es el área no sombreada con valor de tabla de 0.2147 o
21.47%, por lo tanto, hay que restar 1 para determinar el área sombreada.
Probabilidad de que la fresa sea mayor a 1.78 cm, P (x > 1.78) está dada por
Los valores entre 2.9 y 3.6 cm están representados por el área sombreada.
Por lo tanto, el valor encontrado de z = -0.17, es el área no sombreada “1”, con valor en
tabla de 0.4325 o 43.25%. y.
Por lo tanto, hay que restar el área mayor, (no sombreada “1”, y sombreada), menos el área
menor (no sombreada “1”), para encontrar el área sombreada.
Probabilidad de que la fresa este entre 2.9 y 3.6 cm, es P (2.9 < x < 3.6) está dada por
Ejemplo 2
Las longitudes de las sardinas que recibe una enlatadora tiene una media de 11.5 cm y una
desviación estándar de 1.3 cm.
Solución.
a) Menos de 10 cm.
Calculando
Redondeando 1.15
10
Por lo tanto, el valor encontrado de z = -1.15, es el área sombreada con valor en tabla de
0.1250 o 12.50%, por lo tanto.
Calculando
x−μ 10.5−11.5 −1
Z= , Z= = =−0.7692
σ 1.3 1.3
x−μ 12.5−11.5 1
Z= , Z= = =0.7692
σ 1.3 1.3
10.5 12.5
Los valores entre 10.5 y 12.5 cm están representados por el área sombreada.
Por lo tanto, el valor encontrado de Z = -0.77, es el área no sombreada “1”, con valor en
tabla de 0.2206 o 22.06%. y.
Para el valor de Z = 0.77 corresponde a las áreas no sombreada “1”, y el área sombreada
con un valor en tabla de 0.7793.
Por lo tanto, hay que restar el área mayor (no sombreada “1”, y sombreada), menos el área
menor (no sombreada “1”), para encontrar el área sombreada.
Probabilidad de que la sardina este entre 10.5 y 12.5 cm, es P (10.5 < x < 12.5) está dada
por
c) Las sardinas de mayor longitud representan el 10% ¿cuánto miden las sardinas?
Cuando en un problema nos dan la probabilidad, se emplea la tabla de distribución norma a
la inversa.
11.5 ?
El enunciado dice que 10% de las sardinas son las mas grandes que corresponden al
extremo superior derecho de la campana de Gauss.
Por lo tanto 100% - 10% = 90% que es el área no sombreada y corresponde al valor de Z
buscado, Z = 90%, solo se divide entre 100 y nos da Z= 0.90
Se aprecia que esta entre 1.28 y 1.29, para no alterar mucho el resultado empleamos el
valor mas cercano a 0.90 que corresponde al valor de 0.8997 y que esta dado por el Valor
de Z= 1.28.
Sustituyendo en la formula valores de µ=11.5, σ= 1.3 y Z=1.28
x−μ x−11.5
Z= , 1.28=
σ 1.3
Despejando x
x=zσ + μ ,
x=( 1.25∗1.3 )+ 11.5
x=1.664+11.5
x=13.2 cm
La inferencia estadística toma como base la muestra, con la finalidad de poder conocer
cómo se comporta la población.
Véase la figura
Es decir, otra forma de hacer inferencia es haciendo una afirmación acerca del valor que el
parámetro de la población bajo estudio, esta afirmación, puede estar basada en alguna
creencia o experiencia pasada que será contrastada con la evidencia que nosotros
obtengamos a través de la información contenida en la muestra.
Este proceso consiste en determinar la validez de una aseveración hecha sobre la población
basándose en evidencia muestral.
Definición de Hipótesis
Una hipótesis se define como una afirmación transitoria que debe ser sometida a prueba.
Es una afirmación sobre la población, por lo tanto, se expresa en términos de los parámetros
poblacionales.
La hipótesis nula se denota por (Ho) es el valor hipotético del parámetro que se compara con
el resultado muestral, es la que se somete a prueba y sobre ella se hace la decisión, para
los propósitos de la prueba se asume como verdadera, después del análisis, será rechaza, ó
no será rechaza.
Rechazar Ho significa que los datos muestrales brindan suficiente evidencia como para
pensar que lo planteado por la hipótesis nula, es estadísticamente irrealizable a un nivel de
significancia dado.
Ejemplo 3
En una fábrica de jugos el contenido de las latas, que se producen es de 330ml. Al momento
de despachar el producto, el fabricante debe garantizar, que ese es el contenido, que lleva
cada lata.
Obviamente la media, µ = 330 ml, y es la cantidad de jugo que debe tener toda la
producción.
H1: µ ≠ 330, es lo contrario de Ho, no todas las latas de jugo tienen 330 ml
Ejemplo 4
Se realiza un estudio sobre cierta conserva, y se promedia que tiene una duración de 6
meses, de vida útil o más, mientras que una muestra, estudiada demostró que lo máximo
son 6 meses de duración de su vida útil.
Ho: µ ≥ 6, se estima que la conserva de la población tiene una vida útil de 6 meses o mas
H1: µ < 6 la vida útil de la conserva en menor a 6 meses.
Ho: µA = µB
H1: µA ≠ µB
Ho: µA ≤ µB
H1: µA > µB
Ho: µA ≥ µB
H1: µA < µB
Esta probabilidad indica que tan grande, o que tan baja debe ser la diferencia entre lo
planteado por la hipótesis nula, para que esta sea rechazada o sea correcta.
El nivel de confianza para pruebas unilaterales se realiza por lo general, al 95%, por lo tanto,
el nivel de significancia o nivel de riesgo será 5%.
No Rechazo
El nivel de confianza para pruebas bilaterales se realiza con 90% el nivel de confianza o
nivel de riesgo será 10%.
No Rechazo
Rechazo Rechazo
α =0.10
Para poder saber si la hipótesis Nula es falsa o verdadera se necesita, obtener un valor que
nos permita evaluar la respuesta, este valor es denominado estadístico de prueba.
Para realizar esta etapa, debemos utilizar el instrumento apropiado, debiendo considerar la
distribución muestral apropiada bajo las siguientes condiciones:
D́−μ D
t=
SD , GL=n1−1 Grados de libertad
√n
y si se trabaja con proporciones emplearemos la distribución normal para proporciones con
la siguiente formula:
Ṕ−p
Z=
√Ṕ∗p
n
Paso 4. Calcular el valor estadístico para poder tomar una decisión, denominado
punto crítico.
Este paso solo hay que ubicar en la campana de gauss, el valor de la significancia,
consultando la tabla de la distribución, elegida en el paso 2.
Ejemplo 5
Calcular el punto crítico, con una significancia α = 5%, unilateral lado izquierdo emplea la
distribución normal.
Punto
Solución critico
Dibujando se tiene
Calcular el punto crítico, con una significancia α = 5%, unilateral lado derecho, emplea la
distribución normal.
Dibujando se tiene
Punto
Observe que el punto crítico se ubica en el extremo critico
derecho por lo que hay que emplear un
complemento, antes de usar la tabla de distribución
normal, si el valor de la significancia es 5%
α = 0.05
Z será 1 - 0.05 = 0.95, buscando este valor en tabla 1.64
z = 0.95 = 1.64
Ejemplo 7
Dibujando se tiene
5
α = =2.5 .
2
Por lo tanto
α = 0.025 α = 0.025
-1.96 1.96
α 1=2.5 = 0.025
α 2=2.5 = 0.025
Por ultimo comparamos el valor de Z del paso 3, en la campana de gauss, ubicando en que
lugar caes y tomamos una decisión de acuerdo si caen el la zona de rechazo o zona de no
rechazo del
Ejemplo 8
Una empresa que produce granos precocidos afirma que el promedio de precocción se da a
los 180 segundos, con una desviación estándar de medio minuto, el departamento de
control de calidad tomo una muestra de 50 bolsas de granos estableciendo que el nivel de
precocción obtenido se da a los 165 segundo, con un nivel de significancia de 5%, ¿es
correcta la afirmación dicha por el departamento de calidad de que la precocción es menor a
180 segundo
Solución
X́−μ ´
165−180 −15
Z= Z= ,Z= , z=−3.5355
σ , 30 4.2426
√n √ 50
Paso 4. Calcular el valor estadístico para poder tomar una decisión, denominado
punto crítico.
Con α = 0.05, cota derecha significa que buscaremos en la tabla Z = 1- 0.05 = 0.95 que da el
valor de 1.64.
Dibujando
Zona de no
rechazo
Zona de
rechazo
-3.5355 1.64
Ejemplo 9
Solución
Con α = 0.05 cota bilateral significa que buscaremos 2 valores para Z = 0.05/2 = 0.025, en la
tabla Z1=0.025 y Z2 = 1 - 0.025 = 0975, buscando estos valores en la Tabla Z se tiene.
Dibujando
Zona de no
Zona de Zona de
rechazo
rechazo rechazo
-1.96 5.6218
1.96
∑ ( x i− x́ )2
S 2= i=1
n−1
Los grados de libertad es igual al número de mediciones -1. GL = (n-1), la cual resulta del
hecho de que si s2, está basada en n cantidades de datos “x” menos la media x́ ,
x 1−x́ , x 2−x́ , x 3−x́ …… x n−x́ , estas sumaran cero, así que especificar los
valores de cualquier n-1 de las cantidades determina el valor restante.
La tabla t de Student, se compone del siguiente arreglo en la parte superior izquierda existe
un recuadro con una diagonal, el símbolo α representa la probabilidad que se desea busca
restas van desde 25%= 0.25 a hasta 0.05% = 0.0005, existe muchas variedades de la tabla t
pero todas se emplean de la misma forma, solo varia la probabilidad buscada.
Así mismo el símbolo “r” representa los grados de libertad buscado también se representa
por GL.
Ejemplo 10
0.05
Calcular el valor de t7 la expresión indica que se tiene una probabilidad α de 0.05 y 7
grados de libertad,
Ejemplo 11
Solución
X́−μ 62−60 2
t= t= ,t = , t =0.1724
σ , 58 11.6
√n √25
Paso 4. Calcular el valor estadístico para poder tomar una decisión, denominado
punto crítico.
Con α = 0.05 cota unilateral derecha, y con grado de libertad Gl = n-1 = 25 -1 = 24 buscando
estos valores en la Tabla t se tiene.
Dibujando
Punto critico
Zona de no
rechazo Zona de
rechazo
0 0.1724
Se concluye con no rechazar la Hipótesis Nula, las plantas no requieren de fertilizante para
producir más de 60 gr de tomate
Referencias
Luis C. (2013). Manual Práctico de estadística para las ciencias de la salud. México:
Trillas.
03 Distribución Normal N(0,1) fecha de consulta 27/04/2018 disponible en
https://www.youtube.com/watch?v=97EI9mS0WS8