Sei sulla pagina 1di 22

INDICE

1. MUESTREO ALEATORIO ........................................................................................... 1


1.1. Población y Parámetros ........................................................................................... 1
1.2. Muestra aleatoria ...................................................................................................... 1
1.3. Estadísticas............................................................................................................... 2
2. DISTRIBUCIONES MUESTRALES ............................................................................. 2
2.1. Distribución muestral de la media (𝑿) ..................................................................... 2
2.2. Distribución muestral de la diferencia de dos medias con varianzas poblacionales
conocidas: ........................................................................................................................... 3
2.3. Distribución muestral de la diferencia de dos medias con varianzas poblacionales
desconocidas ....................................................................................................................... 6
2.4. Distribución muestral de la proporción ................................................................... 8
2.5. Distribución muestral de diferencia de proporciones ........................................... 12
2.6. Distribución muestral de la varianza y la desviación estándar .............................. 15
2.7. Distribución muestral del cociente de varianzas muestrales ................................. 17

DISTRIBUCIONES MUESTRALES

1. MUESTREO ALEATORIO
1.1. Población y Parámetros
POBLACIÓN: Se denomina población o universo a la totalidad de personas u objetos que
tienen una o más características medibles o contables de naturaleza cualitativa o
cuantitativa.
PARÁMETROS: Se denominan parámetros a las medidas descriptivas que caracterizan a
la distribución de la población.
Entre otros, los parámetros poblacionales son:
 Media : µ
 Proporción : π o р
 Varianza : σ2
 Desviación estándar: σ

1.2. Muestra aleatoria


Una muestra es un subconjunto de la población. El proceso de selección de una muestra de
n elementos de la población se llama muestreo.
El muestreo aleatorio es todo proceso que asegure en cualquier momento igual probabilidad
de ser incluidos en la muestra a todos los elementos que pertenezcan a la población en
dicho momento.
1.3. Estadísticas
Se denomina estadística a cualquier función de las variables aleatorias que constituyen la
muestra. Una estadística es una variable aleatoria y = H (x1, x2,…, xn)
Algunas estadísticas importantes y sus valores calculados a partir de una muestra aleatoria
son:
1
a) La media muestral: 𝑋̅ = ∑𝑛𝑖=1 𝑋𝑖
𝑛
1
b) La varianza muestral: 𝑆 2 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2
𝑛
c) La desviación estándar muestral: 𝑆 = √𝑆 2
1
d) La proporción muestral (porcentaje de éxitos en la muestra) : 𝑃̂ 𝑜 𝑃̅ = 𝑛 ∑𝑛𝑖=1 𝑋𝑖 ,
donde 𝑋𝑖 ~ 𝐵(1, 𝑝) (el parámetro р es el porcentaje de éxitos en la población)
𝑋
También: 𝑃̅ = , donde 𝑋 ~ 𝐵(𝑛, 𝑝)
𝑛

2. DISTRIBUCIONES MUESTRALES
Se denomina distribución muestral de una estadística a su distribución de probabilidad.

2.1. Distribución muestral de la media (𝑿 ̅)


TEOREMA. Sea 𝑋1 , 𝑋2 , … , 𝑋𝑛 una muestra aleatoria de tamaño n escogida de una
población f(x) con media µ y con varianza σ2. Si 𝑋̅ es la media muestral, entonces:
a) 𝐸(𝑋̅) = 𝜇
𝜎2
b) 𝑉𝑎𝑟(𝑋̅) = 𝑛
𝑋̅ −𝜇
c) Para 𝑛 suficientemente grande, la variable aleatoria: 𝑧 = 𝜎/ , tiene distribución
√𝑛
aproximadamente normal 𝑁(0,1)
PRUEBA
Por la definición de muestra aleatoria, las variables aleatorias 𝑋1 , 𝑋2 , … , 𝑋𝑛 son
independientes e idénticamente distribuidas como f(x) con 𝐸(𝑋𝑖 ) = 𝜇 , y con 𝑉𝑎𝑟(𝑋𝑖 ) =
𝜎 2 . Entonces,
1 1 1
a) 𝐸(𝑋̅) = 𝐸 (𝑛 ∑𝑛𝑖=1 𝑋𝑖 ) = 𝑛 ∑𝑛𝑖=1 𝐸(𝑋𝑖 ) = 𝑛 𝑛𝜇 = 𝜇.
1 1 1 𝜎2
b) 𝑉𝑎𝑟(𝑋̅) = 𝑉 ( ∑𝑛𝑖=1 𝑋𝑖 ) = 2
∑𝑛𝑖=1 𝑉(𝑋𝑖 ) = 2
2 𝑛𝜎 =
𝑛 𝑛 𝑛 𝑛
c) Se deduce el Teorema de Limite Central (TLC)
𝑋̅ − 𝜇 ∑𝑛𝑖=1 𝑋𝑖 − 𝑛𝜇
𝑍= =
𝜎/√𝑛 𝜎 √𝑛
NOTAS
𝜎2
1. La aproximación de 𝑋̅ a la normal 𝑁 (𝜇, ) es buena si 𝑛 ≥ 30, sin importar si la
𝑛
población es discreta o continua.
2. Si la muestra aleatoria es escogida de una población normal 𝑁(𝜇, 𝜎 2 ) entonces, la
𝜎2
distribución de 𝑋̅ es exactamente normal 𝑁 (𝜇, ) , para cualquier tamaño de
𝑛
muestra, 𝑛 ≥ 2
𝜎 2
3. La varianza de la media: 𝑉𝑎𝑟(𝑋̅) = es válida, si el muestreo es con o sin
𝑛
reemplazo en una población infinita, o es con reemplazo en una población finita de
tamaño 𝑁
Si el muestreo es sin reemplazo en una población finita de tamaño 𝑁, entonces, la
varianza de la distribución de 𝑋̅ es:
2 𝜎2 𝑁 − 𝑛
𝜎 = ( )
𝑋̅ 𝑛 𝑁−1
𝑁−𝑛
El coeficiente 𝑁−1 se denomina factor de corrección para población finita.
Observar que cuando 𝑁 → +∞ el factor de corrección tiende a uno.
4. La desviación estándar de una estadística es conocida como error estándar.
EJERCICIOS RESUELTOS
El número de automóviles por familia en una ciudad es una variable aleatoria X cuya
distribución de probabilidad es como sigue:
X 0 1 2 3 4
f(x) 4/12 4/12 2/12 1/12 1/12

Si se escoge al azar una muestra de 49 familias, ¿cuál es la probabilidad de que la media


muestral de autos por familia esté entre 1 y 2?
SOLUCION.
2.2. Distribución muestral de la diferencia de dos medias con varianzas
poblacionales conocidas:
TEOREMA 8.4 sean 𝑋̅1 y 𝑋̅2 las medias de dos muestras aleatorias independientes de
tamaños 𝑛1 y 𝑛2 escogidas respectivamente de dos poblaciones con medias 𝜇1 y 𝜇2 y
varianzas 𝜎12 y 𝜎22 conocidas, entonces, la variable estándar:
(𝑋̅ 1 − 𝑋̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍= ~ 𝑁(0.1)
𝜎21 𝜎22
√ +
𝑛1 𝑛2

En efecto, la variable aleatoria 𝑋̅1 − 𝑋̅2 tiene las siguientes propiedades:


Su media es: 𝜇𝑋̅1 − 𝑋̅2 = 𝐸(𝑋̅1 − 𝑋̅2 ) = 𝐸 (𝑋̅1 ) − 𝐸 (𝑋̅2 ) = 𝜇1 − 𝜇2
2
𝜎 𝜎2
Su varianza es: 𝜎𝑋2̅1 − 𝑋̅2 = 𝑉(𝑋̅1 − 𝑋̅2 ) = 𝑉 (𝑋̅1 ) + 𝑉 (𝑋̅2 ) = 𝑛1 + 𝑛2
1 2

Luego, para 𝑛1 y 𝑛2 suficientemente grandes, se tiene que:

(𝑋̅ 1 − 𝑋̅ 2 ) − 𝜇𝑋̅ − 𝑋̅
1 2
𝑍= ~ 𝑁(0.1)
√ 𝜎2𝑋̅ − 𝑋̅
1 2

NOTA:
1) Muestras grandes. Ocurre cuando 𝑛1 ≥ 30 y 𝑛2 ≥ 30. En este caso, la
aproximación de 𝑋̅1 − 𝑋̅2 a la normal es muy buena, sin importar si las poblaciones
son discretas o continuas y sin importar sus formas simétricas o asimétricas. Si son
las muestras pequeñas 𝑛1 < 30 y 𝑛2 < 30, no se aplica el TLC en este caso.
2) Si son las dos poblaciones normales, entonces, 𝑋̅1 ~ 𝑁(𝜇1 , 𝜎12 ⁄𝑛1 ) y
𝑋̅2 ~ 𝑁(𝜇2 , 𝜎22 ⁄𝑛2 ) para 𝑛1 ≥ 2 y 𝑛2 ≥ 2. Por lo tanto, se tiene que:

(𝑋̅ 1 − 𝑋̅ 2 ) − (𝜇1 − 𝜇2 )
𝑍= ~ 𝑁(0.1)
√ 𝜎2𝑋̅ − 𝑋̅
1 2

EJEMPLO:
En un estudio para comparar los pesos promedio de jóvenes y señoritas de IV ciclo de la
universidad nacional de Piura, se usará una muestra aleatoria de 20 jóvenes y otras de 25
señoritas. Se sabe que en ambos casos se sigue una distribución normal. El peso promedio
de los jóvenes es de 167 libras y presentan una desviación estándar de 25, mientras que el
peso promedio de las señoritas es de 128 libras y su desviación estándar es de 23 libras.
Encuentre la probabilidad de que el promedio de los pesos de los 20 jóvenes sea al menos
30 libras más grande que el de las 25 señoritas.
SOLUCIÓN:
Datos:
𝜇1 = 167 𝑙𝑖𝑏𝑟𝑎𝑠 𝜎12 = 25 𝑙𝑖𝑏𝑟𝑎𝑠 𝑛1 = 20 𝑗𝑜𝑣𝑒𝑛𝑒𝑠
𝜇2 = 128 𝑙𝑖𝑏𝑟𝑎𝑠 𝜎22 = 23 𝑙𝑖𝑏𝑟𝑎𝑠 𝑛2 = 25 𝑠𝑒ñ𝑜𝑟𝑖𝑡𝑎𝑠

Media: 𝜇𝑋̅1 − 𝑋̅2 = 𝜇1 − 𝜇2 = 167 − 128 = 39


𝜎12 𝜎2 (25)2 (23)2 625 529 26205
Varianza: 𝜎𝑋2̅1 − 𝑋̅2 = + 𝑛2 = + = + = = 52.41
𝑛1 2 20 25 20 25 500

𝑃[|𝑋̅1 − 𝑋̅2 | > 20] =?


Por lo tanto, la variable estándar:
(𝑋̅ 1 − 𝑋̅ 2 ) − 𝜇𝑋̅ − 𝑋̅ 30 − 39
1 2
𝑍= = = −1.24 ~ 𝑁(0,1)
𝜎2𝑋̅ − 𝑋̅ √52.41
√ 1 2

Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de los jóvenes
sea al menos 30 libras mas grande que el de la muestra de las señoritas es:
𝑃(𝑍 ≥ −1.24) = 0.5 + 𝑃 (0 ≤ 𝑍 ≤ 1.24) = 0.5 + 0.3925 = 0.8925

1.5

0.5

0
27 29 31 33 35 37 39 41 43 45 47 49 51

EJEMPLO:
Se han extraído dos muestras aleatorias del mismo tamaño 𝑛, una de la línea 1 y la otra de
la línea 2 de un proceso automático que empaqueta un producto en bolsas cuya
característica medible es el peso en gramos. Se sabe que los pesos de las bolsas de cada
línea se contribuyen según el modelo de probabilidad normal con medias iguales a 120
gramos y con varianzas, también, iguales a 18 gramos2. Obtenga el valor de 𝑛 de manera
que la probabilidad de que las 2 medias muestrales difieran en menos de 2 gramos, sea
0.95.
SOLUCIÓN:
En efecto, la variable aleatoria 𝑋̅1 − 𝑋̅2 tiene las siguientes propiedades:
Media: 𝜇𝑋̅1 − 𝑋̅2 = 𝜇1 − 𝜇2 = 180 − 180 = 0
𝜎12 𝜎2 18 18 36
Varianza: 𝜎𝑋2̅1 − 𝑋̅2 = + 𝑛2 = + =
𝑛1 2 𝑛 𝑛 𝑛

Por lo tanto, la variable


(𝑋̅ 1 − 𝑋̅ 2 ) − 𝜇𝑋̅ − 𝑋̅ ̅ 1 − 𝑋̅ 2 − 0
𝑋
1 2
𝑍= = ~ 𝑁(0.1)
√ 𝜎2𝑋̅ − 𝑋̅ √36⁄𝑛
1 2

Se debe hallar el valor de 𝑛 de manera que 𝑃[|𝑋̅1 − 𝑋̅2 | < 2] = 0.95. Entonces,
0.95 = 𝑃[|𝑋̅1 − 𝑋̅2 | < 2] =
𝑋̅1 − 𝑋̅2 − 0 2 − 0 2 − 0 √𝑛 √𝑛
= 𝑃 [| |< ] = 𝑃 [𝑍 < ] = 𝑃 [− <𝑍< ],
√36⁄𝑛 √36⁄𝑛 √36⁄𝑛 3 3

√𝑛
𝑖𝑚𝑝𝑙𝑖𝑐𝑎, 𝑃 [𝑍 < ] < 0.975
3

√𝑛
𝑑𝑒 𝑑𝑜𝑛𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎, = 1.96 → √𝑛 = 5.88 → 𝑛 = 34.5744 ≅ 35
3

2.3. Distribución muestral de la diferencia de dos medias con varianzas


poblacionales desconocidas
Sean 𝑋1 y 𝑋̅2 las medias de dos muestras aleatorias independientes de tamaños 𝑛1 y 𝑛2
̅
escogidas respectivamente de dos poblaciones normales 𝑁(𝜇1 , 𝜎12 ) y 𝑁(𝜇2 , 𝜎22 ) con
varianzas desconocidas.
Caso A. Varianzas desconocidas supuestas iguales: 𝜎12 = 𝜎22 = 𝜎 2
(𝑋̅1 − 𝑋̅2 )−(𝜇1 −𝜇2 )
En este caso, 𝑇 = ~𝑡(𝑛1 + 𝑛2 − 2)
𝑆2 2
𝑝 𝑆𝑝
√ +
𝑛1 𝑛2

(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22


, 𝑑𝑜𝑛𝑑𝑒 𝑆𝑝2 =
𝑛1 +𝑛2 −2

𝜎21 𝜎22
̅1 − 𝑋̅2 ~𝑁(𝜇1 − 𝜇2 ,
En efecto, la variable aleatoria, 𝑋 + ) y en consecuencia la
𝑛1 𝑛2

variable aleatoria estándar:


(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 ) (𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑍= = ~ 𝑁(0.1)
1 1
𝜎2 𝜎22 √ +
√ 1 𝑛1 𝑛2
𝑛1 + 𝑛2

(𝑛1 −1)𝑆21 (𝑛2 −1)𝑆22


Por otra parte, ~𝑥 2 (𝑛1 − 1), ~𝑥 2 (𝑛2 − 1) y
𝜎12 𝜎22

(𝑛1 −1)𝑆21 (𝑛2 −1)𝑆22


𝑉= + ~𝑥 2 (𝑛1 + 𝑛2 − 2)
𝜎12 𝜎22

Por lo tanto, la variable aleatoria:


𝑍 (𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑇= = ~𝑡(𝑛1 + 𝑛2 − 2)
𝑉

𝑛1 + 𝑛2 − 2 (𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 1 1
√ × (𝑛 + 𝑛 )
𝑛1 + 𝑛2 − 2 1 2

𝐿𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑆𝑝2 𝑜 𝑆𝑐2


(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
= , 𝑒𝑠 𝑙𝑎 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂 𝒑𝒓𝒐𝒎𝒆𝒅𝒊𝒐 𝒐 𝒄𝒐𝒎𝒖𝒏
𝑛1 + 𝑛2 − 2

Caso B. Varianzas desconocidas supuestas diferentes 𝜎12 ≠ 𝜎22

(𝑋̅1 − 𝑋̅2 )−(𝜇1 −𝜇2 )


En este caso 𝑇 = ~𝑡(𝑟)
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2

Donde los 𝑟 grados de libertad están dados por,


2
𝑠2 𝑠2
[𝑛1 + 𝑛2 ]
1 2
𝑟= 2 2
𝑠2 𝑠2
[𝑛1 ] [𝑛2 ]
1 2
𝑛1 − 1 + 𝑛2 − 1
Si 𝑟 no es un número entero se redondea al entero más cercano.
NOTA: Estos dos casos de la 𝑡-Student son válidos para 𝑛1 ≥ 2 y 𝑛2 ≥ 2.
Si las dos poblaciones son no normales, entonces, no se aplican estos dos casos de la 𝑡-
Student. Solo si ambas muestras son grandes se puede aplicar la distribución Z, haciendo
𝜎1 = 𝑠1 𝑦 𝜎2 = 𝑠2
EJEMPLO:
De las poblaciones 𝑁(14, 𝜎12 ) y 𝑁(12, 𝜎22 ) se extraen dos muestras al azar independientes
de tamaños 10 y 12, calcule la probabilidad 𝑃[|𝑋̅1 − 𝑋̅2 | > 4]
a) Si 𝑠1 = 5, 𝑠2 = 6 y si se supone que son iguales las varianzas de las dos
poblaciones.
b) Si 𝑠1 = 6, 𝑠2 = 12 y si se supone que son diferentes las varianzas de las dos
poblaciones.
SOLUCION:
a) Números de grados de libertad, 𝑟 = 20, 𝑠𝑝 = 5.5722 , entonces:
𝑃[|𝑋̅1 − 𝑋̅2 | > 4] = 𝑃[𝑇(20) > 0.8383] = 0.206

b) Números de grados de libertad, 𝑟 = 16.747 ≅ 17 , entonces:


𝑃[|𝑋̅1 − 𝑋̅2 | > 4] = 𝑃[𝑇(17) > 0.506] = 0.3096

2.4. Distribución muestral de la proporción


Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que
queremos investigar la proporción de artículos defectuosos o la proporción de alumnos
reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución
muestral de medias, a excepción de que al extraer las muestras de la población se calcula el
𝑋
estadístico proporción (𝑃̅ = en donde “x” es el número de éxitos u observaciones de interés
𝑛
y “n” el tamaño de la muestra) en lugar del estadístico media.
𝑋
Sea 𝑃̅ = 𝑛 la variable aleatoria que denota la proporción de éxito de muestras de tamaño n,
𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 extraídas de la población de Bernoulli B (1, p), donde p es el parámetro
porcentaje de éxitos en la población y sea:
𝑋1 + 𝑋2 + 𝑋3 + ⋯ 𝑋𝑛 𝑋
𝑃̅ = =
𝑛 𝑛
La proporción de éxitos en la muestra, siendo, 𝑋 = 𝑋1 + 𝑋2 + 𝑋3 + ⋯ + 𝑋𝑛 una variable
binomial B (n, p); entonces, la media y la varianza de P son respectivamente:
𝑋 1 1
a) 𝜇𝑃̅ = 𝐸(𝑃̅) = 𝐸 (𝑛 ) = 𝑛 𝐸(𝑋) = 𝑛 (𝑛𝑝) = 𝑝
𝑋 1 1 𝑝(1−𝑝)
b) 𝜎𝑃2̅ = 𝑉(𝑃̅) = 𝑉 ( ) = 𝑉(𝑋) = [𝑛𝑝(1 − 𝑝)] =
𝑛 𝑛2 𝑛2 𝑛
c) Si n es suficientemente grande, entonces la varianza aleatoria:
𝑃̅ − 𝑃
𝑍=
√𝑝(1 − 𝑝)
𝑛
Tiene aproximadamente distribución N (0,1).
NOTAS

𝑝(1−𝑝)
 El error estándar o típico de 𝑃̅ es: ET o 𝜎𝑃̅ = √ 𝑛
 Si la población es finita de tamaño N y el muestreo es sin reposición el error
estándar (desviación estándar de la distribución hipergeométrica) es:

𝑝(1 − 𝑝) 𝑁 − 𝑛
ET o 𝜎𝑃̅ = √ √
𝑛 𝑁−1
𝑁−𝑛
Observe que si N es grande con respecto a n el factor de corrección 𝑁−1 se aproxima
a la unidad

𝑐−𝑝
 Si n es suficientemente grande (𝑛 ≥ 30) 𝑃[𝑃̅ ≤ 𝑐] ≅ 𝑃 [𝑍 ≤ 𝐸𝑇 ]
Sin embargo aproximadamente satisfactorias se obtienen si se introduce el factor de
1
corrección por continuidad 2𝑛. Luego,

1
(𝑐 + 2𝑛) − 𝑝
𝑃[𝑃̅ ≤ 𝑐] ≅ 𝑃 [𝑍 ≤ ]
𝐸𝑇
 Observe que las dos expresiones se Z

𝑋 − 𝑛𝑝 𝑃̅ − 𝑝
𝑍= =
√𝑛𝑝(1 − 𝑝) √𝑝(1 − 𝑝)

Donde X es binomial y 𝑃̅ es el porcentaje de éxitos en la muestra, tienen


distribución aproximada N(0,1).
EJEMPLOS:
1) En un proceso de producción tiene 4%de unidades defectuosas producidas. Para controlar
el proceso, se revisa periódicamente una muestra de unidades producidas.
a) Calcule aproximadamente la probabilidad de que en una muestra al azar de
150 unidades revisadas una por una se encuentren 6% defectuosos.
b) El proceso de producción se detiene si al revisar una muestra al azar de 100
unidades producidas se encuentran al menos 5% de unidades defectuosas.
¿Cuál es la probabilidad de que el proceso no se detenga si realmente está
produciendo 6% de unidades defectuosas del total de la producción?
Solución:
𝑋
a) Sea 𝑃̅ = 150, la proporción de unidades defectuosas en la muestra de 150 unidades
escogidos al azar uno por uno sin reposición, donde X, el número de unidades
defectuosas en la muestra de 150 unidades, tiene distribución B(150,0.04).

Si se aplica el modelo de probabilidad exacto para ejecutar el cálculo, se tiene:

𝑋 9
𝑃[𝑃̅ = 0.06] = 𝑃 [ = ]
150 150

150
= 𝑃[𝑋 = 9] = ( ) (0.04)9 (0.96)141 = 0.068799
9

Si se ejecuta con el modelo aproximado de probabilidades normal, se tiene:

1 1
𝑃[𝑃̅ = 0.06] = 𝑃 [0.06 − ≤ 𝑃̅ ≤ 0.06 + ]
2(150) 2(150)

= 𝑃[0.0567 ≤ 𝑃̅ ≤ 0.0633]

0.0567 − 0.04 0.0633 − 0.04


≅ 𝑃[ ≤𝑍≤ ]
0.016 0.016

≅ 𝑃[1.04 ≤ 𝑍 ≤ 1.46] = 0.0771

El modo alternativo del cálculo es aplicar la aproximación normal de la binomial:


𝑃[𝑃̅ = 0.06] = 𝑃[𝑋 = 9] ≅ 𝑃[8.5 ≤ 𝑋 ≤ 9.5]

8.5_150(0.04) 𝑋 − 𝑛𝑝 9.5 − 150(0.04)


≅ 𝑃[ ≤ ≤ ]
√150(0.04)(0.96) √𝑛𝑝(1 − 𝑝) √150(0.04)(0.96)

8.5 − 6 9.5 − 6
𝑃[𝑃̅ = 0.06] ≅ 𝑃 [ ≤𝑍≤ ]
2.4 2.4

= 𝑃[1.04 ≤ 𝑍 ≤ 1.46] = 0.0771


𝑋
b) Sea 𝑃̅ = 100, la proporción de unidades defectuosos en la muestra de 100 unidades,
donde X, el número de unidades defectuosos en la muestra de 100 unidades, tiene
en este caso, distribución B(100,0.06). Entonces,

0.05
𝑃 [𝑃̅ < = 0.06]
𝑝

= 1 − 𝑃[𝑃̅ ≥ 0.05/𝑝 = 0.06]

= 1 − 0.6628 = 0.3372

Donde, se ha aplicado la aproximación normal de la distribución de 𝑃̅:

0.05 − 0.06
𝑃[𝑃̅ ≤ 0.05/𝑝 = 0.06] ≅ 𝑃 [𝑍 ≥ ]
0.0237
≅ 𝑃[𝑍 ≥ −0.42] = 0.6628

2) La probabilidad de que un paciente se recupere de una rara enfermedad es 0.4. ¿Cuál


es la probabilidad de que en una muestra al azar de 100 pacientes de la población de
1000 que sufren la enfermedad, más del 30% sobrevivan?

Solución:
𝑋
Sea 𝑃̅ = 100, la proporción de pacientes que se recuperan en la muestra de 100, donde
X, es el número de pacientes que se recuperan en la muestra de 100. Debido a que el
muestreo es sin reposición, X tiene distribución de probabilidad hipergeométrica
𝐻(𝑁 = 1000, 𝑟 = 400, 𝑛 = 100)

Aplicando el modelo de probabilidad de la proporción maestral, se tiene:


𝑃̅ − 𝑃 𝑃̅ − 0.4
𝑍= = =
√𝑝(1 − 𝑝) 𝑥 𝑁 − 𝑛 √0.4𝑥0.6 𝑥 1000 − 100
𝑛 𝑁−1 100 1000 − 1
̅
𝑃 − 0.4
=
0.0465
Tiene aproximadamente distribución N(0,1)

Entonces, 𝑃[𝑃̅ > 0.30] = 1 − 𝑃[𝑃̅ ≤ 0.30] = 1 − 0.9842 = 0.0158

0.3−04
Donde, 𝑃[𝑃̅ ≤ 0.3] ≅ 𝑃 [𝑍 ≤ ] = 𝑃[𝑍 ≤ −2.15] = 0.0158
0.0465

El método alternativo de cálculo es la aproximación de la distribución


hipergeométrica a la normal. En este caso la estadística Z está dada por:

𝑋 − 𝑛𝑝 𝑋 − 100𝑥0.4 𝑋 − 40
𝑍= = =
4.6499
√𝑛𝑝(1 − 𝑝)(𝑁 − 𝑛) √100𝑥0.4𝑥0.6𝑥(1000 − 100)
𝑁−1 1000 − 1

2.5. Distribución muestral de diferencia de proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse


utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos:
• Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las
de los que aprueban inglés?
• Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que presentan una
reacción adversa que el de los usuarios del fármaco B que también presentan una reacción de
ese tipo?
• Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que genera la
máquina A a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestra de diferencia de proporciones es aproximadamente
normal para tamaños de muestra grande (n1p1≥5, n 1q1≥5,n2p2≥5 y n2q2≥5). Entonces p 1
y p 2 tienen distribuciones muestrales aproximadamente normales, así que su diferencia p 1-
p2 también tiene una distribución muestral aproximadamente normal.

Grafico recreativo de distribuciones muestrales de la diferencia de proporciones


P11 P2
1 1
P11-p21
Muestra1 P12 Muestra
P12-p22 P2 1
Muestra2 2
P13-p23 Muestra
Muestra3 P1 2
. P2
Muestra 3 3
P1k-p2k Muestra
4 P1k P24 3
Muestra
4

Definición
𝑛1
∑ 𝑋 𝑋𝑖
̅̅̅
𝑃1 = 𝑖=1 = y
𝑛1 𝑛1
Sean 𝑥1 , 𝑥2 , 𝑥𝑛 𝑒 𝑦1 𝑦2 𝑦𝑛
dos muestras aleatorias independientes de 𝑛2
tamaño n1 y n2 seleccionadas ̅̅̅2 = ∑𝑖=1 𝑌 =
𝑃
𝑌𝑖
respectivamente de dos poblaciones 𝑛2 𝑛2
independientes de Bernoulli B(1, p1)y B(1, DONDE :
p2); donde p1 y p2 son las proporciones de X, ~ B (𝑛1 , 𝑝1 ) y Y ~ (𝑛2 , 𝑝2).
éxito en las poblaciones respectivas , sean Entonces , la variable aleatoria ̅̅̅̅
𝑃1 − ̅̅̅̅
𝑃2 𝑡
además las proporciones muestrales : Tienen las propiedades siguientes :

a) Su media es :

µ𝑃̅1−𝑃̅2 = 𝐸(𝑃̅1 − 𝑃̅2 ) = 𝐸(𝑃̅1 ) − 𝐸(𝑃̅2 ) = 𝑝1 − 𝑝2

b) Su varianza es :

𝑃1 (1 − 𝑃1 ) 𝑝2 (1 − 𝑝2 )
𝜎 2 𝑃̅1−𝑃̅2 = 𝑉(𝑃̅1 − 𝑃̅2 ) = 𝑉(𝑃̅1 ) − 𝑉(𝑃̅2 ) = +
𝑛1 𝑛2

c) Para 𝑛1 𝑦 𝑛2 suficientemente grandes(𝑛1 ≥ 30 𝑌 𝑛2 ≥ 30) se tiene que :

𝑝̅1 − 𝑝̅2 − (𝑝1 − 𝑝2 )


𝑍= ~𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑 𝑁(0,1 )
𝜎𝑝̅1 −𝑝̅2

Donde, el error estándar o típico de 𝑝̅1 − 𝑝̅2 está dado por:


̅

EJEMPLO

Dos amigos Ay B juegan “cara”o “sello” con una moneda. Suponga que en este juego,
cada uno lanza la moneda 35 veces y que uno de ellos gana si obtiene 7 caras más que el
otro. Calcule la probabilidad de que B gane el juego.
Solución:
Sea X el número de caras que saca el jugador A en las 35 tiradas y sea Y el número de
caras que saca el jugador B en las 35 tiradas .
Entonces, cada variable tiene distribución B (35, 0.5); donde p=0.5 es la probabilidad de
obtener cara en cada tirada de los jugadores.

Sean 𝑝̅1= 𝑋⁄ Y 𝑃̅2 = 𝑌⁄35 las proporciones de caras de los jugadores A y B


35
respectivamente.
El jugador B gana el juego si saca 7 cars más que el jugador A o si su proporción de caras
es 7/35 = 0.2 más que la de A. luego la probabilidad de que B gane el juego está dado por:
𝑃 [ 𝑃̅2 − 𝑃̅1 > 0.2 ] = 1 − 𝑃[ 𝑃̅2 − 𝑃̅1 ≤ 0.2] = 0.0475
DONDE:

𝑜. 2 − ( 0.5 − 0.5 )
𝑃[ 𝑃̅2 − 𝑃̅1 ≤ 0.2] ≅ 𝑝 𝑍 ≤ = 𝑝[ 𝑍 ≤ 1.67] = 0,9525 .
√0.5𝑥0.5 + 0.5𝑥0.5
[ 35 35 ]
EJEMPLO:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus
opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato.
Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que
sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100
hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la
probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las
mujeres.
Solución:
Datos:
𝑃𝐻 = 0.12
𝑃𝑀 = 0.10
𝑛𝐻 = 100
𝑛𝑀 = 100
P (𝑃𝐻 − 𝑃𝑀 ≥ 0.03) =
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución
binomial y se está utilizando la distribución normal.

(𝑝𝐻 − 𝑝𝑀 ) − (𝑃𝐻 − 𝑃𝑀 ) 𝑂. 𝑂25 − (0.12 − 0.10 )


𝑍= = = 0.11
𝑃 𝑞 𝑃𝑀 𝑞𝑚
√ 𝐻 ℎ + √( 0.12 )( 0.88) + ( 0.10 )(0.90)
𝑛𝐻 𝑛𝑀 100 100

Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de


muerte, al menos 3% mayor que el de las mujeres es 0.4562
2.6. Distribución muestral de la varianza y la desviación estándar
LA VARIANZA MUESTRAL
En muchos casos es importante conocer el valor de la varianza de la población
• Para aplicar el teorema central del límite
• Para estimar riesgos en inversiones (el riesgo depende de la varianza)
• Para estimar desigualdades en ingresos, rentas, etc.
Procedimiento para hallar la Varianza muestral
Repetimos el estudio que hemos realizado para la media muestral:
- Partimos de que la varianza muestral es una variable aleatoria
- Queremos relacionar sus momentos con los de la población
- Y si es posible, identificar su distribución
Si X1, X2,…, Xn son las variables aleatorias de una muestra aleatoria de tamaño “n”,
entonces la variable aleatoria que da la varianza de la muestra o varianza muestral está
definida por:

2
(𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝑆 =
𝑛
Ahora en el Teorema de Distribución muestral de la media (𝑋̅) se encontró que 𝐸(𝑋̅) = 𝜇 ,
por lo cual sería bueno también si pudiéramos tener 𝐸(𝑆 2 ) = 𝜎 2 . Siempre que el valor
esperado de un estadístico sea igual al parámetro poblacional correspondiente, decimos que
el estadístico es un estimulador insesgado y que el valor es un estímulo insesgado de este
parámetro. Sin embargo resulta que
𝑛−1 2
𝐸(𝑆 2 ) = 𝜇𝑆2 = 𝜎
𝑛
lo cual es muy cercano a 𝜎 2 sólo para valores grandes de n (𝑛 ≥ 30). Por lo tanto el
estimador insesgado se define por:

2
𝑛−1 2 (𝑋1 − 𝑋̅)2 + (𝑋2 − 𝑋̅)2 + ⋯ + (𝑋𝑛 − 𝑋̅)2
𝑆 = 𝑆 =
𝑛 𝑛−1

de tal manera que:


𝐸(𝑆 2 ) = 𝜎 2
Distribución muestral de la varianza
Tomando todas las muestras aleatorias posibles de tamaño n, sacados de una población y
luego calculando la varianza para cada una , podemos obtener la distribución muestral de
varianzas. En lugar de encontrar la distribución muestral de 𝑆 2 en sí misma, conviene
encontrar la distribución muestral de las variables aleatorias relacionadas
𝑛𝑆 2 (𝑛−1)𝑆 2 (𝑋1 −𝑋̅)2 + (𝑋2 −𝑋̅)2 +⋯+ (𝑋𝑛 −𝑋̅ )2
= = …………..(*)
𝜎2 𝜎2 𝜎2

La Distribución de esta variable aleatoria se decribe en el siguiente teorema:


TEOREMA: Si se tomas muestras aleatorias de tamaño n de una población que tiene
distribución normal, entonces la variable de muestreo (*) tiene distribución Chi cuadrado
con n-1 grados de libertad y se denota con frecuencia 𝑥 2 .
EJEMPLOS:

2.7. Distribución muestral del cociente de varianzas muestrales


 Sirve para comparar la similitud de la dispersión de dos conjuntos muestrales de datos.

 Es útil para poder comparar el nivel de control de dos procesos.

 Debe implementarse para probar los supuestos en la comparación de medias.


 Se utiliza la función F de Fisher con nx-1 grados de libertad del numerador y ny-1

grados de libertad del denominado

𝑆2
𝑋
2 𝜎2
𝑆𝑋
 Definimos a como una variable aleatoria muestral de forma que si 𝑇 = 𝑋
𝑆2
𝑆𝑌2 𝑌
𝜎2
𝑌

Entonces T F (𝑛1 − 1, 𝑛2 − 1) tiene una distribución F de Snedecor con, grados de

libertad:

𝑆𝑋2 𝜎𝑌2
𝐹= × 𝑒𝑠𝑡𝑜 𝑒𝑠 𝑓(𝑛𝑋−1,𝑛𝑌−1)
𝑆𝑌2 𝜎𝑋2

 Hay dos situaciones:

A) Cuando las Medias Poblacionales son Conocidas


B) Cuando las Medias Poblacionales son desconocidas

Nota 1: Toda vez que se necesite resolver probabilidades, deberemos realizar una

transformación de variables hasta conseguir la forma cómo se define a T para luego utilizar

la distribución F de Fisher a fin de encontrar la probabilidad buscada.

Nota 2: Si las varianzas poblacionales son iguales u homogéneas entonces la variable

muestral: cociente de varianzas muestrales debe tomar la forma Tpara tener una

distribución F de Fisher con n 1 - 1 y n2 - 1 grados de libertad en el denominador y

denominador, respectivamente.

Ejemplo

Se seleccionan dos muestras aleatorias simples de tamaños 13 y 17 de dos poblaciones

distribuidas normalmente. Sabiendo que en la primera población la media es 50 y la

varianza 15, y que en la segunda población la media es 60 y la varianza 20:


Hallar la probabilidad de que la varianza del primera muestra tome un valor que sea como

minimo 1,5 veces la varianza de la segunda muestra.

POBLACIÓN X POBLACIÓN Y

𝑛 = 12 𝑛𝑌 = 16

N( 𝜇𝑋 ; 𝜎𝑋 ) N( 𝜇𝑌 ; 𝜎𝑌 )

𝜇𝑋 = 50 𝜇𝑌 = 60

𝜎𝑋2 = 15 𝜎𝑌2 = 20

𝑆𝑋2
𝑃(𝑆𝑋2 > 1,5 × 𝑆𝑌2 ) = 𝑃 ( 2 > 1,5) = ?
𝑆𝑌

𝑆𝑋2 𝜎𝑌2 𝜎𝑌2 20


𝑃 = ( 2 × 2 > 1,5 × 2 ) = 𝑃(𝐹𝑛𝑥 ,𝑛𝑦 > 1,5 × )
𝑆𝑌 𝜎𝑋 𝜎𝑋 15

𝑃(𝐹12,16 > 2) = 0.10

Ejemplo 2:

Se está comparando la variabilidad de los I.B-D de dos ríos A y B, que suponemos siguen

distribuciones Normales. Se realizan 16 mediciones en el río A y se obtiene una desviación

estándar muestral de 7, y 18 mediciones en el río B y se obtiene una una desviación

estándar muestral de 9.52. Obtener la probabilidad de que la varianza en el río A sea como

mínimo el doble de la varianza en el río B.

POBLACIÓN Y

𝑛𝑌 = 18
POBLACIÓN X

𝑛 = 16

N( 𝜇𝑋 ; 𝜎𝑋 )

𝜎𝑋2 = 9.52

𝑆𝑋2
𝑃(𝑆𝑋2 > 2 𝑆𝑌2 ) = 𝑃 ( 2 > 2) = ?
𝑆𝑌

𝑆𝑋2 𝜎𝑌2 𝜎𝑌2 9.52


𝑃 = ( 2 × 2 > 2 × 2 ) = 𝑃(𝐹15,17 > 2 × )
𝑆𝑌 𝜎𝑋 𝜎𝑋 7

𝑃(𝐹15,17 > 2.72) = 0.025

Propuesto

Una compañía fabrica propulsores para uso en motores de tractores para fines agrícolas.

Una de las operaciones consiste en esmerilar el terminado de una superficie particular con

una aleación de titanio. Pueden emplearse dos métodos de esmerilado y ambos pueden

producir partes que tienen la misma rugosidad superficial promedio. Al ingeniero de

manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la

rugosidad de la superficie. Para ello toma una muestra de 12 partes del primer proceso, la

cual tiene una desviación estándar muestral de 6.52 micropulgadas y una muestra aleatoria

de 15 partes del segundo proceso, la cual tiene una desviación estándar muestral de 4.7

micropulgadas. Obtener la probabilidad de que la varianza de la primera muestra sea como

mínimo el doble de la varianza de la segunda muestra.


BIBLIOGRAFIA

Análisis Estadístico y Gráfico de datos Aleatorioso I, Tom Alban Coppier;

5ta edición,2009.

Cálculos Estadísticos y Gráficos de Poblaciones Descriptivas Parson R E - Hostetler RP -

Edwards, 6ta edición, 20.

Potrebbero piacerti anche