Sei sulla pagina 1di 24

UNIVERSIDAD AUSTRAL DE CHILE

FACULTAD DE CS. ECONMICAS Y ADMINISTRATIVAS


INSTITUTO DE ESTADSTICA

BAIN 052
ESTADSTICA Y PROBABILIDADES PARA INGENIERA

ASIGNATURA DEL CURRICULUM DE LAS CARRERAS DE INGENIERA DE LA


FACULTAD DE CIENCIAS DE LA INGENIERA, DE LA UNIVERSIDAD AUSTRAL DE
CHILE

APUNTES DE CLASES
Autor: Prof. Dr. Vctor Figueroa Arcila
Versin 4.02

UNIDAD DE APRENDIZAJE III INFERENCIA ESTADSTICA

AD IV ANLIS

Profesores Asignatura
Carlos Gonzlez Riffo
Luis Ojeda Silva

Marzo 2016
Unidad de
Aprendizaje III
INFERENCIA
ESTADSTICA
3.1 INTRODUCCIN 76

3.2 DISTRIBUCIONES MUESTRALES 76

3.3 ESTIMACIN 79

3.3.1 Estimacin de parmetros 79

3.3.1.1 Estimacin puntual 79


3.3.1.2 Estimacin por intervalos 80

3.3.1.3 Aplicaciones 81
3.4 PRUEBA DE HIPTESIS (PRIMERA PARTE) 84
3.4.1 HIPTESIS ESTADSTICAS 84
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS 85
3.4.3 CRITERIOS DE DECISIN 85
3.4.4 CONTRASTES UNILATERALES Y BILATERALES 85
3.4.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS 86
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN 86
CON LOS PRINCIPALES CONTRASTES)

3.5 APLICACIONES EN EL MBITO DE LA INGENIERA 88


ANEXOS 94

75
3.1 INTRODUCCIN

A menudo necesitamos estudiar las propiedades de una determinada poblacin, pero nos encontramos con el
inconveniente de que sta es demasiado numerosa como para analizar a todos los individuos que la componen. Por
tal motivo, recurrimos a extraer una muestra de la misma y a utilizar la informacin obtenida para hacer inferencias
sobre toda la poblacin. La Inferencia estadstica persigue entonces la obtencin de conclusiones sobre toda una
poblacin, basndose en la observacin de una muestra obtenida de ella. Estas estimaciones sern vlidas slo si la
muestra tomada es representativa de la poblacin. As, el muestreo es una tcnica que utilizamos para
asegurarnos que las muestras seleccionadas de la poblacin sean realmente representativas. El muestreo puede
hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se
efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una
poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin
de partida infinita o a muestreo con reposicin.

3.2 DISTRIBUCIONES MUESTRALES


El estudio de determinadas caractersticas de una poblacin se efecta a travs del anlisis de diversas muestras
que pueden extraerse de ella. Consideremos todas las posibles muestras de tamao n en una poblacin. Para cada
muestra podemos calcular un estadgrafo (media aritmtica, desviacin estndar, proporcin, entre otros), cuyo valor
variar de una muestra a otra. As obtenemos una distribucin de probabilidades del estadgrafo que se llama
distribucin muestral. Se presentarn ahora las distribuciones muestrales relacionadas con dos situaciones
comunes: Muestreo a partir de una poblacin y Muestreo a partir de dos poblaciones.

3.2.1 Muestreo a partir de una poblacin


Vamos a suponer que deseamos estudiar el comportamiento que tiene una variable en una determinada poblacin.
Supondremos adems que dicha variable tiene una distribucin normal con parmetros y 2 (N(, 2)), los cuales
habitualmente son desconocidos. Para realizar nuestro estudio extraemos de esta poblacin muestras de tamao n.
3.2.1.1 Distribucin muestral de la media muestral. Cada muestra de tamao n que podemos extraer de
una poblacin proporciona una media. Si consideramos cada una de estas medias como valores de una
variable aleatoria podemos estudiar su distribucin que llamaremos distribucin muestral de la media
muestral.
Caso 1. Si tenemos una poblacin donde la variable bajo estudio X tiene una distribucin normal, N(, 2), y
extraemos de ella muestras aleatorias de tamao n, entonces la distribucin muestral de la media muestral sigue
tambin una distribucin normal.
(X )

2
X N , n Z N(0,1)


n

Caso 2. Si tenemos una poblacin donde la variable bajo estudio X NO tiene una distribucin normal, pero el
tamao de la muestra n es mayor o igual que 30 (n>30), entonces aplicando el llamado Teorema del lmite central
la distribucin muestral de la media se aproxima tambin a la distribucin normal anterior.

2 (X )
X N, n Z N(0,1)


n

Caso 3. El resultado del Caso 2 sigue siendo vlido en aquellos casos en que no se conozca la varianza poblacional
2 y n> 30. En tales casos es posible utilizar la varianza muestral S 2, en reemplazo de la varianza poblacional 2. El
resultado quedara como:
2 (X )
X N, Sn Z N(0,1)




S
n

76
Caso 4. Si en el Caso 3, el tamao de la muestra es menor a 30 (n < 30), entonces la estadstica,

(X )
t tiene una distribucin t con (n-1) grados de libertad.
S
n

Comentario: Los resultados anteriores son aplicables tambin a la estadstica suma, es decir, de acuerdo al
n
teorema del lmite central la distribucin de X i es aproximadamente normal, con media n y varianza n2, sin
i 1
importar la distribucin de la poblacin.
Ejemplo 1. Suponga que las notas obtenidas en la primera prueba parcial de la asignatura siguen una distribucin
normal con una media igual a 5,8 y una desviacin estndar, , igual a 2,4. Encuentre la probabilidad de que la
media de una muestra tomada al azar de 16 estudiantes est comprendida entre 5 y 7.
Solucin: Como la variable NOTAS tiene una distribucin N(5,8; 2,4), con n=16, la distribucin muestral de la media
se distribuye N(5,8; 0,6). Si x es la media de la muestra hemos de calcular la probabilidad

P(5< x < 7)=P(-1, (-1,33) = 0,8854

3.2.1.2 Distribucin muestral de la proporcin muestral


En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En estos casos la variable aleatoria toma
solamente dos valores diferentes (xito o fracaso), es decir sigue una distribucin binomial y cuando la extensin de
la poblacin es grande, la distribucin binomial B(n,p) se aproxima a la normal N(np,npq) . Luego, para muestras
pq
de tamao n>30, la distribucin muestral de la proporcin sigue una distribucin normal N(p, ) , donde p es la
n
proporcin de xitos en la poblacin y q=1-p.

(p p)
p N p, pq

n Z N(0,1)
pq
n
Ejemplo 2. Si tiramos una moneda correcta 100 veces, cul es la probabilidad de que obtengamos ms de 55
caras?.
Solucin: En una moneda correcta la proporcin de caras es 0,5, con lo que p=0,5; q=0,5 y n=100. Entonces la
proporcin muestral tiene una distribucin muestral N(0,5; 0,052). Si llamamos p a la proporcin en la muestra

hemos de calcular la probabilidad P( p > 0,55) = 1-0,8413 = 0,1587.

3.2.1.3 Distribucin muestral de la varianza muestral


Supngase que X1, X2, X3, ,Xn es una muestra aleatoria de una distribucin N(, 2). Entonces la variable
aleatoria:

n
2
X i X tiene una distribucin Chi-cuadrado con n-1 grados de libertad.
i 1 (n 1)S2

2 2

77
3.2.2. Muestreo a partir de dos poblaciones
Supongamos ahora que estamos estudiando el comportamiento de una variable en dos poblaciones independientes.
Supongamos adems que en ambas poblaciones dicha variable tiene una distribucin normal con parmetros

distintos y habitualmente desconocidos, es decir en la poblacin 1 la variable tiene una distribucin N(1,
12 ) y en la

poblacin 2 tiene una distribucin N(2,


2
2 ). De ambas poblaciones extraemos muestras de tamao n 1 y n2
respectivamente. Sea X11, X12, X13,,X1n1 una muestra aleatoria de n1 observaciones a partir de la primera poblacin,
y sea X21, X22, X23, ,X2n2 una muestra aleatoria de tamao n2 tomada de la segunda poblacin.

3.2.2.1 Distribucin muestral de la diferencia de medias muestrales


Caso 1. Si las varianzas poblacionales son conocidas, entonces la diferencia de las medias muestrales tiene una
distribucin normal, sin importar los tamaos de n 1 y n2.

12 22 (X X 2 ) ( 1 2 )
(X1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 12 22

n1 n2
Caso 2. Si las distribuciones de la variable a nivel poblacional NO son normales y las varianzas son conocidas,
entonces si los tamaos muestrales son ambos mayores o iguales a 30 (n1 30 y n2 30), la diferencia de las
medias muestrales se aproximan a una distribucin normal.

n 1 , n2 12 22 (X X 2 ) ( 1 2 ) n1 , n2
(X1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 11 22

n1 n2

Caso 3. Si las varianzas poblacionales son desconocidas y los tamaos muestrales son ambos mayores o iguales a
30 (n1 30 y n2 30), entonces el resultado anterior sigue siendo vlido, es decir, la diferencia de las medias
muestrales se aproximan a una distribucin normal, donde las varianzas poblacionales se reemplazan por las
varianzas muestrales.

n1 , n2 S12 S 22 (X X 2 ) ( 1 2 ) n1 , n2
(X 1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 S 11 S 22

n1 n 2

Caso 4. Si las varianzas poblacionales son desconocidas, pero aproximadamente iguales, y los tamaos muestrales
son pequeos (n1 < 30 y/o n2 < 30), entonces la estadstica,

(X - X ) - ( - ) tiene una distribucin t con n1 + n2 2 grados de libertad, donde


t 1 2 1 2
1 1
Sp (n1 1)S12 (n 2 1)S22
n n S2p
1 2 n1 n 2 2

Caso 5. Si las varianzas poblacionales son desconocidas y desiguales, y los tamaos muestrales son pequeos
(n1 < 30 y/o n2 < 30), entonces la estadstica, 2 2
2
S1 S 2

n1 n2
(X - X ) - ( - )
t 1 2 1 2

S2 S2 tiene una distribucin t con grados de libertad, donde 2 2
1 2 S12 S 22
n n
1 2
n1 n2
n1 1 n2 1

78
Caso 5. Muestras pareadas

Si
D y SD son la media y la desviacin estndar muestrales de la diferencia de n pares aleatorios de mediciones
D - D
t
SD

normalmente distribuidas, entonces la estadstica n tiene una distribucin t con n-1 grados de libertad.

3.2.2.2 Distribucin muestral de la diferencia de proporciones muestrales


Si p1 y p 2 son las proporciones muestrales de dos muestras aleatorias independientes de tamaos n 1 y n2,
respectivamente, entonces bajo la hiptesis de que se aplica la aproximacin normal de una distribucin binomial, la
diferencia de las proporciones muestrales tiene aproximadamente una distribucin normal,

1 , n 2
p1 q 1 p 2 q 2 ( p p 2 ) ( p1 p 2 ) n1 ,n2
(p1 - p 2 ) n N( p1 - p 2 , ) Z 1 N (0,1)
n1 n2 p1 q1 p 2 q 2

n1 n2

3.1.2.2. Distribucin muestral del cociente entre dos varianzas muestrales


Supongamos que se tienen dos distribuciones normales independientes X1 N(1, 12) Y X2 N(2, 22). Sea X11,
X12, X13, ,X1n1 una muestra aleatoria de n1 observaciones a partir de la primera distribucin normal, y sea X 21, X22,

X23, ,X2n2 una muestra aleatoria de tamao n2 tomada de la segunda distribucin. Si


S12 y
S 22 son las varianzas
muestrales, entonces el cociente:

Tiene una distribucin F con n1 - 1 grados de libertad en el numerador y n2 - 1 grados de libertad en el


S2 2
1 2 denominador
S2 2
2 1

3.3 ESTIMACIN
3.3.1 Estimacin de parmetros
Una variable aleatoria se caracteriza o describe mediante su distribucin de probabilidad, la cual depende de
parmetros, que usualmente son desconocidos, por ello es necesario disponer de procedimientos para estimarlos
a partir de datos muestrales.

3.3.1.1 Estimacin puntual

Un estimador puntual es una estadstica que produce un solo valor numrico como estimacin del parmetro
desconocido.
Por ejemplo la media aritmtica muestral es un estimador de la media poblacional, la proporcin observada en la
muestra es un estimador de la proporcin en la poblacin.
Un valor numrico particular de un estimador, calculado a partir de datos muestrales, se llama estimacin.

79
Parmetro poblacional Estimador Estimacin
n

x
n

Media X i i
X i 1
x i 1
n n


n n
1 1
2
2

Varianza 2 S 2 ( X i X )2 s2 xi x
n 1 i 1 n 1 i 1

X nmero xitos x
Proporcin p
p p
n nmero pruebas n

Los estimadores puntuales adecuados requieren cierto nmero de propiedades importantes, de las cuales dos de
las ms importantes son las siguientes: (VER LIBRO: CANAVOS)

1. El estimador puntual debe carecer de sesgo; es decir, el valor esperado del estimador puntual debe ser igual al
parmetro estimado.
2. El estimador debe tener varianza mnima. Cualquier estimador puntual es una variable aleatoria. por tanto, un
estimador puntual de varianza mnima tendr una menor varianza que cualquier otro estimador puntual del
parmetro.
Ejemplo: Sea X1, X2, X3 y X4 una m.a (4) de una poblacin cuya distribucin es normal con media y
2. Considrense las estadsticas T 1= (X1 + X2 + X3 + X4)/4 y T2= (X1+2X2+X3)/4
a) Cules son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), Cul tiene varianza mnima?

Actividad
Sea X1, X2, X3 y X4 una m.a(4) de una poblacin cuya distribucin es exponencial con parmetro .
Considrense las estadsticas T1= (1/6)(X1 + X2) + (1/3)(X3 + X4), T2= (X1+ 2X2 + 3X3+4X4)/4, T3= (X1 + X2 + X3
+ X4)/4
a) Cules son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), Cul tiene varianza mnima?

Para determinar estimadores puntuales existen mtodos de estimacin, dentro de los cuales se destacan: El
Mtodo de los Momentos; El Mtodo de Mxima Verosimilitud y el Mtodo de Mnimos Cuadrado ordinarios
(Unidad IV).

3.3.1.2 Estimacin por intervalos

Un estimador por intervalo es un intervalo aleatorio que incluye el valor real del parmetro, con cierto nivel de
probabilidad. Estos intervalos aleatorios se denominan normalmente intervalos de confianza. Una estimacin por
intervalo de un parmetro es el intervalo limitado por dos estadsticas, de manera que incluye el verdadero valor del
parmetro con cierta probabilidad.

Por ejemplo para elaborar un estimador por intervalo para un parmetro , es necesario encontrar dos estadsticas
L y U, tales que: P{L U} = 1- . El intervalo resultante: L U se denomina intervalo bilateral al 100(1- )%
de confianza para el parmetro desconocido , donde: L es el lmite inferior de confianza; U es el lmite superior de
confianza; 1- es el coeficiente o nivel de confianza y U - ( - L) se denomina exactitud del intervalo.

Interpretacin de un intervalo de confianza

Si se determinan un gran nmero de tales intervalos, cada uno a partir de una muestra aleatoria, entonces el (1- )
de estos intervalos contendrn el verdadero valor del parmetro .

Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro.
Se indica por 1- y habitualmente se da en porcentaje 100(1-)%. Hablamos de nivel de confianza y no de

80
probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del
parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el
100(1-)% de los intervalos as construidos contendra al verdadero valor del parmetro.

Intervalos de confianza unilaterales


Un intervalo unilateral inferior al 100(1- )% de confianza para estara dado por , L , donde L, el lmite inferior
de confianza, se escoge de manera que P{L } = 1- .

Un intervalo unilateral superior al 100(1- )% de confianza para estara dado por , U donde U, el lmite
superior de confianza, se escoge de manera que P{ U } = 1- .

Metodologa para construir intervalos de confianza

Para construir un intervalo de confianza para un parmetro determinado se requiere encontrar una estadstica que
cumpla dos condiciones:
1. Que involucre en su formulacin al parmetro que se desea estimar.
2. Que dicha estadstica tenga una distribucin de probabilidades conocida.

Una estadstica que cumpla con estas condiciones recibe el nombre de estadstica pivotal.
3.3.1.3 Aplicaciones (en anexo 1 encontrar un resumen con estadsticas pivotales)

Estudiaremos ahora cmo construir intervalos de confianza para la media, la varianza y la proporcin en una
poblacin. Para el caso de dos poblaciones estudiaremos cmo construir intervalos de confianza para la diferencia de
medias, el cociente de varianzas y la diferencia de proporciones. En cada caso se trabaja con las estadsticas y
distribuciones muestrales ya estudiadas anteriormente.

A. Caso una poblacin


A.1 Estimacin de la media

Caso 1. Intervalo de confianza para ; con conocida

Si x es la media de una muestra aleatoria de tamao n proveniente de una poblacin cuya variable de inters tiene
una distribucin normal con varianza conocida 2, entonces un intervalo al 100(1 - )% de confianza para , la media
poblacional de la variable, est dado por:
x z xz
(1
) n (1
) n donde z (1

2)
es el percentil (1-/2) de la distribucin normal estndar.
2 2

Teorema: Si se utiliza x como una estimacin de , se puede tener entonces una confianza de
100(1-)% de que el error no exceder de:

Z
(1

) n Ver Figura 1
2

x

XZ XZ
) n
(1 ) n (1
2
2
e: error de estimacin

Z
(1

) n
Figura 1. Error al estimar por x 2

81
Teorema: Si se utiliza x como una estimacin de , se puede tener una confianza de 100(1 - )% de que el error
ser menor que una cantidad especificada cuando el tamao de la muestra es:


z )
2
(1
n

2

e

C a s o 2 . I n t e r va l o d e c o n f i a n z a p a r a ; c o n 2 d e s c o n o c i d a ( m u e s t r a s g r a n d e s )

Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n > 30, tomada de una poblacin
cuya variable de inters tiene una distribucin normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable, est dado por:
S S
x z
xz
(1
2
) n (1 )
2
n donde z (1
2)
es el percentil (1-/2) de la distribucin normal estndar.

C a so 3. In t er v al o d e c on fi a nz a p a r a ; c o n 2 d e sc o n oc id a (mu es t r a s p equ e as)


Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n < 30, tomada de una poblacin
cuya variable de inters tiene una distribucin normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable, est dado por:

S S
x t )
x t donde t(1-/2) es el percentil (1-/2) de la distribucin t con v = n 1
(1 (1 )
2 n 2 n grados de libertad.

A.2 Estimacin de una proporcin

Si pes la proporcin muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal, entonces un intervalo al (1 - )% de confianza para P, la proporcin poblacional,
est dado por:
p (1 p) p (1 p) donde z (1 ) es el percentil (1-/2) de la distribucin
p z P p z 2
(1 ) n (1 ) n
2 2 normal estndar.
A.3 Estimacin de la varianza

Si S2 es la varianza muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal con varianza desconocida 2, un intervalo al 100(1 - )% de confianza para 2,
la varianza poblacional, est dado por:
donde
2) 2
y (1 2 ) son los percentiles /2 y (1-/2), respectivamente

2 2 2
(n -1) S (n -1)2 S
2
de la distribucin Chi-cuadrado con (n 1) grados de libertad.
2
)

(1
2 2

B. CASO DOS POBLACIONES


1.- Estimacin de la diferencia entre dos medias

Caso 1. Intervalo de confianza para 1 - 2; con 12 y 22 conocidas

Si x1 y x2 son las medias de muestras aleatorias independientes de tamaos n1 y n2 provenientes de poblaciones,


donde la variable de inters tiene una distribucin normal, con varianzas conocidas 12 y 22 , respectivamente,
entonces un intervalo al 100(1 - )% de confianza para 1 2 , la diferencia de medias poblacionales, est dado
por:

2 2 2 2
(x - x ) z 1 2 - (x - x ) z 1 2 donde z (1
2)
es el percentil (1-/2) de la
1 2 (1
2
) n n 1 2 1 2 (1 )
2 n n
1 2 1 2 distribucin normal estndar.

82
Comentario:

El grado de confianza es exacto cuando las muestra provienen de poblaciones donde la variable de inters tiene una
distribucin normal. Para poblaciones donde la variable de inters no tiene una distribucin normal se obtiene un
intervalo de confianza aproximado que es muy bueno cuando tanto n 1 como n2 son > 30.

Como antes, si 12 y 22 son desconocidos y los tamaos muestrales son suficientemente grandes, se puede

reemplazar, en la ecuacin precedente, 12 por S12 y 22 por S 22 , sin afectar de manera significativa el intervalo de
confianza.

Caso 2. Intervalo de confianza para 1 - 2; con 12 = 22 pero desconocidas (para muestras pequeas)

Si x1 y x2 son las medias de muestras aleatorias pequeas independientes de tamaos n1 y n2, respectivamente,
provenientes de poblaciones, donde la variable de inters tiene una distribucin normal, con varianzas 12 y 22
desconocidas pero aproximadamente iguales, entonces un intervalo al 100(1 - )% de confianza para 1 2 , la
diferencia de medias poblacionales, est dado por:

1 1 1 1
(x - x ) t (1 ; v)Sp - (x - x ) t (1 ; v) Sp
1 2 2 n n 1 2 1 2 2 n n
1 2 1 2
donde Sp es la estimacin conjunta de la desviacin estndar de la poblacin, y donde t(1-/2) es el percentil (1-/2) de
la distribucin t con v = n1 + n2 2 grados de libertad.

Caso 3. Intervalo de confianza para 1 - 2; con 12 22 y desconocidas (para muestras pequeas)

Si x1 , S12 y x2 , S 22 , son las medias y las varianzas de muestras aleatorias pequeas independientes de tamaos
n1 y n2 respectivamente, provenientes de poblaciones donde la variable de inters tiene una distribucin normal, con
12 y 22 desconocidas y desiguales, respectivamente, entonces un intervalo al 100(1 - )% de confianza
varianzas

para 1 2 , la diferencia de medias poblacionales, est dado por:

S2 S2 S2 S2
(x - x ) t (1 ;v) 1 2 - (x - x ) t (1 ; v) 1 2
1 2 2
n n 1 2 1 2 2 n n
1 2 1 2
donde t(1-/2) es el percentil (1-/2) de la distribucin t con grados de libertad, y queda dado por la siguiente
2
expresin: S12 S 22

12
n n2
2
S1 2
S 22

n1 n2
n1 1 n2 1

83
Caso 4. Intervalo de confianza para D = 1 - 2 en el caso de observaciones en pares

Si d y Sd son la media y la desviacin estndar de las diferencias de n pares aleatorios de mediciones,

entonces un intervalo al 100(1 - )% de confianza para D 1 2 , la diferencia de medias poblacionales,


est dado por:
Sd Sd donde t(1-/2) es el percentil (1-/2) de la distribucin t con v = n 1
dt
d t grados de libertad.
(1
2
; v) n d (1 ; v )
2
n
2.- Estimacin de la diferencia entre dos proporciones
Intervalo de confianza para p1 - p2, a partir de muestras grandes

Si p1 y p2 son las proporciones de xitos en muestras aleatorias de tamaos n1 y n2, respectivamente, y adems
q1 1 p 1 y q 2 1 p 2 , entonces un intervalo al 100(1 - )% de confianza para p1 p2, est dado por:
p q p q p q p q
(p - p ) z 1 1 2 2 P - P (p - p ) z 1 1 2 2 donde z (1 es el percentil (1-/2)
(1 )

1 2 (1 ) 1 2 1 2 2)
2 2
n n n n de la distribucin normal estndar.
1 2 1 2
3.- Estimacin de la razn de dos varianzas

22
Intervalo de confianza para 12

Si S12 y S 22 son las varianzas de muestras aleatorias independientes de tamaos n1 y n2, respectivamente, tomadas
de poblaciones cuya variable de inters tiene una distribucin normal, entonces un intervalo al 100(1 - )% de

(a s2 s12 2 12 b s2 s12 )
2 2 2
22
confianza para 12 est dado por:

En donde a y b son los cuantiles inferior y superior de una distribucin F tales que:

a 1 / f1 ;n2 1;n1 1 y b f1 ;n1 1;n2 1


2 2

3.4 PRUEBA DE HIPTESIS


3.4.1 HIPTESIS ESTADSTICAS
Una hiptesis estadstica es una afirmacin respecto a alguna caracterstica de una poblacin. Contrastar una
hiptesis es comparar las predicciones con la realidad que observamos. Si dentro del margen de error que nos
permitimos admitir, hay coincidencia, aceptaremos la hiptesis y en caso contrario la rechazaremos. La veracidad o
falsedad de una hiptesis estadstica nunca es conocida con certeza, a menos que se analice la poblacin completa.
Aun cuando es frecuente utilizar los trminos aceptar o rechazar, es importante comprender que rechazar una
hiptesis significa concluir que es falsa, mientras que aceptar una hiptesis solamente implica que no se tiene
suficiente informacin como para creer otra cosa.
La hiptesis emitida se suele designar por Ho y se llama Hiptesis nula porque parte del supuesto que la diferencia
entre el valor verdadero del parmetro y su valor hipottico es debida al azar, es decir no hay diferencia.
Llamaremos hiptesis nula, Ho, a la hiptesis que se contrasta. El nombre de nula proviene del hecho de que Ho
representa la hiptesis que mantendremos a no ser que los datos indiquen su falsedad, y debe entenderse, por tanto,
en el sentido de neutra. La hiptesis Ho nunca se considera probado, aunque puede ser rechazada por los datos.
El rechazo de Ho conduce a la aceptacin de la hiptesis alternativa, H1. La hiptesis contraria se designa por H1 y se
llama Hiptesis alternativa.

84
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS
El contraste de hiptesis no establece la verdad de la hiptesis, sino un criterio que nos permite decidir si una
hiptesis se acepta o se rechaza, o el determinar si las muestras observadas difieren significativamente de los
resultados esperados. En este proceso podemos incurrir en dos tipos de errores segn sea la situacin real y la
decisin que tomemos.
Si rechazamos una hiptesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la
aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una
cuestin sencilla, un tipo suele ser ms grave que otro y los intentos de disminuir uno suelen producir el aumento del
otro. La nica forma de disminuir ambos a la vez es aumentar el tamao de la muestra.

Ho verdadera Ho falsa

Decisin incorrecta
Decisin correcta
DECISIN: Mantener Ho
Error de tipo II
Decisin incorrecta
Decisin correcta
DECISIN: Rechazar Ho
Error de tipo I

La probabilidad de cometer un error de tipo I es el NIVEL DE SIGNIFICACIN , la probabilidad de cometer un error


de tipo II depende del verdadero valor de y del tamao de la muestra.
Ejercicio 1: Compruebe que la probabilidad de cometer un error de tipo II disminuye al aumentar el tamao de la
muestra (n).
Ejercicio 2: Compruebe tambin lo que ocurre al variar la diferencia entre la media hipottica de la poblacin (o) y la
verdadera ().

3.4.3 CRITERIOS DE DECISIN


Puesto que la eleccin entre H0 y H1 ha de hacerse basndose en datos provenientes de una muestra, es necesario
escoger una funcin de las n observaciones de la muestra que permita tomar esta decisin. A tal funcin de la
muestra se le llama estadstica de prueba. En general, la estadstica de prueba debe ser una cuya distribucin
muestral sea conocida en el supuesto que la hiptesis nula es cierta. La estadstica de prueba generalmente se
obtiene a partir del estimador convencional del parmetro previsto en H0.

El conjunto donde toma valores la estadstica de prueba, se divide en dos subconjuntos, la regin de rechazo o
regin crtica , R, que contiene los resultados menos favorables de H0, y la regin de aceptacin, A, que contiene
los resultados ms favorables a H0. Luego si el valor calculado de la estadstica de prueba pertenece a R,
rechazamos H0, en cambio si pertenece a A, aceptamos H0. El valor (o los valores) de la estadstica de prueba que
separa (o separan) a la regin R de la regin A se llama valor crtico (o valores crticos).

3.4.4 CONTRASTES UNILATERALES Y BILATERALES


Los contrastes pueden ser unilaterales o bilaterales (tambin llamados de una o dos colas) segn establezcamos
las hiptesis, si las definimos en trminos de igual y distinto estamos ante una hiptesis unilateral, si suponemos una
direccin (en trminos de mayor o menor) estamos ante uno unilateral.

A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es unilateral, tal como:

H0: = 0 versus H1: > 0 o bien, H0: = 0 versus H1: < 0

Se le denomina prueba de una cola o unilateral.

La regin crtica de la hiptesis alternativa H1: > 0 se ubica por completo en la cola derecha de la distribucin,
mientras que la regin crtica de la hiptesis alternativa H 1: < 0 se ubica por completo en la cola izquierda. En
cierto sentido el smbolo de desigualdad seala la direccin en la cual se ubica la regin crtica.

85
A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es bilateral, tal como:

H0: = 0 versus H1: 0

Se le denomina prueba de dos colas o bilateral, ya que la regin crtica est dividida en dos partes igualmente
probables ubicadas en cada cola de la distribucin de la estadstica de prueba.
3.4.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS

Se trata pues, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o
rechazar una hiptesis previamente emitida, sobre el valor de un parmetro desconocido de la poblacin. El mtodo
que seguiremos es el siguiente:
1. Formulacin de las hiptesis.
2. Elegir un nivel de significacin
3. Escoger la estadstica de prueba.
4. Establecer el criterio en que se basar la decisin. Construir la zona de aceptacin, intervalo fuera del cual
slo se encuentran el 100% de los casos ms raros. A la zona de rechazo la llamaremos regin crtica, y su
rea es el nivel de significacin.
5. Verificar la hiptesis extrayendo una muestra cuyo tamao se ha decidido en el paso anterior y obteniendo de
ella el correspondiente estadstico (media o proporcin en nuestro caso).
6. Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptacin se acepta la hiptesis y si no se
rechaza. (VER LIBRO: YALUN CHOU ANALISIS ESTADISTICO)
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN CON LOS PRINCIPALES CONTRASTES)

Estudiaremos ahora hiptesis sobre la media, la varianza y sobre la proporcin en una poblacin. Para el caso de
dos poblaciones estudiaremos la comparacin de medias, comparacin de varianzas y comparacin de proporciones.
En cada caso se trabaja con un contraste bilateral y otro unilateral. Los contrastes unilaterales son de distinta
direccin en cada ejemplo, pero el mtodo a seguir es anlogo para ambos.

3.4.6.1 CASO UNA POBLACIN


A. Contraste de hiptesis para la media

A.1 Contraste bilateral


Ejemplo 1. Se sabe que la desviacin estndar de las notas de cierto examen es 2,4. Para una muestra de 36 estudiantes se
obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, a un nivel
de significacin de 0,05?
Ejemplo 2. En otra muestra de 81 estudiantes se obtuvo una nota media de 6,2. Se confirma la hiptesis anterior a un nivel de
significacin de 0,01?

A.2 Contraste unilateral


Ejemplo 3. Se cree que la altura media de los habitantes de cierta poblacin es como mucho 170 cm, con una desviacin tpica de
8 cm. En una muestra de 100 personas se observa una altura media de 172 cm. Podemos aceptar la hiptesis con un nivel de
significacin del 5%?. Si el nivel de significacin fuese 0,01 se aceptara la hiptesis anterior?

B. Contraste de hiptesis para la proporcin

Queremos contrastar una hiptesis acerca de la proporcin en una poblacin a partir de los datos extrados de una
muestra. Procederemos como en el apartado anterior:
B.1 Contraste bilateral
Ejemplo 4. Se realizan 200 lanzamientos de una moneda y salen 120 caras, podemos aceptar que la moneda no
est trucada con un nivel de significacin del 5%?. Aceptaramos que la moneda no est trucada con =0,01?
Ejemplo 5. Un partido poltico afirma que obtendr el 60% de los votos en las prximas elecciones. Encuestados
1000 votantes afirman su intencin de votar a dicho partido 540. Se puede aceptar la hiptesis del partido con un
nivel de significacin del 5%?

86
B.2 Contraste unilateral
Ejemplo 6.Una mquina fabrica piezas de precisin y se garantiza que la proporcin de piezas correctas producidas
es al menos del 97%. Un cliente recibe un lote de 200 piezas y aparecen 8 piezas defectuosas; a un nivel de
confianza del 95% rechazar el lote por no cumplir las condiciones de la garanta?
Si la muestra hubiese sido de 300 piezas con 285 correctas, se aceptara el lote al 10% de significacin?
C. Contraste de hiptesis para la varianza de una poblacin
Ejemplo 7. El peso de 12 latas de cerezas, en onzas, es:
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La desviacin estndar especificada es de 1/2 onza. Se cumple esta especificacin? Use el nivel de significacin
del 1% y una prueba bilateral. (Nota: 1 onza = 28,35 gramos)

3.4.6.2 Caso dos poblaciones


D. Contraste de hiptesis para la diferencia de medias
Ejemplo 8.Un inversionista est considerando dos lugares alternativos para un centro comercial regional. Como los
ingresos de los hogares de la comunidad son una consideracin importante en esa seleccin, desea probar la
hiptesis nula de que no existe diferencia entre el ingreso promedio por hogar en las dos comunidades. Consistente
con esta hiptesis supone que la desviacin estndar del ingreso por hogar es tambin igual en las dos
comunidades. Para una muestra de n = 30 hogares de la primera comunidad, encuentra que el ingreso diario

promedio es
x1 = $35.500, con desviacin estndar muestral de s1 = $1.800. Para una muestra de n2 = 40 hogares

de la segunda comunidad,
x2 = $34.600 s2 = $2.400. Probar la hiptesis nula en el nivel de significacin del 5%.

87
3.5 APLICACIONES EN EL MBITO DE LA INGENIERA
REFORZAMIENTO ESTIMACIN
1. Se sabe que la duracin, en horas, de una ampolleta utilizada a la luz testigo, tiene una distribucin
aproximadamente normal, con una desviacin estndar de = 25 horas. Se toma una muestra aleatoria de 20
ampolletas, la cual arroja una duracin promedio de 1.014 horas.
a) Construya un intervalo de confianza bilateral del 95% para la duracin promedio.
b) Estudie el error de estimacin para niveles de confianza del 95% y del 99%. Qu relacin existe entre
longitud del intervalo, precisin de la estimacin y nivel de confianza?.
c) Supngase que se desea una confianza del 95% en que el error en la estimacin de la duracin promedio sea
menor que 5 horas. Qu tamao de muestra debe utilizarse?
d) Supngase que se desea el ancho total del intervalo de confianza bilateral sea de seis horas, con una
confianza del 95%. Qu tamao de muestra debe emplearse para este fin?
2. Una mquina produce piezas metlicas de forma cilndrica para ser utilizadas en la fabricacin de discos duros
para computadoras. Se toma una muestra de las piezas y los dimetros resultan de: 1,01, 0,97, 1,03, 1,04,
0,99, 1,01, y 1,03 centmetros, respectivamente:
a) Obtenga un intervalo de confianza de 99% para el dimetro medio de las piezas producidas por la mquina,
suponiendo una distribucin aproximadamente normal.
b) Estudie el error de estimacin para niveles de confianza del 95%. Qu relacin existe entre longitud del
intervalo, precisin de la estimacin y nivel de confianza?
c) Supngase que se desea que el error en la estimacin del dimetro medio de las piezas sea menor que 0.05
centmetros, con una confianza del 95%. Cul debera ser en este caso el tamao de la muestra?.
3. Una muestra aleatoria de tamao n1 = 16 que se tom de una poblacin con una desviacin estndar 1 = 5
tiene una media x 1 = 80. Una segunda muestra aleatoria de tamao n2 = 25 tomada de una poblacin normal
diferente con una desviacin estndar 2 = 3, tiene media x 2 = 75. Encuentre un intervalo de confianza del 95%
para 1 - 2 . De acuerdo con el intervalo hallado. hay evidencia de que las dos medias son iguales?
4. Una compaa tiene dos departamentos que producen el mismo producto. Se tiene la sensacin de que las
producciones por hora son diferentes en los dos departamentos. Al tomar una muestra aleatoria de horas de
produccin en cada departamento se obtuvieron los datos siguientes:
Departamento I Departamento II

Tamao de muestra n1 = 64 n2 = 49

Media muestral x1 = 100 unid x2 = 90 unid

Se sabe que las varianzas de las producciones por hora son 12 = 256, 22 = 196 para los dos
departamentos respectivamente. Obtenga e interprete un intervalo del 95% para la verdadera diferencia de la
produccin media. Qu puede decirse de la sospecha que exista acerca de la diferencia entre la produccin
promedio?
5. Se compara la resistencia de dos tipos de rosca de tornillo, utilizados en el armado de computadores, 50 piezas
con cada tipo de rosca se prueban en condiciones similares. Las piezas de la marca A tienen una resistencia
media a la tensin de 78,3 kg., con una desviacin estndar de 5,6 kg., en tanto que las de la marca B tienen
una resistencia media a la tensin de 87,2 g., con una desviacin estndar de 6,3 kilogramos.
a) Determine un intervalo de confianza de 95% para la diferencia de las medias poblaciones.
b) Con base en los resultados obtenidos en (a), Qu marca recomendara comprar?. Justifique.
6. Durante un periodo de 15 das se tomaron los tiempos gastados por dos estudiantes para transportarse de sus
casas a la universidad. Las medias y varianzas fueron:
x1 = 40,33 x2 = 42,54

2 2
s 1
= 1,53 s 2
= 2,96

a) Calcule e interprete un intervalo de confianza del 95% para la diferencia de medias.


b) De acuerdo con el intervalo hallado. qu puede decirse de la igualdad de las medias?
c) Calcule e interprete un intervalo del 90% de confianza para el verdadero cociente de varianzas.
d) De acuerdo con el intervalo hallado. qu puede decirse de la igualdad entre las varianzas poblacionales?.

88
7. Suponga que la Escuela de Ingeniera Civil en Informtica debe comprar tubos para iluminar la sala de
computacin. Para ello tiene dos alternativas comprar tubos con filamento tipo A o con filamento tipo B. Con el
objetivo de tener mayores antecedentes, para tomar la decisin, someti a prueba 10 tubos de cada tipo,
obteniendo las siguientes duraciones en horas:

A: 1.614, 1.094, 1.293, 1.643, 1.466, 1.270, 1.340, 1.380, 1.028, 1.997

B: 1.383, 1.138, 1.092, 1.143, 1.017, 1.061, 1.627, 1.021, 1.711, 1.065

a) Suponiendo que las varianzas son iguales, encontrar un intervalo de confianza para la diferencia de medias.
b) Suponiendo que las varianzas son desiguales, encontrar un intervalo de confianza para la diferencia de
medias.
c) Con base en los resultados obtenidos en (a) y (b), qu tipo de tubo recomendara comprar usted, el con
filamento tipo A o el con filamento tipo B?. Justifique.

8. Un cientfico de la computacin estn investigando la utilidad de dos lenguajes de diseo para mejorar la tarea
de programacin. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen
una funcin estndar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta
tarea. Los datos obtenidos son los siguientes:

TIEMPO

Programador Lenguaje de Diseo 1 Lenguaje de Diseo 2

1 17 18

2 16 14

3 21 19

4 14 11

5 18 23

6 24 21

7 16 10

8 14 13

9 21 19

10 23 24

11 13 15

12 18 20

a) Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificacin promedio.
b) Existe algo que indique una preferencia por alguno de los lenguajes?.
9. Un fabricante de calculadoras electrnicas est interesado en estimar la fraccin de unidades defectuosas
producidas. Se toma una muestra aleatoria de 800 calculadoras, de las cuales 10 resultan defectuosas. Calcule
un intervalo de confianza superior del 99% para la fraccin de calculadoras defectuosas.
10. Se lleva a cabo un estudio para determinar el porcentaje de hogares en Valdivia donde hay al menos un
computador. De qu tamao debe ser la muestra si se desea tener una confianza del 99% de que el error al
estimar esta cantidad es menor que 0,017?.
11. El jefe de personal de una empresa desea realizar una encuesta para determinar la proporcin de trabajadores
que est a favor de un cambio en el horario de trabajo. Como es imposible consultar a los N = 500 trabajadores
en un lapso razonable, procede a escoger aleatoriamente cierto nmero de trabajadores para entrevistarlos;
determine el nmero de trabajadores que debe entrevistarse si desea que la proporcin estimada presente un
error mximo del 5% y un nivel de confianza del 95%.

89
12. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin. Una muestra aleatoria
de 100 unidades provenientes de la lnea 1 contiene 10 que son defectuosas, mientras que una muestra aleatoria
de 120 unidades de la lnea 2 tiene 25 que son defectuosas.
a) Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de productos defectuosos
producidos por las dos lneas.
b) Qu conclusiones pueden obtenerse de los resultados obtenidos en (a)?
13. Considere los datos del problema 2. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 95% para 2 ?
b) Un intervalo de confianza inferior del 95% para 2 ?
c) Un intervalo de confianza superior del 95% para 2 ?
14. Considere los datos del problema 4. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 90% para 21 /22
b) Un intervalo de confianza bilateral del 95% para 21 /22 . Compare el ancho de este intervalo con el del
obtenido en la parte (a).
c) Un intervalo de confianza inferior del 90% para 21 /22
d) Qu conclusiones se podran obtener, en el contexto del problema, de los resultados obtenidos en (a), (b) y
(c)?
Ejercicios de Comprensin

REFORZAMIENTO PRUEBA DE HIPTESIS


Seccin 1:
31. Definir los siguientes conceptos tan completamente como sea posible:
a) Hiptesis estadstica
b) Prueba de hiptesis
c) Regin critica
d) Nivel de significacin
e) Hiptesis nula
f) Hiptesis alternativa
32. En qu situaciones se hace una prueba de dos colas?. Cmo se enuncia la hiptesis alternativa en una prueba de dos
colas?.
33. En qu casos se hace una prueba de una cola? Cmo se enuncia la hiptesis alternativa en una prueba de una cola?.
34. Distinga entre los siguientes conceptos:
a) Error de tipo I y Error de tipo II
b) Regin de rechazo y regin de aceptacin.
c) Estimacin estadstica y prueba de hiptesis.
35. Son aditivos los errores de tipo I y de tipo II, es decir, se verifica que = 1? Explique.
36. Cmo se relacionada el error de Tipo I con el de Tipo II?. Explique completamente.
37. Si X es N ( 1 2 ) y una muestra de n observaciones da una media x , y si se desea contrastar la hiptesis nula H0 : =
0 con las alternativas:
a) Ha : > 0
b) Ha : < 0
c) Ha : 0
Cul es la regla de decisin en cada uno de los casos?

38. Se admite que la velocidad promedio de las mecangrafas de una compaa es de 55 palabras por minuto. El jefe de personal
afirma que un programa de adiestramiento instituido hace poco ha aumentado la velocidad de las mecangrafas. Formule la
hiptesis nula y la hiptesis alternativa.
39. La resistencia a la traccin de los alambres de acero es cuando ms de 1.000 libras. El fabricante asegura que un nuevo
proceso de produccin ha aumentado la resistencia de los alambres. Formule la hiptesis nula y la hiptesis alternativa. Si se
sabe que la resistencia a la traccin es exactamente de 1.000 libras. cules son las hiptesis nula y alternativa?
Seccin 2:
40. Una fbrica de pilas garantiza que su producto tiene una vida media de 1.000 horas y una desviacin estndar de 50. Pruebe la
hiptesis de que = 1.000 en contraposicin de la alternativa 1.000 horas, si una muestra aleatoria de 30 bateras
tiene una duracin promedio de 950 horas. Utilice
= 5%.
41. Una muestra aleatoria de 36 refrescos de una mquina despachadora tiene un contenido promedio de 19.8 decilitros, con una
desviacin estndar de 1.3 decilitros. Pruebe la hiptesis de = 20 decilitros en contraposicin a la hiptesis alternativa
< 20. Use el nivel de significacin = 1%. Calcule el valor p de significacin.
42. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4,22, 3,99, 5,41, 4,23, 4,29, 4,62, 4,55,
4,13, 4,23, 4,48. Evidencian estos datos que el contenido promedio de grasa en los hombres es menor de 4,46? Considere
= 5% y tome = 0,4. Calcule el valor p.

90
43. Se espera que dos operarios produzcan en promedio el mismo nmero de unidades terminadas en el mismo tiempo. Los
siguientes datos dan los nmeros de las unidades terminadas para ambos trabajadores en una semana de trabajo.
Operador 1 Operador 2

10 12

9 16

16 16

14 15

11 14

Si supone que el nmero de unidades terminadas diariamente por los trabajadores son variables aleatorias independientes
distribuidas normalmente con varianzas iguales, puede concluirse alguna diferencia entre las medias? Tome = 5%.
44. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194, 202, 335, 515, 184, 369, 142, 552,
200, 344, 421, 590, 301, 439. podemos concluir que la distancia promedio en que se aleja es mayor de 338?. Suponga que
= 149 y tome = 5%.
45. Pruebe la hiptesis segn la cual el contenido promedio de un aceite comestible es de 5 litros. Si los contenidos de una muestra

aleatoria de 10 recipientes son: 5,2, 4,7, 5,3, 5,1, 4,8, 4,9, 5,4, 5,3, 4,8. Utilice un nivel de significacin de = 1% y suponga
que la distribucin de los contenidos es normal. Calcule el valor p para dicho nivel.
46. Se desea comparar dos mtodos para ensear estadstica. Para ello se tomaron 10 pares de estudiantes del mismo
nivel de aprovechamiento en estadstica. De cada par a uno se asigna al azar al mtodo A y el otro al mtodo B.
Despus de un periodo de cuatro semanas, cada estudiante se someti a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10

Mtodo A 36 37 41 42 36 35 42 33 40 38

Mtodo B 35 35 42 41 36 34 40 31 39 37

Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de aprovechamiento de los mtodos
son distintos? Sea = 5%.

47. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para responder a un examen de estadstica.
Grupo Tiempo mnimo

1 100 84 96 107 89

2 79 163 95 132 91 85

Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo de duracin promedio para
responder el examen del grupo 1 es mayor que el promedio del grupo 2. Tome = 2%.
48. Los siguientes datos corresponden a los dimetros de dos muestras de arandelas producidas por dos mquinas
distintas.
Muestra 1 0,91 1,82 1,46 1,95 1,57 1,61 1,32

Muestra 2 1,03 1,99 1,65 2,07 1,66 1,76 1,28 2,01

Considere que los dimetros se distribuyen normalmente y que las varianzas respectivas son 12 = 0,12 y 22
= 0,13. Evidencian estos datos que los dimetros promedios de las arandelas producidas por las dos mquinas
son iguales? Tome = 5%.

91
49. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus
pesos al comienzo y al final de la dieta. Estos se muestran en la tabla que sigue:
Individuo 1 2 3 4 5

Peso inicial 295 305 323 299 310

Peso final 251 259 267 265 263

Se puede concluir segn estos datos que la dieta es efectiva? Tome = 10%.

50. Suponga que se tienen dos poblaciones X, Y independientes, distribuidas normalmente y de igual varianza. De
cada una de estas poblaciones se extrae una muestra. En la tabla que sigue se dan los resultados.
Poblacin Media Desviacin estndar Tamao de muestra

X 4.52 1,4 5

Y 5,31 1,95 23

Se puede concluir, a partir de estos datos, que y x es mayor de 1? Tome = 5%.

51. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseanza secundaria media en una ciudad es de
225. Una muestra aleatoria de 25 estudiantes arroja un cociente intelectual de 106. Se puede concluir a partir de estos datos
que el cociente intelectual medio de los estudiantes es superior a 100? Tome = 5%.
52. Una muestra aleatoria de tamao n1 = 25, tomada de una poblacin normal con desviacin estndar de 1 = 4,8, tiene una

media x1 = 75. Una segunda muestra aleatoria de tamao n2 = 36, tomada de una poblacin normal diferente con desviacin

2 = 3,5, tiene media x2


estndar = 70. Pruebe la hiptesis de 1 2 , en contraposicin a la alternativa 1 2 .
Tome 5% .
53. Se conduce una prueba sobre la potencia de friccin producida por ciertas mquinas lubricadas con dos aceites comerciales.
Los resultados fueron:
Marca 1 Marca 2

n1 = 9 n2 = 11

x1 10,4 x2 = 14,1

S12 1,00 S 22 0,9


Considere que se trata de poblaciones normales con igual varianza. Evidencian estos datos que las potencias
promedios son iguales?. Tome 2% .
Seccin 3:
54. En una encuesta de 10.000 electores tomados al azar entre todos los votantes de una ciudad se encuentra que 5.180 estn a
favor de cierto candidato. Probar la hiptesis de que la proporcin de todos los electores que estn a favor del candidato en
mencin es igual o menor al 50%. Sea 5%.
55. Se afirma que un dispensador de gaseosas est fuera de control si la varianza de los contenidos excede de 1,0 decilitros. Si
una muestra aleatoria de 16 vasos despachados por este dispensador dio una varianza muestral de 1,9 decilitros. qu puede
decirse del mismo acerca de si est bajo control? Sea 5% .
56. Con referencia al problema 49 de la Seccin 2. Proporcionan estos datos una igualdad entre las varianzas?.
57. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribucin normal con varianza de 1,3 miligramos.
Pruebe la hiptesis de que 2 1,3. Si una muestra aleatoria que 8 de estos cigarrillos tiene una desviacin estndar

S = 1,8. Use 5%.


58. En un estudio diseado para conocer los efectos secundarios de dos medicamentos a 100 animales se les administro el
medicamento A y a otros 100 el medicamento B. De los 100 que recibieron el medicamento A, 20 mostraron efectos

92
secundarios mientras que 15 de los que recibieron el medicamento B reaccionaron en forma similar. Evidencian estos datos
una diferencia entre las dos proporciones de los que tuvieron efectos secundarios? Sea 5%.
59. Con referencia al problema 51 de la Seccin 2. proporcionan estos datos una evidencia de que 2 0,16 ?. Tome

5%.
60. Se cree que al menos el 60% de los habitantes de una gran ciudad est a favor del adelanto de la hora local en 30 minutos. Se
tom una muestra de 200 habitantes de esta ciudad y 110 estuvieron de acuerdo en el adelanto. Qu puede decirse, segn
estos datos, del porcentaje real de los que estn a favor? Tome = 2%.
61. Se compara el nivel de colesterol en la sangre de pacientes seleccionados al azar y sometidos a dos dietas distintas; una baja
en grasa y la otra normal. Las varianza y tamaos de muestra se dan a continuacin.

Baja en grasas
S12 198 n1 19

Normal
S22 435 n2 24

Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad de las dos poblaciones de donde
se obtuvieron las muestras?. Tome 10%.
62. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de casa de 200 consultadas prefieren la
marca A; y que 29 de 150 la marca B. Es esto evidencia suficiente para sostener que la marca A es preferida a la B ?. Sea
1%.
63. Se realiz una encuesta para determinar la diferencia que puede existir entre las fracciones de casados y solteros entre 20 y 30
aos que fuman. Se entrevistaron 200 personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman.
Contienen los datos suficiente evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para las
dos poblaciones?. Sea 10%.
64. Dos mquinas diferentes A y B se utilizan para producir pernos idnticos que se suponen de 2 pulgadas de longitud. Se toman
dos muestras aleatorias de 25 pernos cada una de la produccin de ambas mquinas y arrojan dos varianzas S12 0,03
pulgadas para la mquina A, y S12 = 0,04 pulgadas para la mquina B. Evidencian estos datos que las varianzas son iguales?

Tome 5% .
65. La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado
grande. Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas.
Pruebe la hiptesis de que el proceso conserva an la varianza 2 4. sea 1%.

93
ANEXO 1
Tabla 1: Estadsticas pivotales para la construccin de intervalos de confianza relacionados con medias, varianzas y
proporciones.
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL

x-
Z N(0,1)

con 2 conocido n


x-
Z N(0,1)
S
2 desconocido y n > 30
n

x-
t t(n - 1)
S
2 desconocido y n < 30 n

1 - 2
(x - x ) - ( - )
con 1 y 2 conocidos
2 2 Z 1 2 1 2 N (0,1)
2 2
1 2
n n
1 2
1 - 2
(x - x ) - ( - )
Z 1 2 1 2 N (0,1)
con y desconocidos; muestras
2 2 2
1 2 S S2
1 2
aleatorias independientes de tamaos n1 y n2, n n
1 2
ambos mayores o iguales que 30 (n1> 30 y n2 >
30)

1 - 2 (x - x ) - ( - )
t 1 2 1 2 t(n n - 2)
1 1 1 2
con 1 y 2 desconocidos pero
2 2
S
p n n
aproximadamente iguales. Muestras aleatorias 1 2
(n1 1)S12 (n 2 1)S22
pequeas independientes de tamaos n1 y n2 S2p
n1 n 2 2
(n1< 30 y/o n2 < 30)

1 - 2 (x - x ) - ( - )
S S
2

t 1 2 1 2 t( ) 2 2

1 2

S2 S2 n n
con 1 y 2 desconocidos y distintos.
2 2
1 2 1 2

S S
2 2
2 2

Muestras aleatorias pequeas independientes n n 1 2

1 2 n n 1
2

de tamaos n1 y n2 (n1< 30 y/o n2 < 30 n 1


1
n 1
2

D d-
t D t(n -1)
Muestras pareadas S2
d
n

94
Tabla 1: Estadsticas pivotales para la construccin de intervalos de confianza relacionados con medias,
varianzas y proporciones (Continuacin).
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL

(n - 1) S2
2 2 (n 1)
2
2

2 2
S
F 2 1 F(n 1, n 1)
12 / 22 2 2
S
1 2

1 2
p - p
Z N(0,1)
p (1 p)
p
n

(p - p ) (p - p )
Z 1 2 1 2 N(0,1)
p1 p 2 p q p q
1 1 2 2
n n
1 2

95
ANEXO 2
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones
H0 VALOR DE LA ESTADSTICA DE H1 REGIN CRTICA
PRUEBA

= 0 < 0 z < -z1-


x-
Z N(0,1)
> 0 z > z1-
n
0 z < -z1-/2 o z > z1-/2

= 0 < 0 z < -z1-


x-
2 desconocido y n 30 Z N(0,1) > 0 z > z1-
S
n
0 z < -z1-/2 o z > z1-/2

= 0 < 0 t < -t1-


x-
2 desconocido y n < 30 t t(n -1) > 0 t > t1-
S
n 0 t < -t1-/2 o t > t1-/2

1 - 2 = d0

1 - 2 < d 0
con 1 y 22
2 z < -z1-
conocidos (x - x ) - ( - )
Z 1 2 1 2 N (0,1)
2 2
1 2 1 - 2 > d 0 z > z1-
n n
1 2

1 - 2 d0 z < -z1-/2 o z > z1-/2

1 - 2 = d0

1 - 2 < d 0
con 1 y 22
2 z < -z1-
desconocidos; muestras
(x - x ) - ( - )
aleatorias independientes de tamaos n1 Z 1 2 1 2 N (0,1)
y n2, ambos mayores o iguales que 30 S 2 S2
(n1> 30 y n2 > 30) 1 2 1 - 2 > d 0 z > z1-
n n
1 2

1 - 2 d0 z < -z1-/2 o z > z1-/2

1 - 2 = d0 t < -t1-
(x - x ) - ( - )
t 1 2 1 2 t(n n - 2) 1 - 2 < d 0
con 1 y 22
2
desconocidos pero 1 1 1 2
Sp
aproximadamente iguales. Muestras n n t > t1-
aleatorias pequeas independientes de 1 2
tamaos n1 y n2 (n1< 30 y/o n2 < 30) 1 - 2 > d 0
(n 1)S (n 1)S2 2

S
2 1 1 2 2
t < -t1-/2 t > t1-/2
n n 2
p

1 2

1 - 2 d0

96
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones (Continuacin).
t < -t1-

1 - 2 = d0 (x - x ) - ( - ) 1 - 2 < d 0
t 1 2 1 2 t( )
S S2
2
con 1 y 22 t > t1-
2
desconocidas y distintas. 1 2
Muestras aleatorias pequeas n n 1 - 2 > d 0
1 2 S S 2 2
2

independientes de tamaos n1 y n2 (n1< 1 2


30 y/o n2 < 30 n n 1 2

S S
2 2
2 2


1 2
1 - 2 d0 t < -z1-/2 o t > t1-/2
n n
1 2

n 1 n 1
1 2

D < d 0 t < -t1-

d-
t D t(n -1)
D = d0 2 D> d 0 t > t1-
S
d
Muestras pareadas n D d0 t < -t1-/2 o t > t1-/2

2 02 2 12
2 02 (n - 1) S2
2
2
2 (n 1) 2 02 2 12

2 02 2 12 o 2 12
2

2

12 22 f 2 f12
2 2
S
F 2 1 F(n 1, n 1) 12 22 f 2 f12
2
1
2
2 2 2 1 2
S
1 2 12 22 f 2 f12 2 o f 2 f12 2

p < p0 z < -z1-

p = p0 Z
p - p
N(0,1) p > p0 z < -z1-
p (1 p)
n z < -z/2 z > z/2
p p0

(p - p ) (p - p ) p1 p2 < d0 z < -z1-


Z 1 2 1 2 N(0,1)
p q p q
p1 p2 = d0 1 1 2 2 p1 p2 > d0 z > z1-
n n
1 2
p1 p2 d0 z < -z1-/2 o z > z1-/2

97

Potrebbero piacerti anche