Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
BAIN 052
ESTADSTICA Y PROBABILIDADES PARA INGENIERA
APUNTES DE CLASES
Autor: Prof. Dr. Vctor Figueroa Arcila
Versin 4.02
AD IV ANLIS
Profesores Asignatura
Carlos Gonzlez Riffo
Luis Ojeda Silva
Marzo 2016
Unidad de
Aprendizaje III
INFERENCIA
ESTADSTICA
3.1 INTRODUCCIN 76
3.3 ESTIMACIN 79
3.3.1.3 Aplicaciones 81
3.4 PRUEBA DE HIPTESIS (PRIMERA PARTE) 84
3.4.1 HIPTESIS ESTADSTICAS 84
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS 85
3.4.3 CRITERIOS DE DECISIN 85
3.4.4 CONTRASTES UNILATERALES Y BILATERALES 85
3.4.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS 86
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN 86
CON LOS PRINCIPALES CONTRASTES)
75
3.1 INTRODUCCIN
A menudo necesitamos estudiar las propiedades de una determinada poblacin, pero nos encontramos con el
inconveniente de que sta es demasiado numerosa como para analizar a todos los individuos que la componen. Por
tal motivo, recurrimos a extraer una muestra de la misma y a utilizar la informacin obtenida para hacer inferencias
sobre toda la poblacin. La Inferencia estadstica persigue entonces la obtencin de conclusiones sobre toda una
poblacin, basndose en la observacin de una muestra obtenida de ella. Estas estimaciones sern vlidas slo si la
muestra tomada es representativa de la poblacin. As, el muestreo es una tcnica que utilizamos para
asegurarnos que las muestras seleccionadas de la poblacin sean realmente representativas. El muestreo puede
hacerse con o sin reposicin, y la poblacin de partida puede ser infinita o finita. Una poblacin finita en la que se
efecta muestreo con reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos, una
poblacin muy grande puede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a una poblacin
de partida infinita o a muestreo con reposicin.
Caso 2. Si tenemos una poblacin donde la variable bajo estudio X NO tiene una distribucin normal, pero el
tamao de la muestra n es mayor o igual que 30 (n>30), entonces aplicando el llamado Teorema del lmite central
la distribucin muestral de la media se aproxima tambin a la distribucin normal anterior.
2 (X )
X N, n Z N(0,1)
n
Caso 3. El resultado del Caso 2 sigue siendo vlido en aquellos casos en que no se conozca la varianza poblacional
2 y n> 30. En tales casos es posible utilizar la varianza muestral S 2, en reemplazo de la varianza poblacional 2. El
resultado quedara como:
2 (X )
X N, Sn Z N(0,1)
S
n
76
Caso 4. Si en el Caso 3, el tamao de la muestra es menor a 30 (n < 30), entonces la estadstica,
(X )
t tiene una distribucin t con (n-1) grados de libertad.
S
n
Comentario: Los resultados anteriores son aplicables tambin a la estadstica suma, es decir, de acuerdo al
n
teorema del lmite central la distribucin de X i es aproximadamente normal, con media n y varianza n2, sin
i 1
importar la distribucin de la poblacin.
Ejemplo 1. Suponga que las notas obtenidas en la primera prueba parcial de la asignatura siguen una distribucin
normal con una media igual a 5,8 y una desviacin estndar, , igual a 2,4. Encuentre la probabilidad de que la
media de una muestra tomada al azar de 16 estudiantes est comprendida entre 5 y 7.
Solucin: Como la variable NOTAS tiene una distribucin N(5,8; 2,4), con n=16, la distribucin muestral de la media
se distribuye N(5,8; 0,6). Si x es la media de la muestra hemos de calcular la probabilidad
(p p)
p N p, pq
n Z N(0,1)
pq
n
Ejemplo 2. Si tiramos una moneda correcta 100 veces, cul es la probabilidad de que obtengamos ms de 55
caras?.
Solucin: En una moneda correcta la proporcin de caras es 0,5, con lo que p=0,5; q=0,5 y n=100. Entonces la
proporcin muestral tiene una distribucin muestral N(0,5; 0,052). Si llamamos p a la proporcin en la muestra
n
2
X i X tiene una distribucin Chi-cuadrado con n-1 grados de libertad.
i 1 (n 1)S2
2 2
77
3.2.2. Muestreo a partir de dos poblaciones
Supongamos ahora que estamos estudiando el comportamiento de una variable en dos poblaciones independientes.
Supongamos adems que en ambas poblaciones dicha variable tiene una distribucin normal con parmetros
distintos y habitualmente desconocidos, es decir en la poblacin 1 la variable tiene una distribucin N(1,
12 ) y en la
12 22 (X X 2 ) ( 1 2 )
(X1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 12 22
n1 n2
Caso 2. Si las distribuciones de la variable a nivel poblacional NO son normales y las varianzas son conocidas,
entonces si los tamaos muestrales son ambos mayores o iguales a 30 (n1 30 y n2 30), la diferencia de las
medias muestrales se aproximan a una distribucin normal.
n 1 , n2 12 22 (X X 2 ) ( 1 2 ) n1 , n2
(X1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 11 22
n1 n2
Caso 3. Si las varianzas poblacionales son desconocidas y los tamaos muestrales son ambos mayores o iguales a
30 (n1 30 y n2 30), entonces el resultado anterior sigue siendo vlido, es decir, la diferencia de las medias
muestrales se aproximan a una distribucin normal, donde las varianzas poblacionales se reemplazan por las
varianzas muestrales.
n1 , n2 S12 S 22 (X X 2 ) ( 1 2 ) n1 , n2
(X 1 - X 2 ) N( 1 - 2 , ) Z 1 N (0,1)
n1 n 2 S 11 S 22
n1 n 2
Caso 4. Si las varianzas poblacionales son desconocidas, pero aproximadamente iguales, y los tamaos muestrales
son pequeos (n1 < 30 y/o n2 < 30), entonces la estadstica,
Caso 5. Si las varianzas poblacionales son desconocidas y desiguales, y los tamaos muestrales son pequeos
(n1 < 30 y/o n2 < 30), entonces la estadstica, 2 2
2
S1 S 2
n1 n2
(X - X ) - ( - )
t 1 2 1 2
S2 S2 tiene una distribucin t con grados de libertad, donde 2 2
1 2 S12 S 22
n n
1 2
n1 n2
n1 1 n2 1
78
Caso 5. Muestras pareadas
Si
D y SD son la media y la desviacin estndar muestrales de la diferencia de n pares aleatorios de mediciones
D - D
t
SD
normalmente distribuidas, entonces la estadstica n tiene una distribucin t con n-1 grados de libertad.
1 , n 2
p1 q 1 p 2 q 2 ( p p 2 ) ( p1 p 2 ) n1 ,n2
(p1 - p 2 ) n N( p1 - p 2 , ) Z 1 N (0,1)
n1 n2 p1 q1 p 2 q 2
n1 n2
3.3 ESTIMACIN
3.3.1 Estimacin de parmetros
Una variable aleatoria se caracteriza o describe mediante su distribucin de probabilidad, la cual depende de
parmetros, que usualmente son desconocidos, por ello es necesario disponer de procedimientos para estimarlos
a partir de datos muestrales.
Un estimador puntual es una estadstica que produce un solo valor numrico como estimacin del parmetro
desconocido.
Por ejemplo la media aritmtica muestral es un estimador de la media poblacional, la proporcin observada en la
muestra es un estimador de la proporcin en la poblacin.
Un valor numrico particular de un estimador, calculado a partir de datos muestrales, se llama estimacin.
79
Parmetro poblacional Estimador Estimacin
n
x
n
Media X i i
X i 1
x i 1
n n
n n
1 1
2
2
Varianza 2 S 2 ( X i X )2 s2 xi x
n 1 i 1 n 1 i 1
X nmero xitos x
Proporcin p
p p
n nmero pruebas n
Los estimadores puntuales adecuados requieren cierto nmero de propiedades importantes, de las cuales dos de
las ms importantes son las siguientes: (VER LIBRO: CANAVOS)
1. El estimador puntual debe carecer de sesgo; es decir, el valor esperado del estimador puntual debe ser igual al
parmetro estimado.
2. El estimador debe tener varianza mnima. Cualquier estimador puntual es una variable aleatoria. por tanto, un
estimador puntual de varianza mnima tendr una menor varianza que cualquier otro estimador puntual del
parmetro.
Ejemplo: Sea X1, X2, X3 y X4 una m.a (4) de una poblacin cuya distribucin es normal con media y
2. Considrense las estadsticas T 1= (X1 + X2 + X3 + X4)/4 y T2= (X1+2X2+X3)/4
a) Cules son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), Cul tiene varianza mnima?
Actividad
Sea X1, X2, X3 y X4 una m.a(4) de una poblacin cuya distribucin es exponencial con parmetro .
Considrense las estadsticas T1= (1/6)(X1 + X2) + (1/3)(X3 + X4), T2= (X1+ 2X2 + 3X3+4X4)/4, T3= (X1 + X2 + X3
+ X4)/4
a) Cules son estimadores insesgados de ?
b) Entre los estimadores insesgados encontrados en el inciso a), Cul tiene varianza mnima?
Para determinar estimadores puntuales existen mtodos de estimacin, dentro de los cuales se destacan: El
Mtodo de los Momentos; El Mtodo de Mxima Verosimilitud y el Mtodo de Mnimos Cuadrado ordinarios
(Unidad IV).
Un estimador por intervalo es un intervalo aleatorio que incluye el valor real del parmetro, con cierto nivel de
probabilidad. Estos intervalos aleatorios se denominan normalmente intervalos de confianza. Una estimacin por
intervalo de un parmetro es el intervalo limitado por dos estadsticas, de manera que incluye el verdadero valor del
parmetro con cierta probabilidad.
Por ejemplo para elaborar un estimador por intervalo para un parmetro , es necesario encontrar dos estadsticas
L y U, tales que: P{L U} = 1- . El intervalo resultante: L U se denomina intervalo bilateral al 100(1- )%
de confianza para el parmetro desconocido , donde: L es el lmite inferior de confianza; U es el lmite superior de
confianza; 1- es el coeficiente o nivel de confianza y U - ( - L) se denomina exactitud del intervalo.
Si se determinan un gran nmero de tales intervalos, cada uno a partir de una muestra aleatoria, entonces el (1- )
de estos intervalos contendrn el verdadero valor del parmetro .
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro.
Se indica por 1- y habitualmente se da en porcentaje 100(1-)%. Hablamos de nivel de confianza y no de
80
probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del
parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el
100(1-)% de los intervalos as construidos contendra al verdadero valor del parmetro.
Un intervalo unilateral superior al 100(1- )% de confianza para estara dado por , U donde U, el lmite
superior de confianza, se escoge de manera que P{ U } = 1- .
Para construir un intervalo de confianza para un parmetro determinado se requiere encontrar una estadstica que
cumpla dos condiciones:
1. Que involucre en su formulacin al parmetro que se desea estimar.
2. Que dicha estadstica tenga una distribucin de probabilidades conocida.
Una estadstica que cumpla con estas condiciones recibe el nombre de estadstica pivotal.
3.3.1.3 Aplicaciones (en anexo 1 encontrar un resumen con estadsticas pivotales)
Estudiaremos ahora cmo construir intervalos de confianza para la media, la varianza y la proporcin en una
poblacin. Para el caso de dos poblaciones estudiaremos cmo construir intervalos de confianza para la diferencia de
medias, el cociente de varianzas y la diferencia de proporciones. En cada caso se trabaja con las estadsticas y
distribuciones muestrales ya estudiadas anteriormente.
Si x es la media de una muestra aleatoria de tamao n proveniente de una poblacin cuya variable de inters tiene
una distribucin normal con varianza conocida 2, entonces un intervalo al 100(1 - )% de confianza para , la media
poblacional de la variable, est dado por:
x z xz
(1
) n (1
) n donde z (1
2)
es el percentil (1-/2) de la distribucin normal estndar.
2 2
Teorema: Si se utiliza x como una estimacin de , se puede tener entonces una confianza de
100(1-)% de que el error no exceder de:
Z
(1
) n Ver Figura 1
2
x
XZ XZ
) n
(1 ) n (1
2
2
e: error de estimacin
Z
(1
) n
Figura 1. Error al estimar por x 2
81
Teorema: Si se utiliza x como una estimacin de , se puede tener una confianza de 100(1 - )% de que el error
ser menor que una cantidad especificada cuando el tamao de la muestra es:
z )
2
(1
n
2
e
C a s o 2 . I n t e r va l o d e c o n f i a n z a p a r a ; c o n 2 d e s c o n o c i d a ( m u e s t r a s g r a n d e s )
Si x y s son la media y la desviacin estndar de una muestra aleatoria de tamao n > 30, tomada de una poblacin
cuya variable de inters tiene una distribucin normal con varianza desconocida 2, entonces un intervalo al 100(1 -
)% de confianza para , la media poblacional de la variable, est dado por:
S S
x z
xz
(1
2
) n (1 )
2
n donde z (1
2)
es el percentil (1-/2) de la distribucin normal estndar.
S S
x t )
x t donde t(1-/2) es el percentil (1-/2) de la distribucin t con v = n 1
(1 (1 )
2 n 2 n grados de libertad.
Si pes la proporcin muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal, entonces un intervalo al (1 - )% de confianza para P, la proporcin poblacional,
est dado por:
p (1 p) p (1 p) donde z (1 ) es el percentil (1-/2) de la distribucin
p z P p z 2
(1 ) n (1 ) n
2 2 normal estndar.
A.3 Estimacin de la varianza
Si S2 es la varianza muestral de una muestra aleatoria de tamao n, tomada de una poblacin cuya variable de
inters tiene una distribucin normal con varianza desconocida 2, un intervalo al 100(1 - )% de confianza para 2,
la varianza poblacional, est dado por:
donde
2) 2
y (1 2 ) son los percentiles /2 y (1-/2), respectivamente
2 2 2
(n -1) S (n -1)2 S
2
de la distribucin Chi-cuadrado con (n 1) grados de libertad.
2
)
(1
2 2
2 2 2 2
(x - x ) z 1 2 - (x - x ) z 1 2 donde z (1
2)
es el percentil (1-/2) de la
1 2 (1
2
) n n 1 2 1 2 (1 )
2 n n
1 2 1 2 distribucin normal estndar.
82
Comentario:
El grado de confianza es exacto cuando las muestra provienen de poblaciones donde la variable de inters tiene una
distribucin normal. Para poblaciones donde la variable de inters no tiene una distribucin normal se obtiene un
intervalo de confianza aproximado que es muy bueno cuando tanto n 1 como n2 son > 30.
Como antes, si 12 y 22 son desconocidos y los tamaos muestrales son suficientemente grandes, se puede
reemplazar, en la ecuacin precedente, 12 por S12 y 22 por S 22 , sin afectar de manera significativa el intervalo de
confianza.
Caso 2. Intervalo de confianza para 1 - 2; con 12 = 22 pero desconocidas (para muestras pequeas)
Si x1 y x2 son las medias de muestras aleatorias pequeas independientes de tamaos n1 y n2, respectivamente,
provenientes de poblaciones, donde la variable de inters tiene una distribucin normal, con varianzas 12 y 22
desconocidas pero aproximadamente iguales, entonces un intervalo al 100(1 - )% de confianza para 1 2 , la
diferencia de medias poblacionales, est dado por:
1 1 1 1
(x - x ) t (1 ; v)Sp - (x - x ) t (1 ; v) Sp
1 2 2 n n 1 2 1 2 2 n n
1 2 1 2
donde Sp es la estimacin conjunta de la desviacin estndar de la poblacin, y donde t(1-/2) es el percentil (1-/2) de
la distribucin t con v = n1 + n2 2 grados de libertad.
Si x1 , S12 y x2 , S 22 , son las medias y las varianzas de muestras aleatorias pequeas independientes de tamaos
n1 y n2 respectivamente, provenientes de poblaciones donde la variable de inters tiene una distribucin normal, con
12 y 22 desconocidas y desiguales, respectivamente, entonces un intervalo al 100(1 - )% de confianza
varianzas
S2 S2 S2 S2
(x - x ) t (1 ;v) 1 2 - (x - x ) t (1 ; v) 1 2
1 2 2
n n 1 2 1 2 2 n n
1 2 1 2
donde t(1-/2) es el percentil (1-/2) de la distribucin t con grados de libertad, y queda dado por la siguiente
2
expresin: S12 S 22
12
n n2
2
S1 2
S 22
n1 n2
n1 1 n2 1
83
Caso 4. Intervalo de confianza para D = 1 - 2 en el caso de observaciones en pares
Si p1 y p2 son las proporciones de xitos en muestras aleatorias de tamaos n1 y n2, respectivamente, y adems
q1 1 p 1 y q 2 1 p 2 , entonces un intervalo al 100(1 - )% de confianza para p1 p2, est dado por:
p q p q p q p q
(p - p ) z 1 1 2 2 P - P (p - p ) z 1 1 2 2 donde z (1 es el percentil (1-/2)
(1 )
1 2 (1 ) 1 2 1 2 2)
2 2
n n n n de la distribucin normal estndar.
1 2 1 2
3.- Estimacin de la razn de dos varianzas
22
Intervalo de confianza para 12
Si S12 y S 22 son las varianzas de muestras aleatorias independientes de tamaos n1 y n2, respectivamente, tomadas
de poblaciones cuya variable de inters tiene una distribucin normal, entonces un intervalo al 100(1 - )% de
(a s2 s12 2 12 b s2 s12 )
2 2 2
22
confianza para 12 est dado por:
En donde a y b son los cuantiles inferior y superior de una distribucin F tales que:
84
3.4.2 POSIBLES ERRORES EN EL CONTRASTE DE HIPTESIS
El contraste de hiptesis no establece la verdad de la hiptesis, sino un criterio que nos permite decidir si una
hiptesis se acepta o se rechaza, o el determinar si las muestras observadas difieren significativamente de los
resultados esperados. En este proceso podemos incurrir en dos tipos de errores segn sea la situacin real y la
decisin que tomemos.
Si rechazamos una hiptesis cuando debiera ser aceptada, cometemos un error de tipo I, mientras que si la
aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II. Minimizar los errores no es una
cuestin sencilla, un tipo suele ser ms grave que otro y los intentos de disminuir uno suelen producir el aumento del
otro. La nica forma de disminuir ambos a la vez es aumentar el tamao de la muestra.
Ho verdadera Ho falsa
Decisin incorrecta
Decisin correcta
DECISIN: Mantener Ho
Error de tipo II
Decisin incorrecta
Decisin correcta
DECISIN: Rechazar Ho
Error de tipo I
El conjunto donde toma valores la estadstica de prueba, se divide en dos subconjuntos, la regin de rechazo o
regin crtica , R, que contiene los resultados menos favorables de H0, y la regin de aceptacin, A, que contiene
los resultados ms favorables a H0. Luego si el valor calculado de la estadstica de prueba pertenece a R,
rechazamos H0, en cambio si pertenece a A, aceptamos H0. El valor (o los valores) de la estadstica de prueba que
separa (o separan) a la regin R de la regin A se llama valor crtico (o valores crticos).
A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es unilateral, tal como:
La regin crtica de la hiptesis alternativa H1: > 0 se ubica por completo en la cola derecha de la distribucin,
mientras que la regin crtica de la hiptesis alternativa H 1: < 0 se ubica por completo en la cola izquierda. En
cierto sentido el smbolo de desigualdad seala la direccin en la cual se ubica la regin crtica.
85
A una prueba de cualquier hiptesis estadstica, en la que la hiptesis alternativa es bilateral, tal como:
Se le denomina prueba de dos colas o bilateral, ya que la regin crtica est dividida en dos partes igualmente
probables ubicadas en cada cola de la distribucin de la estadstica de prueba.
3.4.5 METODOLOGA PARA CONTRASTAR UNA HIPTESIS
Se trata pues, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o
rechazar una hiptesis previamente emitida, sobre el valor de un parmetro desconocido de la poblacin. El mtodo
que seguiremos es el siguiente:
1. Formulacin de las hiptesis.
2. Elegir un nivel de significacin
3. Escoger la estadstica de prueba.
4. Establecer el criterio en que se basar la decisin. Construir la zona de aceptacin, intervalo fuera del cual
slo se encuentran el 100% de los casos ms raros. A la zona de rechazo la llamaremos regin crtica, y su
rea es el nivel de significacin.
5. Verificar la hiptesis extrayendo una muestra cuyo tamao se ha decidido en el paso anterior y obteniendo de
ella el correspondiente estadstico (media o proporcin en nuestro caso).
6. Decidir. Si el valor calculado en la muestra cae dentro de la zona de aceptacin se acepta la hiptesis y si no se
rechaza. (VER LIBRO: YALUN CHOU ANALISIS ESTADISTICO)
3.4.6 APLICACIONES (EN ANEXO 2 ENCONTRAR UN RESUMEN CON LOS PRINCIPALES CONTRASTES)
Estudiaremos ahora hiptesis sobre la media, la varianza y sobre la proporcin en una poblacin. Para el caso de
dos poblaciones estudiaremos la comparacin de medias, comparacin de varianzas y comparacin de proporciones.
En cada caso se trabaja con un contraste bilateral y otro unilateral. Los contrastes unilaterales son de distinta
direccin en cada ejemplo, pero el mtodo a seguir es anlogo para ambos.
Queremos contrastar una hiptesis acerca de la proporcin en una poblacin a partir de los datos extrados de una
muestra. Procederemos como en el apartado anterior:
B.1 Contraste bilateral
Ejemplo 4. Se realizan 200 lanzamientos de una moneda y salen 120 caras, podemos aceptar que la moneda no
est trucada con un nivel de significacin del 5%?. Aceptaramos que la moneda no est trucada con =0,01?
Ejemplo 5. Un partido poltico afirma que obtendr el 60% de los votos en las prximas elecciones. Encuestados
1000 votantes afirman su intencin de votar a dicho partido 540. Se puede aceptar la hiptesis del partido con un
nivel de significacin del 5%?
86
B.2 Contraste unilateral
Ejemplo 6.Una mquina fabrica piezas de precisin y se garantiza que la proporcin de piezas correctas producidas
es al menos del 97%. Un cliente recibe un lote de 200 piezas y aparecen 8 piezas defectuosas; a un nivel de
confianza del 95% rechazar el lote por no cumplir las condiciones de la garanta?
Si la muestra hubiese sido de 300 piezas con 285 correctas, se aceptara el lote al 10% de significacin?
C. Contraste de hiptesis para la varianza de una poblacin
Ejemplo 7. El peso de 12 latas de cerezas, en onzas, es:
11,9 12,3 12,6 11,8 12,1 11,5 12,7 11,3 11,9 12,0 11,8 12,1
La desviacin estndar especificada es de 1/2 onza. Se cumple esta especificacin? Use el nivel de significacin
del 1% y una prueba bilateral. (Nota: 1 onza = 28,35 gramos)
promedio es
x1 = $35.500, con desviacin estndar muestral de s1 = $1.800. Para una muestra de n2 = 40 hogares
de la segunda comunidad,
x2 = $34.600 s2 = $2.400. Probar la hiptesis nula en el nivel de significacin del 5%.
87
3.5 APLICACIONES EN EL MBITO DE LA INGENIERA
REFORZAMIENTO ESTIMACIN
1. Se sabe que la duracin, en horas, de una ampolleta utilizada a la luz testigo, tiene una distribucin
aproximadamente normal, con una desviacin estndar de = 25 horas. Se toma una muestra aleatoria de 20
ampolletas, la cual arroja una duracin promedio de 1.014 horas.
a) Construya un intervalo de confianza bilateral del 95% para la duracin promedio.
b) Estudie el error de estimacin para niveles de confianza del 95% y del 99%. Qu relacin existe entre
longitud del intervalo, precisin de la estimacin y nivel de confianza?.
c) Supngase que se desea una confianza del 95% en que el error en la estimacin de la duracin promedio sea
menor que 5 horas. Qu tamao de muestra debe utilizarse?
d) Supngase que se desea el ancho total del intervalo de confianza bilateral sea de seis horas, con una
confianza del 95%. Qu tamao de muestra debe emplearse para este fin?
2. Una mquina produce piezas metlicas de forma cilndrica para ser utilizadas en la fabricacin de discos duros
para computadoras. Se toma una muestra de las piezas y los dimetros resultan de: 1,01, 0,97, 1,03, 1,04,
0,99, 1,01, y 1,03 centmetros, respectivamente:
a) Obtenga un intervalo de confianza de 99% para el dimetro medio de las piezas producidas por la mquina,
suponiendo una distribucin aproximadamente normal.
b) Estudie el error de estimacin para niveles de confianza del 95%. Qu relacin existe entre longitud del
intervalo, precisin de la estimacin y nivel de confianza?
c) Supngase que se desea que el error en la estimacin del dimetro medio de las piezas sea menor que 0.05
centmetros, con una confianza del 95%. Cul debera ser en este caso el tamao de la muestra?.
3. Una muestra aleatoria de tamao n1 = 16 que se tom de una poblacin con una desviacin estndar 1 = 5
tiene una media x 1 = 80. Una segunda muestra aleatoria de tamao n2 = 25 tomada de una poblacin normal
diferente con una desviacin estndar 2 = 3, tiene media x 2 = 75. Encuentre un intervalo de confianza del 95%
para 1 - 2 . De acuerdo con el intervalo hallado. hay evidencia de que las dos medias son iguales?
4. Una compaa tiene dos departamentos que producen el mismo producto. Se tiene la sensacin de que las
producciones por hora son diferentes en los dos departamentos. Al tomar una muestra aleatoria de horas de
produccin en cada departamento se obtuvieron los datos siguientes:
Departamento I Departamento II
Tamao de muestra n1 = 64 n2 = 49
Se sabe que las varianzas de las producciones por hora son 12 = 256, 22 = 196 para los dos
departamentos respectivamente. Obtenga e interprete un intervalo del 95% para la verdadera diferencia de la
produccin media. Qu puede decirse de la sospecha que exista acerca de la diferencia entre la produccin
promedio?
5. Se compara la resistencia de dos tipos de rosca de tornillo, utilizados en el armado de computadores, 50 piezas
con cada tipo de rosca se prueban en condiciones similares. Las piezas de la marca A tienen una resistencia
media a la tensin de 78,3 kg., con una desviacin estndar de 5,6 kg., en tanto que las de la marca B tienen
una resistencia media a la tensin de 87,2 g., con una desviacin estndar de 6,3 kilogramos.
a) Determine un intervalo de confianza de 95% para la diferencia de las medias poblaciones.
b) Con base en los resultados obtenidos en (a), Qu marca recomendara comprar?. Justifique.
6. Durante un periodo de 15 das se tomaron los tiempos gastados por dos estudiantes para transportarse de sus
casas a la universidad. Las medias y varianzas fueron:
x1 = 40,33 x2 = 42,54
2 2
s 1
= 1,53 s 2
= 2,96
88
7. Suponga que la Escuela de Ingeniera Civil en Informtica debe comprar tubos para iluminar la sala de
computacin. Para ello tiene dos alternativas comprar tubos con filamento tipo A o con filamento tipo B. Con el
objetivo de tener mayores antecedentes, para tomar la decisin, someti a prueba 10 tubos de cada tipo,
obteniendo las siguientes duraciones en horas:
A: 1.614, 1.094, 1.293, 1.643, 1.466, 1.270, 1.340, 1.380, 1.028, 1.997
B: 1.383, 1.138, 1.092, 1.143, 1.017, 1.061, 1.627, 1.021, 1.711, 1.065
a) Suponiendo que las varianzas son iguales, encontrar un intervalo de confianza para la diferencia de medias.
b) Suponiendo que las varianzas son desiguales, encontrar un intervalo de confianza para la diferencia de
medias.
c) Con base en los resultados obtenidos en (a) y (b), qu tipo de tubo recomendara comprar usted, el con
filamento tipo A o el con filamento tipo B?. Justifique.
8. Un cientfico de la computacin estn investigando la utilidad de dos lenguajes de diseo para mejorar la tarea
de programacin. Se pide a doce programadores expertos, familiarizados con los dos lenguajes, que codifiquen
una funcin estndar en ambos lenguajes, anotando el tiempo, en minutos, que requieren para hacer esta
tarea. Los datos obtenidos son los siguientes:
TIEMPO
1 17 18
2 16 14
3 21 19
4 14 11
5 18 23
6 24 21
7 16 10
8 14 13
9 21 19
10 23 24
11 13 15
12 18 20
a) Encuentre un intervalo de confianza del 95% para la diferencia en los tiempos de codificacin promedio.
b) Existe algo que indique una preferencia por alguno de los lenguajes?.
9. Un fabricante de calculadoras electrnicas est interesado en estimar la fraccin de unidades defectuosas
producidas. Se toma una muestra aleatoria de 800 calculadoras, de las cuales 10 resultan defectuosas. Calcule
un intervalo de confianza superior del 99% para la fraccin de calculadoras defectuosas.
10. Se lleva a cabo un estudio para determinar el porcentaje de hogares en Valdivia donde hay al menos un
computador. De qu tamao debe ser la muestra si se desea tener una confianza del 99% de que el error al
estimar esta cantidad es menor que 0,017?.
11. El jefe de personal de una empresa desea realizar una encuesta para determinar la proporcin de trabajadores
que est a favor de un cambio en el horario de trabajo. Como es imposible consultar a los N = 500 trabajadores
en un lapso razonable, procede a escoger aleatoriamente cierto nmero de trabajadores para entrevistarlos;
determine el nmero de trabajadores que debe entrevistarse si desea que la proporcin estimada presente un
error mximo del 5% y un nivel de confianza del 95%.
89
12. Se analiza la fraccin de productos defectuosos producidos por dos lneas de produccin. Una muestra aleatoria
de 100 unidades provenientes de la lnea 1 contiene 10 que son defectuosas, mientras que una muestra aleatoria
de 120 unidades de la lnea 2 tiene 25 que son defectuosas.
a) Encuentre un intervalo de confianza del 99% para la diferencia en fracciones de productos defectuosos
producidos por las dos lneas.
b) Qu conclusiones pueden obtenerse de los resultados obtenidos en (a)?
13. Considere los datos del problema 2. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 95% para 2 ?
b) Un intervalo de confianza inferior del 95% para 2 ?
c) Un intervalo de confianza superior del 95% para 2 ?
14. Considere los datos del problema 4. Construya lo siguiente:
a) Un intervalo de confianza bilateral del 90% para 21 /22
b) Un intervalo de confianza bilateral del 95% para 21 /22 . Compare el ancho de este intervalo con el del
obtenido en la parte (a).
c) Un intervalo de confianza inferior del 90% para 21 /22
d) Qu conclusiones se podran obtener, en el contexto del problema, de los resultados obtenidos en (a), (b) y
(c)?
Ejercicios de Comprensin
38. Se admite que la velocidad promedio de las mecangrafas de una compaa es de 55 palabras por minuto. El jefe de personal
afirma que un programa de adiestramiento instituido hace poco ha aumentado la velocidad de las mecangrafas. Formule la
hiptesis nula y la hiptesis alternativa.
39. La resistencia a la traccin de los alambres de acero es cuando ms de 1.000 libras. El fabricante asegura que un nuevo
proceso de produccin ha aumentado la resistencia de los alambres. Formule la hiptesis nula y la hiptesis alternativa. Si se
sabe que la resistencia a la traccin es exactamente de 1.000 libras. cules son las hiptesis nula y alternativa?
Seccin 2:
40. Una fbrica de pilas garantiza que su producto tiene una vida media de 1.000 horas y una desviacin estndar de 50. Pruebe la
hiptesis de que = 1.000 en contraposicin de la alternativa 1.000 horas, si una muestra aleatoria de 30 bateras
tiene una duracin promedio de 950 horas. Utilice
= 5%.
41. Una muestra aleatoria de 36 refrescos de una mquina despachadora tiene un contenido promedio de 19.8 decilitros, con una
desviacin estndar de 1.3 decilitros. Pruebe la hiptesis de = 20 decilitros en contraposicin a la hiptesis alternativa
< 20. Use el nivel de significacin = 1%. Calcule el valor p de significacin.
42. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4,22, 3,99, 5,41, 4,23, 4,29, 4,62, 4,55,
4,13, 4,23, 4,48. Evidencian estos datos que el contenido promedio de grasa en los hombres es menor de 4,46? Considere
= 5% y tome = 0,4. Calcule el valor p.
90
43. Se espera que dos operarios produzcan en promedio el mismo nmero de unidades terminadas en el mismo tiempo. Los
siguientes datos dan los nmeros de las unidades terminadas para ambos trabajadores en una semana de trabajo.
Operador 1 Operador 2
10 12
9 16
16 16
14 15
11 14
Si supone que el nmero de unidades terminadas diariamente por los trabajadores son variables aleatorias independientes
distribuidas normalmente con varianzas iguales, puede concluirse alguna diferencia entre las medias? Tome = 5%.
44. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194, 202, 335, 515, 184, 369, 142, 552,
200, 344, 421, 590, 301, 439. podemos concluir que la distancia promedio en que se aleja es mayor de 338?. Suponga que
= 149 y tome = 5%.
45. Pruebe la hiptesis segn la cual el contenido promedio de un aceite comestible es de 5 litros. Si los contenidos de una muestra
aleatoria de 10 recipientes son: 5,2, 4,7, 5,3, 5,1, 4,8, 4,9, 5,4, 5,3, 4,8. Utilice un nivel de significacin de = 1% y suponga
que la distribucin de los contenidos es normal. Calcule el valor p para dicho nivel.
46. Se desea comparar dos mtodos para ensear estadstica. Para ello se tomaron 10 pares de estudiantes del mismo
nivel de aprovechamiento en estadstica. De cada par a uno se asigna al azar al mtodo A y el otro al mtodo B.
Despus de un periodo de cuatro semanas, cada estudiante se someti a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10
Mtodo A 36 37 41 42 36 35 42 33 40 38
Mtodo B 35 35 42 41 36 34 40 31 39 37
Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de aprovechamiento de los mtodos
son distintos? Sea = 5%.
47. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para responder a un examen de estadstica.
Grupo Tiempo mnimo
1 100 84 96 107 89
2 79 163 95 132 91 85
Considere que se trata de poblaciones normales de igual varianza y pruebe que el tiempo de duracin promedio para
responder el examen del grupo 1 es mayor que el promedio del grupo 2. Tome = 2%.
48. Los siguientes datos corresponden a los dimetros de dos muestras de arandelas producidas por dos mquinas
distintas.
Muestra 1 0,91 1,82 1,46 1,95 1,57 1,61 1,32
Considere que los dimetros se distribuyen normalmente y que las varianzas respectivas son 12 = 0,12 y 22
= 0,13. Evidencian estos datos que los dimetros promedios de las arandelas producidas por las dos mquinas
son iguales? Tome = 5%.
91
49. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron observados sus
pesos al comienzo y al final de la dieta. Estos se muestran en la tabla que sigue:
Individuo 1 2 3 4 5
Se puede concluir segn estos datos que la dieta es efectiva? Tome = 10%.
50. Suponga que se tienen dos poblaciones X, Y independientes, distribuidas normalmente y de igual varianza. De
cada una de estas poblaciones se extrae una muestra. En la tabla que sigue se dan los resultados.
Poblacin Media Desviacin estndar Tamao de muestra
X 4.52 1,4 5
Y 5,31 1,95 23
51. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseanza secundaria media en una ciudad es de
225. Una muestra aleatoria de 25 estudiantes arroja un cociente intelectual de 106. Se puede concluir a partir de estos datos
que el cociente intelectual medio de los estudiantes es superior a 100? Tome = 5%.
52. Una muestra aleatoria de tamao n1 = 25, tomada de una poblacin normal con desviacin estndar de 1 = 4,8, tiene una
media x1 = 75. Una segunda muestra aleatoria de tamao n2 = 36, tomada de una poblacin normal diferente con desviacin
n1 = 9 n2 = 11
x1 10,4 x2 = 14,1
92
secundarios mientras que 15 de los que recibieron el medicamento B reaccionaron en forma similar. Evidencian estos datos
una diferencia entre las dos proporciones de los que tuvieron efectos secundarios? Sea 5%.
59. Con referencia al problema 51 de la Seccin 2. proporcionan estos datos una evidencia de que 2 0,16 ?. Tome
5%.
60. Se cree que al menos el 60% de los habitantes de una gran ciudad est a favor del adelanto de la hora local en 30 minutos. Se
tom una muestra de 200 habitantes de esta ciudad y 110 estuvieron de acuerdo en el adelanto. Qu puede decirse, segn
estos datos, del porcentaje real de los que estn a favor? Tome = 2%.
61. Se compara el nivel de colesterol en la sangre de pacientes seleccionados al azar y sometidos a dos dietas distintas; una baja
en grasa y la otra normal. Las varianza y tamaos de muestra se dan a continuacin.
Baja en grasas
S12 198 n1 19
Normal
S22 435 n2 24
Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad de las dos poblaciones de donde
se obtuvieron las muestras?. Tome 10%.
62. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de casa de 200 consultadas prefieren la
marca A; y que 29 de 150 la marca B. Es esto evidencia suficiente para sostener que la marca A es preferida a la B ?. Sea
1%.
63. Se realiz una encuesta para determinar la diferencia que puede existir entre las fracciones de casados y solteros entre 20 y 30
aos que fuman. Se entrevistaron 200 personas de cada grupo y se encontraron 64 casados y 80 solteros que fuman.
Contienen los datos suficiente evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para las
dos poblaciones?. Sea 10%.
64. Dos mquinas diferentes A y B se utilizan para producir pernos idnticos que se suponen de 2 pulgadas de longitud. Se toman
dos muestras aleatorias de 25 pernos cada una de la produccin de ambas mquinas y arrojan dos varianzas S12 0,03
pulgadas para la mquina A, y S12 = 0,04 pulgadas para la mquina B. Evidencian estos datos que las varianzas son iguales?
Tome 5% .
65. La desviacin estndar de cierto proceso de produccin es de 4 pulgadas. Se sospecha que la varianza se ha hecho demasiado
grande. Se toma una muestra de 9 partes producidas en dicho proceso y sus medidas son: 5, 7, 2, 4, 8, 9, 8, 6 y 5 pulgadas.
Pruebe la hiptesis de que el proceso conserva an la varianza 2 4. sea 1%.
93
ANEXO 1
Tabla 1: Estadsticas pivotales para la construccin de intervalos de confianza relacionados con medias, varianzas y
proporciones.
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL
x-
Z N(0,1)
con 2 conocido n
x-
Z N(0,1)
S
2 desconocido y n > 30
n
x-
t t(n - 1)
S
2 desconocido y n < 30 n
1 - 2
(x - x ) - ( - )
con 1 y 2 conocidos
2 2 Z 1 2 1 2 N (0,1)
2 2
1 2
n n
1 2
1 - 2
(x - x ) - ( - )
Z 1 2 1 2 N (0,1)
con y desconocidos; muestras
2 2 2
1 2 S S2
1 2
aleatorias independientes de tamaos n1 y n2, n n
1 2
ambos mayores o iguales que 30 (n1> 30 y n2 >
30)
1 - 2 (x - x ) - ( - )
t 1 2 1 2 t(n n - 2)
1 1 1 2
con 1 y 2 desconocidos pero
2 2
S
p n n
aproximadamente iguales. Muestras aleatorias 1 2
(n1 1)S12 (n 2 1)S22
pequeas independientes de tamaos n1 y n2 S2p
n1 n 2 2
(n1< 30 y/o n2 < 30)
1 - 2 (x - x ) - ( - )
S S
2
t 1 2 1 2 t( ) 2 2
1 2
S2 S2 n n
con 1 y 2 desconocidos y distintos.
2 2
1 2 1 2
S S
2 2
2 2
1 2 n n 1
2
D d-
t D t(n -1)
Muestras pareadas S2
d
n
94
Tabla 1: Estadsticas pivotales para la construccin de intervalos de confianza relacionados con medias,
varianzas y proporciones (Continuacin).
INTERVALO DE CONFIANZA PARA: VALOR DE LA ESTADSTICA PIVOTAL
(n - 1) S2
2 2 (n 1)
2
2
2 2
S
F 2 1 F(n 1, n 1)
12 / 22 2 2
S
1 2
1 2
p - p
Z N(0,1)
p (1 p)
p
n
(p - p ) (p - p )
Z 1 2 1 2 N(0,1)
p1 p 2 p q p q
1 1 2 2
n n
1 2
95
ANEXO 2
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones
H0 VALOR DE LA ESTADSTICA DE H1 REGIN CRTICA
PRUEBA
1 - 2 = d0
1 - 2 < d 0
con 1 y 22
2 z < -z1-
conocidos (x - x ) - ( - )
Z 1 2 1 2 N (0,1)
2 2
1 2 1 - 2 > d 0 z > z1-
n n
1 2
1 - 2 = d0
1 - 2 < d 0
con 1 y 22
2 z < -z1-
desconocidos; muestras
(x - x ) - ( - )
aleatorias independientes de tamaos n1 Z 1 2 1 2 N (0,1)
y n2, ambos mayores o iguales que 30 S 2 S2
(n1> 30 y n2 > 30) 1 2 1 - 2 > d 0 z > z1-
n n
1 2
1 - 2 = d0 t < -t1-
(x - x ) - ( - )
t 1 2 1 2 t(n n - 2) 1 - 2 < d 0
con 1 y 22
2
desconocidos pero 1 1 1 2
Sp
aproximadamente iguales. Muestras n n t > t1-
aleatorias pequeas independientes de 1 2
tamaos n1 y n2 (n1< 30 y/o n2 < 30) 1 - 2 > d 0
(n 1)S (n 1)S2 2
S
2 1 1 2 2
t < -t1-/2 t > t1-/2
n n 2
p
1 2
1 - 2 d0
96
Tabla 2: Pruebas relacionadas con medias, varianzas y proporciones (Continuacin).
t < -t1-
1 - 2 = d0 (x - x ) - ( - ) 1 - 2 < d 0
t 1 2 1 2 t( )
S S2
2
con 1 y 22 t > t1-
2
desconocidas y distintas. 1 2
Muestras aleatorias pequeas n n 1 - 2 > d 0
1 2 S S 2 2
2
30 y/o n2 < 30 n n 1 2
S S
2 2
2 2
1 2
1 - 2 d0 t < -z1-/2 o t > t1-/2
n n
1 2
n 1 n 1
1 2
d-
t D t(n -1)
D = d0 2 D> d 0 t > t1-
S
d
Muestras pareadas n D d0 t < -t1-/2 o t > t1-/2
2 02 2 12
2 02 (n - 1) S2
2
2
2 (n 1) 2 02 2 12
2 02 2 12 o 2 12
2
2
12 22 f 2 f12
2 2
S
F 2 1 F(n 1, n 1) 12 22 f 2 f12
2
1
2
2 2 2 1 2
S
1 2 12 22 f 2 f12 2 o f 2 f12 2
p = p0 Z
p - p
N(0,1) p > p0 z < -z1-
p (1 p)
n z < -z/2 z > z/2
p p0
97