Sei sulla pagina 1di 10

UPES *** ESTADSTICA II 1

PRUEBA DE HIPOTESIS

Las secciones anteriores han mostrado cmo puede estimarse un parmetro a partir de
los datos contenidos en una muestra. Puede encontrarse ya sea un slo nmero
(estimador puntual) o un intervalo de valores posibles (intervalo de confianza). Sin
embargo, muchos problemas de ingeniera, ciencia, y administracin, requieren que se
tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro. Esta
proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles de la
inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de la ingeniera, pueden formularse como
problemas de prueba de hiptesis.

Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una
o ms poblaciones.

Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido


utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El
inters se centra sobre la rapidez de combustin promedio. De manera especfica, el
inters recae en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede
expresarse de manera formal como
Ho; = 50 cm/s
H1; 50 cm/s

La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la


proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa.

Puesto que la hiptesis alternativa especifica valores de que pueden ser mayores o
menores que 50 cm/s, tambin se conoce como hiptesis alternativa bilateral. En
algunas situaciones, lo que se desea es formular una hiptesis alternativa unilateral,
como en
Ho; = 50 cm/s Ho; = 50 cm/s

H1; < 50 cm/s H1; > 50 cm/s

Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:

1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,


entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
UPES *** ESTADSTICA II 2
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o
modelo.

3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta
situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.

Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen
del empleo de la informacin contenida en la muestra aleatoria de la poblacin de
inters. Si esta informacin es consistente con la hiptesis, se concluye que sta es
verdadera; sin embargo si esta informacin es inconsistente con la hiptesis, se
concluye que esta es falsa. Debe hacerse hincapi en que la verdad o falsedad de una
hiptesis en particular nunca puede conocerse con certidumbre, a menos que pueda
examinarse a toda la poblacin.

Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario


desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad
de llegar a una conclusin equivocada.

La hiptesis nula, representada por Ho, es la afirmacin sobre una o ms


caractersticas de poblaciones que al inicio se supone cierta (es decir, la creencia a
priori).
La hiptesis alternativa, representada por H1, es la afirmacin contradictoria a
Ho, y sta es la hiptesis del investigador.

La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia


muestral sugiere que Ho es falsa. Si la muestra no contradice decididamente a H o, se
contina creyendo en la validez de la hiptesis nula.

Entonces, las dos conclusiones posibles de un anlisis por prueba de hiptesis son
rechazar Ho o no rechazar Ho.

Prueba de una Hiptesis Estadstica


Para ilustrar los conceptos generales, considere el problema de la rapidez de
combustin del agente propulsor presentado con anterioridad. La hiptesis nula es que
la rapidez promedio de combustin es 50 cm/s, mientras que la hiptesis alternativa es
que sta no es igual a 50 cm/s. Esto es, se desea probar:
Ho; = 50 cm/s
H1; 50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
UPES *** ESTADSTICA II 3
estimador de la media verdadera de la poblacin. Un valor de la media muestral x que
este prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor
de la media es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula H o.

Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia
que apoya la hiptesis alternativa H 1. Por tanto, en este caso, la media muestral es el
estadstico de prueba.

La media muestral puede tomar muchos valores diferentes.

Supngase que si 48.5x 51.5, entonces no se rechaza la hiptesis nula H o; = 50


cm/s, y que si x <48.5 x >51.5, entonces se acepta la hiptesis alternativa H 1; 50
cm/s.

Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin
crtica de la prueba, mientras que todos los valores que estn en el intervalo
48.5x 51.5 forman la regin de aceptacin.

Las fronteras entre las regiones crticas y de aceptacin reciben el nombre de valores
crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula H o.

Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin


crtica, de lo contrario, no se rechaza Ho.

Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por
ejemplo, es posible que el valor verdadero de la rapidez promedio de combustin del
agente propulsor sea igual a 50 cm/s. Sin embargo, para todos los especmenes bajo
prueba, bien puede observarse un valor del estadstico de prueba x que cae en la regin
crtica.

En este caso, la hiptesis nula Ho ser rechazada en favor de la alternativa H1cuando, de


hecho, Ho en realidad es verdadero. Este tipo de conclusin equivocada se conoce como
error tipo I.

El error tipo I se define como el rechazo de la hiptesis nula H o cuando sta es


verdadera. Tambin es conocido como nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del
5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de
significancia sera del 10%.

Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50


cm/s, aunque la media muestral x caiga dentro de la regin de aceptacin.
En este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el
nombre de error tipo II.
UPES *** ESTADSTICA II 4

El error tipo II error se define como la aceptacin de la hiptesis nula cuando sta
es falsa.

Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes
que determinan si la decisin final es correcta o errnea.

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de


uno por lo general tiene como resultado un aumento en la probabilidad del otro.

2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,


siempre se puede reducir al ajustar el o los valores crticos.

3. Un aumento en el tamao muestral n reducir y de forma simultnea.

4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se


aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor .

PASOS PARA ESTABLECER UN ENSAYO DE HIPOTESIS


INDEPENDIENTEMENTE DE LA DISTRIBUCION QUE SE ESTE TRATANDO

1. Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.

2. Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como
el tipo de muestreo y si la poblacin es finita o infinita.

3. Establecer simultneamente el ensayo de hiptesis y el planteamiento grfico del


problema. El ensayo de hiptesis est en funcin de parmetros ya que se quiere
evaluar el universo de donde proviene la muestra. En este punto se determina el tipo
de ensayo (unilateral o bilateral).

4. Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico,
el cual se obtiene dependiendo del valor de (Error tipo I o nivel de significancia) o en
funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis
deber ser argumentada correctamente para tomar la decisin, la cual estar en
funcin de la hiptesis nula o Ho.

5. Calcular el estadstico real, y situarlo para tomar la decisin.


UPES *** ESTADSTICA II 5

6. Justificar la toma de decisin y concluir.


Tipos de Ensayo

Se pueden presentar tres tipos de ensayo de hiptesis que son:


Unilateral Derecho
Unilateral Izquierdo
Bilateral

Dependiendo de la evaluacin que se quiera hacer se seleccionar el tipo de ensayo.

Unilateral
Derecho. El investigador desea comprobar la hiptesis de un aumento en
el parmetro, en este caso el nivel de significancia se carga todo hacia el lado derecho,
para definir las regiones de aceptacin y de rechazo.
Ensayo de hiptesis:
Ho; Parmetro x
H1; Parmetro x
Parmetro = x

Unilateral
Izquierdo: El investigador desea comprobar la hiptesis de una
disminucin en el parmetro, en este caso el nivel de significancia se carga todo hacia el
lado izquierdo, para definir las regiones de aceptacin y de rechazo.
Ensayo de hiptesis:
Ho; Parmetro x
H1; Parmetro x
Parmetro = x
UPES *** ESTADSTICA II 6
Bilateral:
El investigador desea comprobar la hiptesis de un cambio en el parmetro.
El nivel de significancia se divide en dos y existen dos regiones de rechazo.
Ensayo de hiptesis:
Ho; Parmetro = x
H1; Parmetro x
Parmetro = x

Para realizar los ejemplos y ejercicios de ensayo de hiptesis se recomienda seguir los
pasos mencionados anteriormente. Los ejemplos siguientes se solucionarn por los
pasos recomendados, tenindose una variedad de problemas en donde se incluirn a
todas las distribuciones mustrales que se han visto hasta aqu.

Ejemplos:

1. Una muestra aleatoria de 100 muertes registradas en Estados Unidos el ao pasado


muestra una vida promedio de 71.8 aos. Suponga una desviacin estndar
poblacional de 8.9 aos, esto parece indicar que la vida media hoy en da es mayor
que 70 aos? Utilice un nivel de significancia de 0.05.

2. Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviacin
estndar de 40 horas. Si una muestra aleatoria de 30 focos tiene una duracin
promedio de 788 horas, muestran los datos suficiente evidencia para decir que la
duracin media ha cambiado? Utilice un nivel de significancia del 0.04.

3. Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio 5.23


onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que = 5.5
onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de significancia de 0.05.

4. Un constructor afirma que se instalan bombas de calor en 70% de todas las casas que
se construyen hoy en da en la ciudad de Richmond. Estara de acuerdo con esta
afirmacin si una investigacin de casas nuevas en esta ciudad muestra que 8 de 15
tienen instaladas bombas de calor? Utilice un nivel de significancia de 0.10.
UPES *** ESTADSTICA II 7
5. Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilsticos. El cliente requiere que la fraccin de
controladores defectuosos en uno de los pasos de manufactura crticos no sea mayor
que 0.05, y que el fabricante demuestre esta caracterstica del proceso de fabricacin
con este nivel de calidad, utilizando a = 0.05. El fabricante de semiconductores toma
una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son
defectuosos. El fabricante puede demostrar al cliente la calidad del proceso?

6. Un diseador de productos est interesado en reducir el tiempo de secado de una


pintura tapaporos. Se prueban dos frmulas de pintura; la frmula 1 tiene el contenido
qumico estndar, y la frmula 2 tiene un nuevo ingrediente secante que debe reducir
el tiempo de secado. De la experiencia se sabe que la desviacin estndar del tiempo
de secado es ocho minutos, y esta variabilidad inherente no debe verse afectada por
la adicin del nuevo ingrediente. Se pintan diez especmenes con la frmula 1, y otros
diez con la frmula 2. Los dos tiempos promedio de secado mustrales son 121 min y
112 min respectivamente. A qu conclusiones puede llegar el diseador del producto
sobre la eficacia del nuevo ingrediente, utilizando a = 0.05?

7. Se utilizan dos mquinas para llenar botellas de plstico con un volumen neto de 16.0
onzas. Las distribuciones de los volmenes de llenado pueden suponerse normales,
con desviaciones estndar s1= 0.020 y s2 = 0.025 onzas. Un miembro del grupo de
ingeniera de calidad sospecha que el volumen neto de llenado de ambas mquinas
es el mismo, sin importar si ste es o no de 16 onzas. De cada mquina se toma una
muestra aleatoria de 10 botellas. Se encuentra el ingeniero en lo correcto?
Utilice = 0.05

8. Existen dos tipos de plstico apropiados para su uso por un fabricante de


componentes electrnicos. La tensin de ruptura de ese plstico es un parmetro
importante. Se sabe que 1=2= 1.0 psi. De una muestra aleatoria de tamao 10 y 12
para cada plstico respectivamente, se tiene una media de 162.5 para el plstico 1 y
de 155 para el plstico 2. La compaa no adoptar el plstico 1 a menos que la
tensin de ruptura de ste exceda a la del plstico 2 al menos por 10 psi. Con base a
UPES *** ESTADSTICA II 8
la informacin contenida en la muestra, la compaa deber utilizar el plstico 1?
Utilice = 0.05 para llegar a una decisin.

9. Se evalan dos tipos diferentes de soluciones para pulir, para su posible uso en una
operacin de pulido en la fabricacin de lentes intraoculares utilizados en el ojo
humano despus de una ciruga de cataratas. Se pulen 300 lentes con la primera
solucin y, de stos, 253 no presentaron defectos inducidos por el pulido. Despus se
pulen otros 300 lentes con la segunda solucin, de los cuales 196 resultan
satisfactorios. Existe alguna razn para creer que las dos soluciones para pulir son
diferentes? Utilice a = 0.01

10. Se tomar el voto entre los residentes de una ciudad y el condado circundante para
determinar si se debe construir una planta qumica propuesta. El lugar de
construccin est dentro de los lmites de la ciudad y por esta razn muchos votantes
del condado consideran que la propuesta pasar debido a la gran proporcin de
votantes que favorecen la construccin. Para determinar si hay una diferencia
significativa en la proporcin de votantes de la ciudad y votantes del condado que
favorecen la propuesta, se realiza una encuesta. Si 120 de 200 votantes de la ciudad
favorecen la propuesta y 240 de 500 residentes del condado tambin lo hacen,
estara de acuerdo en que la proporcin de votantes de la ciudad que favorecen la
propuesta es ms alta que la proporcin de votantes del condado? Utilice un nivel de
significancia de 0.025.

USO DE VALORES P PARA LA TOMA DE DECISIONES

Al probar hiptesis en las que la estadstica de prueba es discreta, la regin crtica se


puede elegir de forma arbitraria y determinar su tamao. Si es demasiado grande, se
puede reducir al hacer un ajuste en el valor crtico. Puede ser necesario aumentar el
tamao de la muestra para compensar la disminucin que ocurre de manera automtica
en la potencia de la prueba (probabilidad de rechazar H o dado que una alternativa
especfica es verdadera).
Por generaciones enteras de anlisis estadstico, se ha hecho costumbre elegir un nivel
de significancia de 0.05 0.01 y seleccionar la regin crtica en consecuencia. Entonces,
por supuesto, el rechazo o no rechazo estricto de H o depender de esa regin crtica. En
la estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del
valor P. La aproximacin se disea para dar al usuario una alternativa a la simple
conclusin de rechazo o no rechazo.

La aproximacin del valor P como ayuda en la toma de decisiones es bastante natural


pues casi todos los paquetes de computadora que proporcionan el clculo de prueba de
hiptesis entregan valores de P junto con valores de la estadstica de la prueba
apropiada.
UPES *** ESTADSTICA II 9

Un valor P es el nivel (de significancia) ms bajo en el que el valor observado de la


estadstica de prueba es significativo.

El valor P es el nivel de significancia ms pequeo que conduce al rechazo de la


hiptesis nula Ho.

El valor P es el mnimo nivel de significancia en el cual H o sera rechazado cuando se


utiliza un procedimiento de prueba especificado con un conjunto dado de informacin.
Una vez que el valor de P se haya determinado, la conclusin en cualquier nivel
particular resulta de comparar el valor P con

1. Valor P rechazar Ho al nivel .


2. Valor P > No rechazar Ho al nivel .
UPES *** ESTADSTICA II 10

Ejemplos:
1. Calcular el valor de P para el primer ejemplo de ensayo de hiptesis en donde se
quera probar que la edad media de los habitantes de Estados Unidos es superior a
70 aos.

2. Calcular el valor de P para el ejemplo 7 de esta seccin en donde se tiene dos


mquinas y se quiere ver si tienen la misma cantidad promedio de llenado en las
botellas de plstico.

3. Se afirma que un automvil se maneja en promedio ms de 20,000 kilmetros por


ao. Para probar esta afirmacin, se pide a una muestra de 100 propietarios de
automviles que lleven un registro de los kilmetros que viajen. Est de acuerdo con
esta afirmacin si la muestra aleatoria tiene un promedio de 23,500 kilmetros y una
desviacin estndar de 3900 kilmetros? Utilice un valor P para su conclusin.

4. Se estudia la fraccin de circuitos integrados defectuosos producidos en un proceso


de fotolitografa. Para ello se somete a prueba una muestra de 300 circuitos, en la que
13 son defectuosos. Utilice los datos para probar H o: P=0.05 contra H1: P0.05.
Utilice un valor de P para su conclusin.

Potrebbero piacerti anche