Sei sulla pagina 1di 202

UNIVERSIDAD AUTNOMA CHAPINGO

DIVISIN DE CIENCIAS FORESTALES


DEPARTAMENTO DE ESTADSTICA
MATEMTICA Y CMPUTO

ANLISIS DE INFERENCIA ESTADISTICA


(PRUEBA DE HIPTESIS)

TESIS PROFESIONAL

Que como requisito parcial para obtener el ttulo de:

L I C E N C I A D O EN E S T A D S T I C A

P R E S E N T A:

Morales Reyes Lzaro

Chapingo, Texcoco, Edo. de Mxico, Febrero de 2010 i


Esta tesis fue realizada por Morales Reyes Lzaro, bajo la direccin del Doctor Eduardo
Gutirrez Gonzlez. Fue revisada y aprobada por el siguiente Comit Revisor y Jurado
Examinador, para obtener el ttulo de Licenciado en Estadstica.

PRESIDENTE.
Dr. Eduardo Gutirrez Gonzlez
_______________________________

SECRETARIO.
M.C. Alejandro Corona Ambriz
______________________________

VOCAL.
Dr. Gerardo Terrazas Gonzlez
______________________________

SUPLENTE.
Dr. Antonio Villanueva Morales
______________________________

SUPLENTE.
Lic. Margarito Soriano Montero
______________________________

Chapingo, Texcoco, Edo. de Mxico, Febrero del 2010


Contenido
NDICE DE FIGURAS .................................................................................................................. vi
NDICE DE TABLAS .................................................................................................................. viii
RESUMEN ...................................................................................................................................... ix
SUMMARY ...................................................................................................................................... x
INTRODUCCIN ........................................................................................................................... 1
PLANTEAMIENTO ....................................................................................................................... 2
OBJETIVOS .................................................................................................................................... 4

CAPTULO 1 ........................................................................................................................................................................ 5
Conceptos bsicos de las pruebas de hiptesis estadsticas ................... 5
Introduccin....................................................................................................................................... 5
1.1 Hiptesis estadstica .................................................................................................................... 6
1.2 Conjunto de realizaciones de una hiptesis estadstica ............................................................... 7
1.3 Prueba estadstica de una hiptesis.............................................................................................. 7
1.4 Tipos de errores en una prueba de hiptesis: tipo I y tipo II ....................................................... 9
1.5 La mejor prueba: potencia de la prueba .................................................................................... 11
1.6 Funcin potencia de la prueba. .................................................................................................. 15
1.7 Tamao de la prueba y nivel de significancia ........................................................................... 16
1.8 Aplicaciones para el clculo del tamao y potencia de la prueba en el caso de un parmetro. 19

CAPTULO2....................................................................................................................................................................... 33
Pruebas de hiptesis y lema de Neyman-Pearson ......................................... 33
Introduccin..................................................................................................................................... 33
2.1 Prueba simple contra simple ...................................................................................................... 33
2.2 Pruebas puras y aleatorizadas .................................................................................................... 36
2.3 El lema de Neyman-Pearson para pruebas simple contra simple .............................................. 38
2.4 Hiptesis nula simple contra hiptesis alterna simple ............................................................... 41
2.4.1 Metodologa para el caso continuo .................................................................................... 41
2.4.2 Metodologa para el caso discreto ..................................................................................... 53
Teorema 2.1......................................................................................................................... 58
2.5 Pruebas simple contra compuesta .............................................................................................. 59
2.6 Pruebas compuesta contra simple .............................................................................................. 62
2.7 Pruebas compuesta contra compuesta ....................................................................................... 66
2.8 Pruebas compuesta contra compuesta para poblaciones de variables discretas ........................ 71
Teorema 2.2......................................................................................................................... 71

iii
CAPTULO 3...................................................................................................................................................................... 75
Pruebas de razn de verosimilitud generalizada ............................................ 75
Introduccin..................................................................................................................................... 75
3.1 Familias de distribucin con razn de verosimilitud montona ................................................ 75
Teorema 3.1......................................................................................................................... 76
Teorema 3.2......................................................................................................................... 85
3.2 Pruebas insesgadas .................................................................................................................... 86
Teorema 3.3......................................................................................................................... 87
3.3 Mtodo de prueba de la razn de verosimilitud generalizada ................................................... 89
3.4 Propiedad asinttica de las pruebas de razn de verosimilitud generalizadas ........................ 104
3.5 Razn de verosimilitud generalizada en muestras independientes .......................................... 107

CAPTULO 4.................................................................................................................................................................... 121


Pruebas de hiptesis para los parmetros de una distribucin normal121
Introduccin................................................................................................................................... 121
4.1 Metodologa para probar una hiptesis estadstica .................................................................. 121
4.2 Pruebas de hiptesis para medias ............................................................................................ 122
4.2.1 Pruebas de hiptesis para medias de poblaciones aproximadamente normales cuando se
conoce  .................................................................................................................................. 122
Teorema 4.1....................................................................................................................... 122
4.2.2 Pruebas de hiptesis para la media de poblaciones aproximadamente normales cuando se
desconoce  ............................................................................................................................. 128
Teorema 4.2....................................................................................................................... 128
4.3 Pruebas para la diferencia de medias de poblaciones normales .............................................. 132
4.3.1 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se conocen  12 y  22 ................................................................................... 133
Teorema 4.3....................................................................................................................... 133
4.3.2 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se desconocen  12 y  22 pero  12   22 ....................................................... 137
Teorema 4.4....................................................................................................................... 137
4.3.3 Pruebas de hiptesis para la diferencia de medias sobre poblaciones aproximadamente
normales cuando se desconocen  12 y  22 pero  12   22 ...................................................... 140
Teorema 4.5....................................................................................................................... 141
4.3.4 Pruebas de hiptesis para la diferencia de medias de observaciones pareadas con
diferencias normales ................................................................................................................. 144
Teorema 4.6....................................................................................................................... 145
4.4 Pruebas para las varianzas de poblaciones normales .............................................................. 148
Teorema 4.7....................................................................................................................... 148
Teorema 4.8....................................................................................................................... 152
4.5 Pruebas para poblaciones tipo Bernoulli, proporciones .......................................................... 155
4.5.1 Pruebas para proporciones muestras grandes .................................................................. 155
Teorema 4.9....................................................................................................................... 156
Teorema 4.10..................................................................................................................... 159

iv
CAPTULO 5.................................................................................................................................................................... 165
Pruebas de bondad de ajuste ................................................................................ 165
Introduccin................................................................................................................................... 165
5.1 Prueba ji-cuadrada (paramtrica) ............................................................................................ 166
5.2 Prueba de Kolmogorov-Smirnov de bondad de ajuste (no paramtrica)................................. 176
5.3 Prueba de normalidad de Shapiro-Wilk .................................................................................. 180
5.4 Evaluacin de una prueba de bondad de ajuste ....................................................................... 183

CONCLUSIONES ....................................................................................................................... 184


BIBLIOGRAFA ......................................................................................................................... 185
ANEXO......................................................................................................................................... 187

v
ndice de figuras
Figura 1.1 Probabilidades de errores tipo I y II .............................................................................. 11
Figura 1.2 Diferentes pruebas de tamao  .................................................................................. 12
Figura 1.3 Diferentes funciones de potencia de la prueba.............................................................. 17
Figura 1.4 Situacin cuando  no est en la regin de rechazo del ejemplo 1.5 d) ...................... 18
Figura 1.5 Situacin cuando  est en la regin de rechazo del ejemplo 1.5 e) ........................... 19
Figura 1.6 Funcin de potencia de la prueba para el valor crtico   4.2 del ejemplo 1.6. ......... 21
Figura 1.7 Grfica de la funcin potencia de la prueba del ejemplo 1.11 ...................................... 26
Figura 1.8 Grfica de la funcin potencia de la prueba del ejemplo 1.13. ..................................... 28
Figura 1.9 Regin crtica establecida C  {( x1 , x2 ) : (3 4) x1  x2 } del ejemplo 1.14 ...................... 29
Figura 1.10 Grfica de la funcin potencia de la prueba del ejemplo 1.17 .................................... 32
Figura 2.1 Probabilidades de los errores tipo I y II de las 8 pruebas posibles del ejemplo 2.1 ...... 36
Figura 2.2 Conjunto convexo de las pruebas aleatorizadas del ejemplo 2.1 .................................. 37
Figura 2.3 Pruebas admisibles para el ejemplo 2.1 ........................................................................ 38
Figura 2.4 Limites de la transformacin para el ejemplo 2.6 ......................................................... 49
Figura 2.5 Regin de rechazo para el ejemplo 2.11 ....................................................................... 59
Figura 2.6 Conjunto de todas las pruebas  de tamao  ............................................................ 64
Figura 2.7 Ilustracin de P(Y b)  1
  42n (b) del ejemplo 2.17 ............................................ 70
Figura 2.8 Regin de rechazo para el ejemplo 2.18 ....................................................................... 73
Figura 2.9 Regin de rechazo para el ejemplo 2.19 ....................................................................... 74
Figura 3.1 Comportamiento de la funcin  ( ) de la prueba...................................................... 77
Figura 3.2 Grfica de la funcin de potencia de la prueba del ejemplo 3.3 ................................... 80
Figura 3.3 Funcin de potencia de la prueba del ejemplo 3.5 ........................................................ 83
Figura 3.4 Comportamiento de las pruebas insesgadas 1 y  2* .................................................... 86
Figura 3.5 Ilustracin de   P{X ln X  k } del ejemplo 3.10 ..................................................... 92
Figura 3.6 Ilustracin de   P{g (Y ) k1 } donde Y ~ 22n del ejemplo 3.11 ................................ 94
Figura 3.7 Espacio de parmetros para  y  del ejemplo 3.14 .................................................. 97
Figura 3.8 Grfica de la funcin g ( y) donde se desea encontrar a y b tales que g (a)  g (b)  k 98
Figura 3.9 Grfica de  (x)  h(T 2 ) del ejemplo 3.15 .................................................................. 103
Figura 3.10 Grfica de una T  ~ t n
1 tales que Ftn
1 (
t1
 2 )  1
  Ftn
1 (t1
 2 ) del ejemplo 3.15104
Figura 3.11 Espacio de parmetros para  y  del ejemplo 3.17 ............................................... 108
Figura 3.12 Grfica de una t nm
2 tales que
t n* m
2,1
 2  1
  t n* m
2,1
 2 del ejemplo 3.19 .. 116
Figura 3.13 Grfica de la funcin g (F ) donde g (a)  g (b)  k del ejemplo 3.21 ...................... 118
Figura 3.14 Grfica de la funcin 1
  P{a F b} del ejemplo 3.22 .................................... 119
Figura 4.1. Regin de no rechazo y rechazo para el ejemplo 4.1 ................................................. 123
Figura 4.2. Regin de no rechazo y rechazo para el ejemplo 4.2 ................................................. 124
vi
Figura 4.3. Regin de no rechazo y rechazo para el ejemplo 4.2 ................................................. 125
Figura 4.4. Regin de no rechazo y rechazo para el ejemplo 4.3 ................................................. 126
Figura 4.5. Regin de no rechazo y rechazo para el ejemplo 4.4 ................................................. 127
Figura 4.6. Regin de no rechazo y rechazo para el ejemplo 4.5 ................................................. 129
Figura 4.7. Regin de no rechazo y rechazo para el ejemplo 4.6 ................................................. 131
Figura 4.8. Regin de no rechazo y rechazo para el ejemplo 4.7 ................................................. 132
Figura 4.9. Regin de no rechazo y rechazo para el ejemplo 4.8 ................................................. 135
Figura 4.10. Regin de no rechazo y rechazo para el ejemplo 4.10 ............................................. 138
Figura 4.11. Regin de no rechazo y rechazo para el ejemplo 4.11 ............................................. 140
Figura 4.12. Regin de no rechazo y rechazo para el ejemplo 4.12 ............................................. 143
Figura 4.13. Regin de no rechazo y rechazo para el ejemplo 4.13 ............................................. 144
Figura 4.14. Regin de no rechazo y rechazo para el ejemplo 4.14 ............................................. 146
Figura 4.15. Regin de no rechazo y rechazo para el ejemplo 4.15 ............................................. 148
Figura 4.16. Regin de no rechazo y rechazo para el ejemplo 4.16 ............................................. 150
Figura 4.17. Regin de no rechazo y rechazo para el ejemplo 4.17 ............................................. 151
Figura 4.18. Regin de no rechazo y rechazo para el ejemplo 4.18 ............................................. 153
Figura 4.19. Regin de no rechazo y rechazo para el ejemplo 4.19 ............................................. 155
Figura 4.20. Regin de no rechazo y rechazo para el ejemplo 4.20 ............................................. 157
Figura 4.21. Regin de no rechazo y rechazo para el ejemplo 4.21 ............................................. 158
Figura 4.22. Regin de no rechazo y rechazo para el ejemplo 4.22 ............................................. 162
Figura 4.23. Regin de no rechazo y rechazo para el ejemplo 4.22 ............................................. 162
Figura 4.24. Regin de no rechazo y rechazo para el ejemplo 4.23 ............................................. 164
Figura 5.1. Zona de rechazo y punto crtico de la prueba ji-cuadrada ......................................... 168
Figura 5.2. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.1170
Figura 5.3. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.2173
Figura 5.4. Histograma de las clases de frecuencia para los datos de la muestra del ejemplo 5.3175
Figura 5.5. Distribucin terica y emprica de la prueba de Kolmogorov-Smirnov .................... 177

vii
ndice de tablas
Tabla 1.1 Valores de la funcin potencia de la prueba dado ....................................................... 26
Tabla 1.2 Valores de la funcin potencia de la prueba dado p ....................................................... 28
Tabla 1.3 Valores de la funcin potencia de la prueba dado ....................................................... 32
Tabla 2.1 Posibles pruebas para cuando X  {0,1,2} y clculo de los errores tipo I y II del ejemplo
2.1 .................................................................................................................................................... 35
Tabla 3.1 Valores de teta con su respectivo valor de potencia de la prueba del ejemplo 3.3 ......... 80
Tabla 3.2 Valores de la potencia de la prueba del ejemplo 3.5. ..................................................... 83
Tabla 4.1 Intervalos de clase y frecuencia de una m.a. para el problema 4.4 .............................. 127
Tabla 4.2 Datos de resistencia en tensin de dos tipos de rosca................................................... 138
Tabla 4.3 Nmero de latidos del corazn antes y despus de un experimento en animales ........ 145
Tabla 4.4 Diferencia del nmero de latidos del corazn antes y despus de un experimento en
animales ......................................................................................................................................... 146
Tabla 4.5 Datos de resistencia en tensin de dos tipos de rosca................................................... 147
Tabla 4.6 Diferencia de la resistencia en tensin de dos tipos de rosca ....................................... 148
Tabla 4.7 Resistencia en tensin de dos tipos de tornillos ........................................................... 152
Tabla 5.1 Datos de la muestra para probar normalidad del ejemplo 5.1 ...................................... 170
Tabla 5.2 Clases de frecuencia para los datos de la muestra del ejemplo 5.1 .............................. 170
Tabla 5.3 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.1 ............................................................................................................ 171
Tabla 5.4 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.1 ............................................................................................................ 172
Tabla 5.5 Datos de la muestra para probar exponencialidad del ejemplo 5.2 .............................. 172
Tabla 5.6 Clases de frecuencia para los datos de la muestra del ejemplo 5.2 .............................. 173
Tabla 5.7 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.2 ............................................................................................................ 174
Tabla 5.8 Datos de la muestra para probar si tienen distribucin geomtrica del ejemplo 5.3 .... 174
Tabla 5.9 Clases de frecuencia para los datos de la muestra del ejemplo 5.3 .............................. 175
Tabla 5.10 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.3 ............................................................................................................ 175
Tabla 5.11 Datos de la muestra para probar si tienen distribucin normal del ejemplo 5.4 ......... 177
Tabla 5.12 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.4 ............................................................................................................ 178
Tabla 5.13 Datos muestrales para probar si tienen distribucin uniforme del ejemplo 5.5 ......... 179
Tabla 5.14 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.5 ............................................................................................................ 179
Tabla 5.15 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos
muestrales del ejemplo 5.6 ............................................................................................................ 180

viii
Resumen
En la actualidad, el uso de las pruebas de hiptesis es una de las principales herramientas para
la toma de decisiones. El presente trabajo plantea la metodologa que se sigue para la
elaboracin de dichas pruebas; para ello, el trabajo se ha divido en cinco captulos.
En el captulo uno se da una introduccin a los conceptos bsicos de las pruebas de
hiptesis estadsticas, los errores que se pueden cometer al momento de realizar dichas
pruebas, la mejor prueba, su tamao, su potencia y su nivel de significancia.
En el captulo dos se dan las bases tericas de las pruebas de hiptesis, para ello se
estudia el lema de Neyman-Pearson o lema fundamental de prueba de hiptesis. Seguido de
esto, se dan las metodologas para las pruebas con hiptesis simples, compuestas y sus
posibles combinaciones.
El captulo tres se generaliza la idea del lema de Neyman-Pearson.
En el captulo cuatro se dan a conocer las pruebas para los parmetros de una
distribucin normal, ya sea cuando se conoce o no la varianza, pruebas para diferencia de
medias, para el cociente de varianzas, etctera. Adems se explica la relacin que existe entre
las pruebas de hiptesis y los intervalos de confianza, dado que ambos son herramientas de la
Inferencia Estadstica.
Por ltimo, en el captulo cinco se dan a conocer tres de las pruebas de bondad de ajuste
ms importantes a saber: prueba Ji-cuadrada (paramtrica), prueba de Kolmogorov-Smirnov
(no paramtrica) y prueba de normalidad de Shapiro-Wilk.
Es importante sealar que el presente trabajo contiene ejemplos prcticos en cada uno de
los captulos donde se aplican dichas metodologas en diversas reas del saber.

ix
Summary
At present, the use of hypothesis testing is one of the main tools for decision making.
This work reviews the methodology for developing such tests, for this, the work has been
divided into five chapters.

Chapter one provides an introduction to the basic concepts of statistical hypothesis


testing, errors can be made at the time of these tests, the best test, its size, its power and its
significance level.

Chapter two the theoretical basis of hypothesis testing is given, the Neyman-Pearson
lema or fundamental lema of hypothesis testing is explored. Methodologies are given for
testing with simple hypothesis, compound hypothesis and their possible combinations.

Chapter three generalizes the idea of Neyman-Pearson lema.

Chapter four presents tests for the parameters of a normal distribution when variance is
known or unknown, testing for mean difference, for the variance ratio, etc. Besides, the
relationship between hypothesis testing and confidence intervals are explained.

Finally, in chapter five are released three of the most important goodness of fit tests,
namely Chi-square test (parametric), Kolmogorov-Smirnov (nonparametric) test and Shapiro-
Wilk normality test.

This work contains practical examples in each of the chapters that apply these
methodologies in different areas of knowledge.

x
Introduccin
Al hablar de Estadstica, se suele pensar slo en colecciones de datos; sin embargo, se deja a
un lado el llamado Mtodo estadstico considerado como una disciplina cientfica con
entidad propia.
La razn principal de que este Mtodo Estadstico se haya desarrollado en los ltimos
aos dentro de las ciencias experimentales es que estas ciencias estn sujetas a razonamientos
de tipo inductivo que van de lo particular a lo general; por lo que el nico mtodo cientfico
para validar tales extensiones es el Mtodo Estadstico, pues precisamente esa es la causa de
su existencia.
As el objetivo de este mtodo es hacer inferencias acerca de los parmetros,
desconocidos, de las poblaciones basadas solamente en la informacin obtenida mediante
datos muestrales. Estas inferencias se expresan en una de dos maneras: como estimaciones de
los parmetros respectivos o como pruebas de hiptesis referentes a sus valores.
Son muchas las situaciones donde el Mtodo Estadstico se convierte en la nica
herramienta que, hoy por hoy, permite dar luz y obtener resultados en cualquier tipo de
estudio; por ejemplo, un investigador en medicina propone la hiptesis de que un nuevo
medicamento es ms efectivo que otro para curar cierta enfermedad ; un tcnico de control de
calidad puede proponer la hiptesis de que un nuevo mtodo de montaje produce solamente
5% de artculos defectuosos; un educador puede afirmar que dos mtodos para ensear a leer
tienen la misma eficacia; un candidato poltico puede afirmar que la mayora de los votantes
estn de su parte; etc.
Los escenarios mencionados corresponden a inferencias expresadas en trminos de
pruebas de hiptesis; as, las pruebas de hiptesis se realizan en todos los mbitos en los que
puede contrastar la teora frente a la observacin.
Por lo expuesto anteriormente, la expansin del Mtodo Estadstico es tal que, de
todas las disciplinas que se estudian, la Estadstica es prcticamente la nica que se tendr
como asignatura en la mayor parte de las carreras universitarias; desde las tpicamente
consideradas experimentales, como la Medicina o la Biologa hasta carreras consideradas
como de letras como la Psicologa, Sociologa o incluso la Geografa.
Derivado de todo esto; surge la oportunidad de exponer, en este trabajo, las
metodologas estadsticas que se aplican en las ciencias experimentales o en algn problema
en particular donde la Estadstica permite dar solucin al escenario que se tenga.
Son muchas las herramientas de la Estadstica que se pueden emplear en la solucin de
diversos problemas; que van desde la teora de estimacin, curvas de ajuste por medio de
regresin y correlacin; anlisis de varianza; etc. Pero son sin duda, los mtodos de las
pruebas de hiptesis estadsticas, los que validan los resultados que arrojan las tcnicas
mencionadas anteriormente.

1
En este contexto y dado que las pruebas de hiptesis estadsticas ocupan un papel
central, se muestran, aunque de manera modesta en este trabajo, las metodologas que se
aplican en la estimacin por medio de pruebas de hiptesis tan usadas en todas las ciencias del
saber.
En primer lugar, se habla de los conceptos elementales para concebir una prueba de
hiptesis junto con todos los elementos que rodean a estas pruebas. Teniendo ya las bases
fundamentales, se prosigue a enunciar las distintas pruebas que se pueden realizar para
contrastar las observaciones que se tienen de un proceso junto con los teoremas que sustentan
los procedimientos empleados para el contraste de estas hiptesis; es decir las pruebas de
razn de verosimilitud.
Asumiendo la asimilacin de las metodologas empleadas en las pruebas mencionadas,
se prosigue a generalizar la idea de las pruebas de razn para dos o ms parmetros de cierta
poblacin.
Teniendo estos procedimientos; se aterriza la idea para los parmetros de una de las
distribuciones ms importantes, o incluso la ms importante, dentro de la Estadstica, que es la
distribucin normal. Adems de que tambin se abordan los procedimientos para poblaciones
de tipo Bernoulli.
Por ltimo, y dado que en todos los captulos se trabaja con poblaciones donde se asume
que stas tienen cierta distribucin, se habla de tres de las pruebas ms importantes de bondad
de ajuste, a saber: la prueba ji-cuadrada, la prueba de Kolmogorov-Smirnov y la prueba de
Shapiro Wilk. stas con la finalidad de que, al tener las observaciones de un fenmeno dado,
se puedan emplear estas pruebas para saber el tipo de poblacin a la que pertenecen y as,
poder utilizar de manera adecuada las herramientas que se proponen en este trabajo.

2
Planteamiento
Supngase que se quiere basar un experimento en Mtodos estadsticos; es razonable
preguntarnos Cuntas observaciones necesito para tener lo que deseo obtener del estudio?,
Qu tan poderoso es el estadstico de una prueba para detectar un efecto significativo, dado
un tamao de prueba, nivel de significancia y un tamao de efecto estandarizado? Estos
anlisis examinan la sensibilidad del poder estadstico y el tamao de muestra hacia otros
componentes que habilitan al decisor como un investigador para utilizar eficientemente los
recursos y llevar a cabo una buena toma de decisiones.
La comprensin de estos y muchos otros conceptos ms deben ser necesarios para una
verdadera investigacin de un problema en particular. Sin embargo, la importancia de la
metodologa Estadstica no implica que algunos de los conceptos que se manejen sean de
inmediata comprensin, ya que se requiere de cierta madurez intelectual para su cabal
asimilacin.
En relacin a la Estadstica, se han escrito cientos de libros de texto dirigidos a lectores
que emprenden en el estudio de esta materia. Sin embargo, esos cientos se reducen a unas
cuantas docenas al restringirse el campo a los escritos originalmente en espaol incluso los
pocos traducidos.
Ahora, existen mltiples maneras de abordar a la Estadstica; que van desde formas
puramente tericas hasta aquellas en las que pareciera que la metodologa consiste en una serie
de pasos haciendo a un lado el sentido intrnseco de la Estadstica.
Es por ello que investigadores, estudiantes en Estadstica o afines, presentan una
problemtica seria al momento de adentrarse en el estudio de esta materia. No existen escritos
tericos bsicos en donde el estudiante no se pierda dada su poca formacin matemtica
aunado a la complejidad que tiene la comprensin de muchos conceptos bsicos.
En consecuencia, este trabajo aborda las bases tericas elementales para el desarrollo de
la teora de prueba de hiptesis junto con su metodologa que es la que hace aterrizar todos los
conceptos desde un punto de vista prctico. As, estudiantes que cuenten con los elementos
bsicos de probabilidad y clculo no presenten problemas al momento de afrontar el estudio de
esta materia.

3
Objetivos
Los objetivos que se han planteado en el presente trabajo para los alumnos e investigadores de
Estadstica o disciplinas afines, son los siguientes:

 Mostrar los elementos bsicos de la teora clsica para pruebas de hiptesis.

 Presentar metodologas para el empleo de las pruebas de hiptesis en problemas


donde se pretende contrastar lo terico contra lo observado.

 Mostrar los mtodos de pruebas de hiptesis por el mtodo de razn de


verosimilitud y razn de verosimilitud generalizada para las pruebas simple
contra simple, simple contra compuesta, compuesta contra simple y compuesta
contra compuesta

 Ofrecer la posibilidad, a los estudiantes de un curso sobre Inferencia Estadstica


o afines, de asentar, desde un punto de vista terico y prctico los conceptos que
en dicho curso se contemplan.

 Mostrar las principales pruebas de bondad de ajuste.

4
Captulo1
Conceptos bsicos de las pruebas de
hiptesis estadsticas

Introduccin

D
entro de la Estadstica Inferencial existen diferentes mtodos de estimacin para los
parmetros, uno de tales mtodos se fundamenta en suposiciones o conjeturas sobre dichos
parmetros, para despus realizar las pruebas estadsticas respectivas sobre la validez o
invalidez de las mismas.
En qu consiste una prueba de hiptesis?
Se explicar de una forma intuitiva, sin detalles, en que consiste una prueba de hiptesis. Para
esto suponga que se tiene una poblacin en estudio de la cual se desconocen los parmetros de su
distribucin, y sobre los que se hacen conjeturas y se desea saber si dichas suposiciones son o no
validas. Para tal efecto, se realizan experimentos y recolectan los datos resultantes con los que se
pretende dar respuesta a la valides de las conjeturas hechas sobre los parmetros, para esto es necesario
apoyarse en un mtodo terico estadstico que justifique dichas respuestas, y de esta manera se estar
llevando a cabo una prueba de hiptesis.
Un ejemplo simple que explica lo anterior es el siguiente. Supngase que la poblacin en
estudio consiste en las calificaciones de los alumnos de Ingeniera en la materia de Mecnica. Adems,
se conoce la distribucin de la poblacin, pero se desconoce su parmetro (media) sobre el que es
formulada la conjetura de que es mayor a 7.0. Para probar la verdad o falsedad de la conjetura se elige
una realizacin de una muestra aleatoria de las calificaciones de tamao 15, obteniendo los siguientes
resultados:
8, 4, 6, 7, 6, 9, 5, 7, 8, 10, 7, 3, 9, 8, 4
Calculando la calificacin promedio de estos datos, se obtiene x1  6.7 .
Se podr decir que la conjetura es falsa?
Suponga que se elige otra realizacin de la muestra aleatoria obteniendo
6, 10, 7, 5, 7, 9, 10, 8, 7, 9, 7, 8, 4, 6, 8
Pero, en este caso la calificacin promedio resulta x2  7.4 .
Se podr decir que la conjetura es verdadera?
Previo a la respuesta de las preguntas anteriores, es necesario analizar lo siguiente:
Uno de los principales problemas al iniciar el estudio de las pruebas de hiptesis reside en
comprender que el cumplimiento o incumplimiento de la conjetura por parte de los datos de la
realizacin que se llev a cabo, no es suficiente, para que, estadsticamente se asegure que es falsa o

5
verdadera la conjetura. As, en la primera realizacin de una muestra aleatoria de tamao 15 no se
puede decir estadsticamente que la conjetura,   7 , es falsa debido a que x1  6.7 . De forma similar,
no se puede decir estadsticamente, con la segunda realizacin, que la conjetura   7 sea verdadera,
por lo tanto, para tomar una decisin sobre la verdad o falsedad de la conjetura es necesario estudiar el
desarrollo terico que sustenta las decisiones en las pruebas de hiptesis.
En el presente captulo se revisarn los conceptos bsicos sobre la teora de las Pruebas de
Hiptesis.
1.1 HIPTESIS ESTADSTICA
En Inferencia Estadstica tambin se estudia a los estimadores puntuales y los intervalos de confianza
para realizar estimaciones sobre los parmetros de la distribucin de una poblacin y poder llevar a
cabo una mejor toma de decisiones al analizar la poblacin de inters. En el presente captulo se
revisarn los conceptos bsicos de la teora para estudiar un mtodo estadstico que ayude a la toma de
decisiones en problemas que estn relacionados con poblaciones que resultan muy difciles o
imposibles de analizar en su totalidad. Por ejemplo, para estimar con cierta significancia la vida
promedio de focos de cierta marca, se puede formular una hiptesis, digamos por ejemplo que el
promedio de vida de los focos es de 500 horas, la cual deber probarse; es decir, se buscarn
evidencias que ayuden a decidir si la hiptesis se rechaza o no.
Definicin 1.1
Se llama hiptesis estadstica a cualquier afirmacin o conjetura referente a los parmetros de
una o ms poblaciones1.
Como se mencion, probar una hiptesis estadstica consiste en buscar evidencias para decidir
sobre la aceptacin o rechazo de la afirmacin realizada. En el ejemplo de los focos se puede
conjeturar que la vida promedio es mayor a las 750 horas de duracin, ahora supngase que se elige
una muestra de tales focos y resulta que su vida promedio fue de 730 horas; la primera pregunta que
surge despus de analizar dicha muestra es la siguiente:
Es evidencia suficiente el resultado de la realizacin para concluir que la conjetura no es correcta?
En una prueba de hiptesis, la verdad con respecto a la decisin tomada de rechazar o no la
afirmacin o conjetura slo se puede conocer al estudiar a toda la poblacin, por lo que en las pruebas
realizadas el decisor debe acostumbrarse a comprender que el aceptar una afirmacin basndonos en
una realizacin slo indica que, con los datos obtenidos no existe evidencia suficiente para rechazarla.
Similarmente, el rechazar la afirmacin formulada, esto slo significa que no existen evidencia
suficiente con la realizacin obtenida para no rechazar la afirmacin.
Al formular una afirmacin sobre un suceso y realizar una prueba de validacin, es lgico
preguntarse
Con base en qu se rechaza o no la afirmacin realizada?
Antes de contestar a la pregunta, considere lo siguiente.
Note que al establecer una hiptesis siempre existe, de forma implcita, otra que se le
contrapone, de tal manera que a las hiptesis formuladas se les da el nombre de hiptesis nula y
alterna, que se denotan por, H 0 y H 1 o H a , respectivamente. As, inicia uno de los primeros
problemas en el estudio de las pruebas de hiptesis,
Cmo determinar la hiptesis nula y alterna?

1
Casella George and Berger L. Roger. Statistical Inference. 2da edicin. pp. 373
6
En los textos metodolgicos sobre pruebas de hiptesis la formulacin de las hiptesis nula y
alterna es un poco confusa, ya que se quieren establecer reglas que no consideran la esencia de la teora
sobre la qu estn cimentadas las pruebas de hiptesis. Por consiguiente, antes de proseguir y tratar de
dar respuesta a la pregunta anterior, sern revisados los conceptos necesarios para dar una respuesta
satisfactoria a la pregunta y explicar el porqu de dicha eleccin.
1.2 CONJUNTO DE REALIZACIONES DE UNA HIPTESIS ESTADSTICA
Suponga que el decisor se encuentra ante el problema de la duracin promedio de los focos
(mencionado arriba), en donde la poblacin tiene un comportamiento descrito por la funcin de
densidad f ( x;  ) , donde el parmetro  tiene un espacio paramtrico   0,  (  tiempo de vida
de los focos, luego   0 ). De tal forma que con las condiciones del ejemplo se puede establecer el
siguiente contraste de hiptesis (an no se ha explicado cmo establecer la hiptesis nula y alterna):
H 0 :   750
H 1 :   750

Es decir, el espacio paramtrico   0,  es particionado en dos regiones que son denotadas,
 para la regin correspondiente al parmetro en la hiptesis nula y (
 ) a la regin
correspondiente al parmetro en la hiptesis alterna. De esta forma se puede establecer el contraste de
hiptesis anterior en forma ms general y equivalente a
H 0 :  
H1 :   

Hasta el momento no se ha hablado sobre el problema que ser de inters en forma prctica, es
decir, qu hacer cuando se tengan nicamente datos para decidir cul de las hiptesis es valida, ms
an, qu se entender por una prueba de hiptesis.
Continuando con el ejemplo del problema de la prueba de hiptesis para la vida promedio de los
focos y que cada foco tiene un tiempo de vida descrito por una variable aleatoria con funcin de
densidad f ( x;  ) . Por otro lado, se tiene una muestra aleatoria de tales variables ( X 1 , X 2 , , X n )
denotada por el vector X . Pero como en todo problema concreto se requiere trabajar no con la
muestra aleatoria, sino con sus realizaciones, as R representa el conjunto de todas las realizaciones de
X . Luego,
R  x | x es una realizacin de X.
As, que en un problema prctico es posible particionar al conjunto R y tomar una decisin sobre
la valides de la hiptesis nula con base en los resultados de las observaciones.
1.3 PRUEBA ESTADSTICA DE UNA HIPTESIS
Si en el supuesto de que una hiptesis determinada es cierta, se encuentra que los resultados
observados en una muestra aleatoria difieren marcadamente de aquellos que caba esperar con la
hiptesis y con la variacin propia del muestreo, se dira que las diferencias observadas son
significativas y se estara en condiciones de rechazar la hiptesis. Por ejemplo, si en 20 lanzamientos
de una moneda se obtienen 16 caras, se estara inclinado a rechazar la hiptesis de que la moneda no
est cargada, aunque sera posible que fuese un rechazo errneo.
Los procedimientos que facilitan el decidir si una hiptesis se rechaza o no, as como el
determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman
pruebas de hiptesis, ensayos de significancia o reglas de decisin.

7
Definicin 1.2
Se llama Prueba de hiptesis, para probar H 0 contra H 1 , a una particin de R en dos
subconjuntos, que son denotados por Ra y Rr y que se llaman regin de no rechazo y regin
de rechazo o regin crtica, respectivamente2.
Note que a partir de la definicin anterior se puede establecer un procedimiento de tal forma que
con base en la realizacin de una muestra aleatoria se podr decidir si H 0 es verdadera o no.
Cmo determinar cundo una hiptesis nula debe ser rechazada o no?
Para el contraste de hiptesis de un parmetro , en general
H 0 : 
H1 :  

la regla de decisin estar dada con base en la realizacin x como:
 Rechazar H 0 si x  Rr , Rr - regin de rechazo o regin crtica.
 No rechazar H 0 si x  Ra , Ra - regin de no rechazo.

NOTA
Observe que  y 
 no son iguales a Ra y Rr , porque los primeros dos
subconjuntos forman una particin del espacio paramtrico, mientras que los segundos
son una particin del conjunto de realizaciones. As, la regla de decisin est dada con
base en las realizaciones.

Por ejemplo, para el caso particular del tiempo de vida promedio de los focos, se tiene
H 0 :   750
H 1 :   750
Luego, R  x | x es una realizacin de X y es posible elegir un valor  0   , no
necesariamente  0  750 , de tal forma que la particin de R estar dada por
Ra  x | x  R y x   0 
Rr  x | x  R y x   0 
De donde se observa que para cada valor elegido de  0   se tiene una prueba de hiptesis o
particin de R, al valor  0 que divide las regiones de rechazo y no rechazo, a este valor se le suele
llamar valor crtico. Por ejemplo, es posible considerar el valor crtico  0  760 horas, quedando
establecidas de esta forma las regiones de no rechazo (para promedios menores o iguales a 760) y
rechazo o regin crtica (para promedios mayores a 760). Lo ms probable es que surja la pregunta
cmo se determinaron las regiones? En est caso, la cantidad de 760 se ha elegido como un ejemplo
ilustrativo de que son las regiones de rechazo y no rechazo. Pero como se ver en la seccin siguiente
estas regiones estn vinculadas o dependen del tamao del error que se cometa al rechazar o no la
hiptesis nula.
As, se ha visto que es posible tener una infinidad de pruebas y desde luego, surgen las preguntas
Cul de todas las pruebas sera una buena prueba?
Se podr establecer una prueba que sea la mejor?
Con respecto a las respuestas, stas se vern ms adelante.

2
Op. Cit., p. 403
8
1.4 TIPOS DE ERRORES EN UNA PRUEBA DE HIPTESIS: TIPO I Y TIPO II
En el punto anterior se revis la definicin de prueba de hiptesis, que se defini como una particin
del conjunto de realizaciones, posteriormente mediante el establecimiento de una regla de decisiones se
puede decidir si se rechaza o no la hiptesis nula, pero en Estadstica los resultados encontrados no son
100% confiables, ya que siempre dependen de las condiciones aleatorias de variabilidad del fenmeno
en estudio. Por tal razn, al tomar una decisin con respecto a la valides de la hiptesis nula, el decisor
est propenso a cometer uno de dos errores posibles, los que obviamente tratar de que sean lo ms
pequeo posibles.
Definicin 1.3
Se llama error tipo I cuando se rechaza la hiptesis nula siendo que en realidad es verdadera.
Por otro lado, se llama error tipo II, cuando no se rechaza la hiptesis nula siendo que en
realidad es falsa3.
Dadas las definiciones de los dos errores al rechazar o no una hiptesis nula, surge la pregunta:
Cul es la probabilidad de cometer alguno de los errores tipo I II?
Con la definicin anterior es posible dar respuesta a la pregunta sobre una buena prueba, ya que
ser razonable identificar a una buena prueba, como aqulla que minimiza las probabilidades de ambos
tipos de errores. Similarmente, la mejor prueba, si es que existe, ser la prueba que minimiza las
probabilidades de ambos errores con respecto a todas las pruebas posibles.
Del prrafo anterior parece que encontrar una buena prueba es tarea simple, sin embargo,
generalmente cuando se minimiza la probabilidad de uno de los errores, la probabilidad del otro tipo de
error aumenta. De hecho dar respuesta a las preguntas anteriores es uno de los principales problemas
que existe en la teora de prueba de hiptesis, por consiguiente, se requiere de cierto tiempo y mayor
comprensin del problema. Para esto se introduce la siguiente notacin.
P(Error tipo I usando Rr | H 0 )  Probabilidad de cometer el error tipo I, con H 0 verdadera.
Similarmente se tiene
P(Error tipo II usando Ra | H1 )  Probabilidad de cometer el error tipo II, con H 1 verdadera.
Note que el clculo de probabilidades para el error tipo I tambin se puede llevar a la regin de
aceptacin por medio del complemento
P(Error tipo I usando Rr | H 0 )  1
P(Error tipo I usando Ra | H 0 )
Note tambin que el clculo de probabilidades para el error tipo II tambin se puede llevar a la
regin de rechazo por medio del complemento
P(Error tipo II usando Ra | H 1 )  1
P(Error tipo II usando Rr | H 1 ) .

EJEMPLO 1.1
Suponga que el tiempo de vida de los focos, stos tienen una desviacin estndar de vida igual a 50
horas, considerando una muestra de 49 focos se desea probar la hiptesis:
H 0 :   750 ,
H 1 :   750 ,
con la regin de rechazo establecida para promedios de vida mayores a 760 horas. Calcule
a) la probabilidad de cometer un error tipo I para el caso en que   740 .
b) la probabilidad de cometer el error tipo II para el caso en que   755 .

3
DeGroot H. Morris, Schervish J. Mark. 2001. Probability and Statistics. pp. 442
9
Antes de resolver el problema note que en el clculo del error tipo I, la hiptesis nula tiene que
ser verdadera,   750 . Es decir, para calcular la probabilidad del error tipo I se tiene una infinidad de
valores del parmetro media, por tal razn es elegido uno, en particular   740 . Similarmente para
calcular la probabilidad del error tipo II es elegido el valor   755 , que cumple con la condicin
  750 , cuando H 1 es verdadera.
Solucin
a) Para calcular las probabilidades se tiene que la regin de rechazo est dada por X  760 , por otro
lado, el tamao de la muestra es n  49 , luego es posible utilizar el Teorema de Limite Central.
# X
 760
 # 760
740 
P(Error tipo I con Rr | H 0 )  P( X  760 |   750)  P!  |   740  P! Z 
!  n 50 49  ! 50 49 
"  "
 PZ  2.8  0.0026

b) Similarmente para calcular la probabilidad del error tipo II, se usa el Teorema de Limite Central y
el hecho de que Ra est dada por X  760 .
# X
 760
 # 760
755 
P( II usando Ra | H 1 )  P( X  760 |   750)  P!  |   755  P! Z 
!  n 50 49  ! 50 49 
"  "
 PZ  0.70  0.7580
Tambin se puede calcular por medio del complemento
P(Error tipo II usando Ra | H 1 )  1
P(Error tipo II usando Rr | H 1 ) .
Luego,
P(Error tipo II usando Ra | H 1 )  1
P(Error tipo II usando Rr | H 1 )  1
P( X  760 |   750)
# X
 760
 # 760
755 
 1
P!  |   755  1
P! Z 
!  n 50 49
"


!
" 50 49 
 1
PZ  0.70  0.7580
El valor del error tipo II es demasiado grande, y en consecuencia lo ms probable es que la
prueba utilizada o lo que es lo mismo la particin del conjunto de realizaciones no sea la ms adecuada.
EJEMPLO 1.2
Suponga que en el ejemplo anterior, se considera la regin de rechazo para promedios de vida mayores
a 752 horas. Calcule
a) la probabilidad de cometer un error tipo I para el caso en que   740 .
b) la probabilidad de cometer el error tipo II para el caso en que   755 .
Solucin
a) Continuando con la misma metodologa de clculos de probabilidades resulta.
# X
 752

P(Error tipoI usando Rr | H 0 )  P( X  752 |   750)  P!  |   740
!  n 50 49 
" 
# 752
740 
 P! Z   PZ  1.68  0.0465
! 50 49 
"
b) Para calcular la probabilidad del error tipo II, con Ra dada por X  752 .

10
# X
 752
 # 752
755 
P( error tipo II usando Ra | H 1 )  P( X  752 |   750)  P!  |   755  P! Z 
!  n 50 49  ! 50 49 
"  "
 PZ 
0.42  0.3372

Comparando las dos pruebas anteriores, X  760 con X  752 , se concluye que es mejor la
prueba para la particin X  752 y X  752 de R. Puesto que la probabilidad del error tipo I es
pequea (alrededor del 5%), mientras que la probabilidad del error tipo II disminuy considera-
blemente, comparada con la correspondiente particin X  760 .
Del ejemplo anterior y las definiciones de pruebas de hiptesis y la particin del conjunto R, se
tiene que el problema de encontrar una buena prueba se puede trabajar como la determinacin de una
buena particin del conjunto R, ms an, note que una prueba queda completamente especificada con
la sola definicin de la regin de rechazo, Rr . As, a cada prueba le corresponde una pareja de
probabilidades P(I | Rr ) y P(II | Rr ) las cuales se pueden graficar en el plano cartesiano
P ( I | Rr )

1
*
* *
* **
** *
* * *
* ** *
* *
P(II | Rr )
1
Figura 1.1 Probabilidades de errores tipo I y II.
Fuente: Elaboracin propia

Luego, la mejor prueba es aquella cuya regin de rechazo R r* es tal que la pareja de
probabilidades P(II |  Rr* ), P(I | Rr* )  se encuentra ms prxima al origen de coordenadas.
Finalmente, se ha llegado al momento de definir algunos de los conceptos de mayor uso e
importancia en las pruebas de hiptesis.
1. 5 LA MEJOR PRUEBA: POTENCIA DE LA PRUEBA
Note que las pruebas dependen de la particin tomada del conjunto de realizaciones, luego es lgico
preguntarse sobre una mejor prueba y cmo determinarla. Adems, en los ejemplos anteriores se
observ que la disminucin de la probabilidad de uno de los errores influye en la probabilidad del otro,
luego es racional suponer que es necesario fijar el tamao mximo de la probabilidad que ser
permitida en la ocurrencia de uno de los errores y con base en este valor se calcula la probabilidad del
otro tipo de error.
Definicin 1.4
Se llama prueba de tamao  a una prueba Rr que satisface P(I | Rr )   para algn valor
  (0, 1) . Si adems, la prueba de tamao  tiene la mnima probabilidad del error tipo II, se
suele llamar la prueba ms potente4.

4
Op. Cit., p. 444
11
Grficamente la definicin anterior, representa lo siguiente, sea   (0, 1) y trace una lnea
horizontal, que deje por debajo a todas las pruebas de tamao  , se elige la que tenga menor valor de
la probabilidad del error tipo II, P(II | Rr ) .

P ( I | Rr )

1
*
** *
** * La mejor prueba de
*
*** ** tamao  de todas
*
* * * las mostradas
 * ** * **
** **
P(II | Rr )
1
Figura 1.2 Diferentes pruebas de tamao 
Fuente: Elaboracin propia
Se puede observar que en caso de tener una prueba de tamao  y  *  (0,1) , tal que   * ,
entonces la prueba tambin es de tamao  * . Esto se deduce inmediatamente del hecho que
P ( I | Rr )    * .
EJEMPLO 1.3
Determine qu tipo de prueba se trata, con respecto al tamao  , resultante en cada uno de los dos
ejemplos anteriores.
Solucin
En el ejemplo 1.1, se encontr que con la particin X  760 y X  760 , la probabilidad del error tipo I
P(Error tipo I usando Rr | H 0 )  0.0026.
As, es posible considerar que se trata de una prueba de tamao  , para cualquier   (0.0026, 1) .
En el ejemplo 1.2, se encontr que la particin X  752 y X  752 , la probabilidad del error tipo I
P(Error tipo I usando Rr | H 0 )  0.0465.
Luego, es posible considerar que se trata de una prueba de tamao  , para cualquier   (0.0465, 1) .
De los ejemplos anteriores se puede observar que cada clculo de probabilidades se basa en la
particin del conjunto de realizaciones, la cual queda determinada por una acotacin con respecto a una
estadstica, en los ejemplos anteriores se us X .
Definicin 1.5
Sea el contraste de hiptesis para el parmetro
H 0 : 
H1 :  

Se llama estadstica de prueba, a la estadstica que se usa para determinar la regin de rechazo
y al valor que acota a la estadstica de prueba en la determinacin de la regin de rechazo se le
llama valor crtico5.

5
Casella George and Berger L. Roger. Statistical Inference. 2da Edicin pp. 374
12
En los ejemplos anteriores la estadstica de prueba result X (debido a que el parmetro de
estudio fue  ), mientras que en el ejemplo 1.1 el valor crtico utilizado fue de 760 y en el ejemplo 1.2
de 752. Posteriormente, se utilizaron estos conceptos en cada ejercicio, de hecho se ver que uno de
los principales problemas de las pruebas de hiptesis reside en determinar la estadstica de prueba y los
valores crticos de la prueba.
De lo anterior se puede concluir:
 La prueba es la regla de decisin; rechazar o no rechazar la hiptesis nula.
 Al definir la particin, el decisor est definiendo la regla de decisin y requiere, tanto de
la estadstica de prueba como del valor crtico.
En este momento se est en condiciones de hablar sobre la mejor prueba, ya que de las
definiciones y ejemplos anteriores se puede apreciar que determinar una prueba que sea la mejor de
todas no ha de ser tarea fcil y, efectivamente esto se puede comprobar con el siguiente ejemplo.
EJEMPLO 1.4
Considere el tiempo de vida de los focos, stos tienen una distribucin normal N (  ,502 ) y se desea
obtener la mejor prueba para el contraste de hiptesis
H 0 :   750
H 1 :   750 ,
considerando una muestra aleatoria de 49 focos y como estadstica de prueba a X .
Solucin
Se detallarn los pasos de solucin que se repetirn para cualquier otra situacin.
Paso 1. Siempre que sea posible la estadstica de prueba deber ser uno de los estimadores puntuales
del parmetro involucrado en las hiptesis. Obviamente, se recomienda buscar entre los
estimadores de mxima verosimilitud, o entre aquellos que cumplan propiedades deseables de
un estimador puntual. En este ejemplo, el parmetro es la media de una distribucin normal,
luego es recomendable utilizar como estadstica de prueba a X .
Paso 2. A partir de la hiptesis nula se establece una regin de rechazo que sea razonable con la
prueba, estar basada en la hiptesis H 1 y la estadstica de prueba. En este caso se denota al
valor crtico por a, luego Rr (a)  x | x  a.
Paso 3. Determinando la expresin para la probabilidad del error tipo I, con ella se encuentran todas
las pruebas de tamao  .
En el ejemplo que se est resolviendo para el clculo de probabilidades se tiene que la regin de
rechazo est dada por X  a , por otro lado, el tamao de la muestra es n  49 , en este caso es posible
utilizar el Teorema de Limite Central.
#X
 a

P(Error tipo I usando Rr | H 0 )  P( X  a |   750)  P!  |   750
!  n 50 49 
" 
# #a
 # #a

 P!! Z  7!  |   750  1
$!! 7!   para   750
" " 50   " " 50  
As, todas las pruebas de tamao  para el problema estn dadas por:
# #a

1
$!! 7!     , para   750 .
" " 50  

13
A partir de la expresin para calcular la probabilidad del error tipo I, se tiene tanto, al valor de a
como el de  desconocidos, los cuales se buscan de tal manera que la prueba sea de tamao  y
adems resulte la mejor prueba de tamao  .
Paso 4. Para determinar los valores de a y  que hagan a la prueba la mejor de tamao  , se fija el
valor de a y con los valores del parmetro  se acota el valor de a.
En esta parte se pueden utilizar las propiedades de las funciones montonas crecientes o
decrecientes para acotar los valores de a.

NOTA
Entre algunas otras propiedades de las funciones montonas se tienen las siguientes:
Si h(x) es una funcin montona creciente o decreciente, entonces tiene inversa.
Si h(x) es una funcin montona creciente, entonces h
1 (%) es montona creciente.
Si h(x) es una funcin montona decreciente, entonces h
1 (%) es montona decreciente.
Si h(x) es una funcin montona creciente, entonces
h(x) es montona decreciente.
Si h(x) es una funcin montona decreciente, entonces
h(x) es montona creciente.
Si h(x) es una funcin montona creciente y y x , entonces h( y) h( x) .
Si h(x) es una funcin montona decreciente y y x , entonces h( y)  h( x) .

En el ejemplo que se est resolviendo y de la expresin anterior para el tamao de la prueba


# #a

1
$!! 7!     , para   750 , se va a despejar el valor de a. Para esto note que la funcin $
" " 50  
es montona creciente. Luego,
# #a
 # #a
 #a
 50
1
1
$!! 7!     & 1
  $!! 7!   & 7!   $
1 (1
 ) & a
  $ (1
 ) .
" " 50   " " 50   " 50  7
50
1
Finalmente, se tiene que a  $ (1
 )   para   750 .
7
Luego, buscando un valor de  tal que la cota de a se cumpla para todos los valores   750 ,
50
1 def
a $ (1
 )  750  a * ( ) .
7
Paso 5. Determinando la expresin para obtener la probabilidad del error tipo II y todas las pruebas
de tamao  que minimizan la probabilidad del error tipo II.
#X
 a

P(Error tipo II usando Ra | H 1 )  P( X  a |   750)  P!  |   750
!  n 50 49 
" 
# #a
 # #a

 P!! Z  7!  |   750  $!! 7!   para   750
" " 50   " " 50  
Fijando  y variando a para determinar el valor que minimiza la expresin para la probabilidad
# #a

del error tipo II, para toda   750 . Esto se logra determinando que $!! 7!   es decreciente
" " 50  
para   750 , luego su mximo lo alcanza cuando  es mnimo. Es decir,

14
# #a
 # #a
 # # a
750
$!! 7!    max $!! 7!    $!! 7!   .
" " 50    750 " " 50   " " 50  
# # a
750
Buscando el valor de a que haga a la funcin $!! 7!   mnima para toda   750 , ya
" " 50  
que esto minimiza la probabilidad del error tipo II. Lo cual ocurre para el valor ms pequeo de a, que
result a  a * ( ) .
Por lo tanto, Rr (a * ( )) es la prueba de tamao  con probabilidad de error tipo II lo ms
pequea posible.
1.6 FUNCIN POTENCIA DE LA PRUEBA.
Originalmente se definieron las pruebas de hiptesis con regiones de rechazo y no rechazo, esto dio
una base para comprender mejor cmo establecer los contrastes de hiptesis. Para explicar de forma
ms clara la obtencin de la mejor prueba se introduce una funcin indicadora.
Definicin 1.6
Sean las hiptesis nula H 0 y alterna H 1 , se llama funcin de prueba6 a  : R ' 0, 1 tal que
*0 si no se rechaza H 0
 (x)   ( x1 , x 2 ,  , x n )  ) .
(1 si se rechaza H 0

NOTA
Observe que a cada particin de R en Ra y Rr le corresponde una funcin de prueba
*0, si ( x1 , x 2 ,  , x n )  Ra
 Rr (x)   Rr ( x1 , x 2 ,  , x n )  )
(1, si ( x1 , x 2 ,  , x n )  Rr
e inversamente a cada funcin de prueba  (x) le corresponde una particin
Ra ( )  x |  ( x1 , x 2 , , x n )  0
Rr ( )  x |  ( x1 , x 2 , , x n )  1

Supngase que se tiene un contraste de hiptesis para el parmetro


H0 : 
H1 :  

En donde,  es el espacio paramtrico, se introducir la prueba de tamao  para las regiones
del parmetro, para esto recuerde que la regin para la hiptesis nula es  y para la hiptesis alterna
es 
 . As, de esta manera y con base en la funcin de prueba resulta que una funcin de prueba
 es de tamao  , si
P (X)  1 |     .

Esto se puede ver en la nota anterior, ya que  (x)  1 + x  Rr .

6
Alexander M. Mood, Franklin A. Graybill y Duane C. BoesIntroduction to the Theory of Statistics.pp. 403
15
Definicin 1.7
Se llama funcin de potencia de la prueba7  a  ( ) :  ' 0,1, cuando
 ( )  P (X)  1 |   P(Rechazar H 0 usando  | )
De la definicin resulta que a cada funcin de potencia le corresponde una prueba y viceversa.
Note que la funcin de potencia de la prueba se puede representar por el valor esperado de la
funcin de prueba  con parmetro , puesto que
E  (X)  1 % P (X)  1 |   0 % P (X)  0 |   P (X)  1 |    ( ) .
Observe que en la definicin de la funcin de potencia de la prueba, sta depender de la regin
en donde se encuentre el parmetro de estudio . Por ejemplo, si   , la funcin de potencia de la
prueba est definiendo a la probabilidad del error tipo I, puesto que
 ( )  P (X)  1 |   P(Rechazar H 0 usando  | H 0 ) .

1.7 TAMAO DE LA PRUEBA Y NIVEL DE SIGNIFICANCIA


Para que una prueba de hiptesis sea buena, se debe disear de una forma que minimice los
errores de decisin. Esto no es tan sencillo como puede parecer, puesto que para un tamao de
muestra dado, el intento en disminuir un tipo de error va generalmente acompaado por un
incremento en el otro tipo de error. En la prctica, un tipo de error puede tener ms
importancia que el otro, luego, el decisor tiene que elegir el tipo de error que se fijar dndole
una mayor importancia. Una forma de reducir al mismo tiempo ambos tipos de errores es
incrementar el tamao de la muestra, lo cual no siempre puede ser posible.
Definicin 1.8
Una prueba  se llama prueba de tamao  , si   (0,1) y sup  ( )   y cuando se cumple

la igualdad, entonces  se llama nivel de significancia. Note que cuando  es cerrado se
puede sustituir supremo por mximo8.
Similarmente, cuando se defini la prueba de tamao  para una particin, si la prueba  es de
tamao  , entonces tambin ser de tamao  * para toda  *   .
Por otro lado, si  
 , entonces
 ( )  P (X)  1 |  
   1
P (X)  0 |  
   1
P(Error tipo II | H 1 ) .
Generalmente, a la probabilidad del error tipo II se le suele denotar por . Es decir,
 P(Error tipo II | H1 ) .
Definicin 1.9
Se llama potencia de la prueba a 1
, en donde  P(Error tipo II | H1 ) . Es decir,
Potencia de la prueba  1
  ( ) para  
 9.

De la definicin anterior, se puede notar que la potencia de la prueba es buena cuando la


probabilidad del error tipo II es pequea.

7
Op. Cit., p. 406
8
Op. Cit., p. 407
9
Hoel Paul G., Introduction to Mathematical Statistics_3rd Ed. pp. 215
16
Note que la potencia de la prueba coincide con el valor de la funcin de potencia cuando el
parmetro  
 .
Qu representa la potencia de la prueba?
La potencia de la prueba cuantifica la probabilidad de rechazar la hiptesis nula cuando
sta es falsa. Es decir, rechazar la hiptesis nula acertadamente.
Del comentario anterior se puede notar que al llevar a cabo una prueba de hiptesis ser
recomendable trabajar, no slo con el tamao de la prueba, sino tambin con la potencia de la prueba.
Ahora es posible establecer cul ser la prueba ms deseable. Al llevar a cabo una prueba de
hiptesis la mejor funcin de prueba, dentese por  * , es aquella cuya funcin de potencia  * ( )
es de tamao  y su funcin de potencia resulte uniformemente mxima a todas las pruebas de
tamao  . Es decir,  * debe cumplir
1) sup  * ( )   .


2)  * ( )   ( ) para  
 y toda funcin de prueba  de tamao  ( sup  ( )   ).


Note que si se cumple la condicin 2), entonces  es la funcin de prueba que tiene la mnima
*

probabilidad de error tipo II. Por otro lado, si existe tal prueba  * , entonces se dice que  * es la
prueba uniformemente ms potente de tamao  (UMP())10. Grficamente se ilustra lo ocurrido
en la figura 1.3.
Ntese que en  todas las pruebas son de tamao  , mientras que en 
 la funcin de
prueba  * ( ) es superior a las dems funciones de prueba; por lo tanto, es mejor que las otras.

1
 * ( )


 
Figura 1.3 Diferentes funciones de potencia de la prueba
Fuente: Elaboracin propia
EJEMPLO 1.5
retomando el caso de la vida promedio de los focos, stos tienen una distribucin normal N (  ,502 ) ,
considerando una muestra de 49 focos y las hiptesis
H 0 :   750 ,
H 1 :   750 ,
con la regin de rechazo establecida para medias mayores a 760. Es decir, con estadstica de prueba
T (X)  X y el valor crtico a  760 , con  (x)  1 si x  760 . Determinar:
a) La funcin de potencia de la prueba.

10
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 411
17
b) Nivel de significancia.
c) Una expresin para la probabilidad del error tipo II.
d) Calcular la potencia de la prueba cuando   755 e interprete el resultado.
e) Calcular la potencia de la prueba cuando   770 
 e interprete el resultado.
Solucin
a) Se calcular la funcin de potencia, para esto se requiere la regin crtica Rr  x | x  R y x  760 .
En donde, la estadstica de prueba es T (X)  X , resultando
 (  )  P ( X)  1 |   P(Rechazar H 0 usando  |  )
# 760
 # # 760

 PX  760 |    P! Z  |    1
$!! ! 7 
!  " " 50  
" 50 49 

# # 760

Es decir, la funcin de potencia es  (  )  1
$!! ! 7  .
" " 50  
b) El nivel de significancia
*
- # # 760
 0
- # # 760
 # # 760
750
  sup  (  )  sup )1
$!! ! 7 /  1
inf $!! ! 7   1
$!! ! 7   0.081.
   750-
( " " 50  - .
  750
" " 50   "" 50  
c) La probabilidad del error tipo II
Se sabe que la funcin de potencia,  ( ) 1
para   750 , despejando a .
6 # # 760
 3 # # 760

 1
 (  )  1
41
$!! ! 7 1  $!! ! 7  para   750 .
54 "" 50  21 " " 50  
d) La potencia de la prueba cuando   755  , ser
# # 760
755
1
  (755)  1
$!! ! 7   1
$(0.7)  0.2420.
"" 50  
Si la regin de rechazo se establece para valores mayores a 760 horas y la verdadera vida
promedio de los focos es de 755 horas, entonces la potencia de la prueba tendr que ser baja, debido a
que habr muchas realizaciones con un promedio por debajo de 760 horas pero mayor a 750 (puesto
que si la vida promedio de la poblacin fuese 755, se esperara que el promedio de vida de las
realizaciones est alrededor de dicho valor, luego habr muchas realizaciones con promedio de vida
por debajo del valor crtico, ver figura 1.4). Por tales razones, no ser rechazada la hiptesis nula,
siendo que tendra que ser rechazada.

Regin de rechazo de
la prueba

750 755 760


Figura 1.4 Situacin cuando  no est en la regin de rechazo del ejemplo 1.5 d)
Fuente: Elaboracin propia

18
Se espera que la mayora de los promedios muestrales estn alrededor de   755 . En estas
situaciones se dice que la prueba elegida no fue la ms adecuada.
e) La potencia de la prueba cuando   770 
 , ser
# # 760
770
1
  (770)  1
$!! ! 7   1
$(
1.40)  0.9192.
"" 50  
La interpretacin es similar a la del inciso anterior, pero considerando que la verdadera vida
promedio de los focos es de 770 horas, esto quiere decir que al tomar realizaciones de la muestra su
vida promedio estar en las proximidades de 770 y en la mayora de los casos se tendr que rechazar la
hiptesis nula al calcular la potencia. Por consiguiente, la potencia de la prueba ser alta, ver figura
1.5. Lo anterior resulta debido a que en la mayora de las realizaciones que se calcule la vida promedio
de los focos sta resultar mayor a las 760 horas (valor crtico).

Regin de rechazo de la prueba

750 760 770


Figura 1.5 Situacin cuando  est en la regin de rechazo del ejemplo 1.5 e)
Fuente: Elaboracin propia
En estas situaciones se dice que la prueba elegida fue buena para un nivel de significancia del
8.1%.
1.8 APLICACIONES PARA EL CLCULO DEL TAMAO Y POTENCIA DE LA PRUEBA
EN EL CASO DE UN PARMETRO.
Note que en los ejemplos dados siempre se hace referencia a la estadstica de prueba como una
informacin del problema. Pero en la prctica, el conocimiento de dicha estadstica, en general, es
nulo. De hecho encontrar la estadstica de prueba en un problema, es uno de los temas centrales en las
pruebas de hiptesis. Como se ver en el captulo siguiente existen diferentes mtodos que pueden
llevar al decisor a determinar una estadstica de prueba. Pero, aunque ya se tiene una teora bien
estructurada sobre las pruebas de hiptesis resulta demasiado complicado encontrarla y an despus de
encontrarla puede ocurrir que no se tenga conocimiento sobre su distribucin, necesitando recurrir a la
Simulacin para establecer los valores crticos de la prueba. De hecho, dependiendo del problema que
se tenga la determinacin de la estadstica de prueba y sus valores crticos pueden ser temas de alguna
publicacin estadstica.
El objetivo de la presente seccin consiste en determinar, en casos simples, la estadstica de
prueba y sus valores crticos. Para tal efecto se har uso de las estadsticas suficientes de los
parmetros, mientras que para la prueba se considerar la que sea la ms lgica con respecto a la
hiptesis alterna y la estadstica de prueba.
EJEMPLO 1.6
Supngase que se tiene X 1 , X 2 , , X 10 una muestra aleatoria de variables uniformes en (0, ) y que
el decisor a formulado el contraste de hiptesis
H 0 :  5
H1 : 5

19
Utilice la estadstica suficiente de como la estadstica de prueba y con base en la hiptesis
nula indique un valor crtico y establezca una regin de rechazo que sea lgica al problema. Determine
a) Una estadstica suficiente para .
b) La estadstica suficiente encontrada en (a) utilcela como estadstica de prueba y obtenga la
funcin de potencia de la prueba para el valor crtico a  4.2 y con la ayuda de algn paquete
matemtico trace su grfica.
c) El nivel de significancia.
d) Una expresin para la probabilidad del error tipo II.
e) Con los resultados encontrados y la realizacin 1.91, 0.50, 2.98, 4.50, 4.42, 4.79, 0.07, 2.04,
4.32, 0.69, decida si se tiene que rechazar la hiptesis nula.
f) Considerando el valor de la realizacin para la estadstica de prueba, como el valor del
parmetro, calcule la potencia de la prueba.
Solucin
Recordando que el parmetro est restringido a valores positivos, puesto que la variable aleatoria est
distribuida en (0, ) . Por otro lado, de la hiptesis alterna una regin de rechazo lgica debe ser de la
forma a , y adems a 5 , puesto que la hiptesis nula establece que  5 . Luego, con el valor
crtico, a  4.2 la regin de rechazo es
Rr  x | y n 4.2 .
Es decir, la regla de decisin sera:
Rechazar H 0 :  5 si yn 4.2 en caso contrario no rechazar.
a) Para la estadstica suficiente se obtiene la densidad conjunta
10 10 10 10 10 10
1 1 1
f (x; )  7 f ( xi ; )  7 I (0, ) ( xi )  7 I (0, xi ) 10 7 I ( xi , )  7 I (0, xi ) 7 I (max xi , )
i 1 i 1 i 1 i 1 i 1 10 i 1
i

Del criterio de factorizacin Neyman-Fisher la estadstica suficiente para es T ( X)  Yn  max X i .


i

b) Calculando la funcin de potencia, en donde la regin crtica es Rr  x | x  R y y n 4.2 . Por


otro lado, la estadstica de prueba es T (X)  Yn , resultando
 ( )  P (X)  1 |   P(Rechazar H 0 usando  | )  PYn 4.2 |   FYn (4.2; ) .
Recordando que la funcin de distribucin de la estadstica de orden maximal est dada por
FYn ( y)  FXn ( y) .
n
Para el caso de la uniforme entre (0, ) , resulta FX ( y )  #! y  I (0, ) ( y ) . Luego,
" 

10 *# 4.2 1 0
# 4.2 - ,  4.2
 ( )  FYn (4.2; )  !  I ( 0, ) (4.2)  )!" 
"  - 1,
( 4.2

20
Figura 1.6 Funcin de potencia de la prueba para el valor crtico a  4.2 del ejemplo 1.6
Fuente: Elaboracin propia
c) Nivel de significancia
10 10
# 4.2 # 4.2
  sup  ( )  sup !  I ( 0, ) (4.2)  !   0.1749
 5 "  " 5 
Esto se debe a que 1 es una funcin decreciente en , luego su mximo lo alcanza cuando
es mnimo.
d) La probabilidad del error tipo II
Se sabe que la funcin de potencia,  ( ) 1
para 5 , despejando a
10
# 4.2
 1
 ( )  1
!  I ( 0, ) (4.2) , para 5 .
" 
Es decir,
* # 4.2 1 0
-
 )1
!"  , para 4.2  5
- 4.2
( 0,
e) De la regla de decisin: Rechazar H 0 :  5 si yn 4.2 y la realizacin 1.91, 0.50, 2.98, 4.50,
4.42, 4.79, 0.07, 2.04, 4.32, 0.69, resulta y n  4.79  4.2 . Luego, con los datos obtenidos no
existen evidencias para rechazar H 0 :  5 al 0.1749 de significancia.
f) Calcule la potencia de la prueba para  4.79 .
La potencia de la prueba est dada por 1
  ( ) para 5 , luego si  4.79
10
# 4.2
 (4.79)  !   0.2686 .
" 4.79 
EJEMPLO 1.7
En el ejemplo anterior, suponga que el decisor establece un nivel de significancia del 5% y quiere
determinar el valor crtico correspondiente.
Solucin

21
Sea a el valor crtico, de forma similar al inciso (b) del ejemplo anterior se encuentra la funcin de
potencia de la prueba.
10 *# a 10
#a -
 ( )  FYn (a; )  !  I ( 0, ) (a)  )!"  ,  a

"  - 1,
( a
Luego, utilizando el resultado del inciso (c) del ejemplo anterior se tiene el nivel de significancia
de la prueba
10 10
#a #a
  sup  ( )  sup !  I ( 0, ) (a)  !   0.05 .
 5 "  "5
Despejando el valor crtico de la ltima igualdad
 
a  5 10 0.05  3.706 .
EJEMPLO 1.8
Suponga que el jefe de la delegacin Iztacalco del D.F. afirma que menos del 30% de sus habitantes
estn en contra de su nuevo proyecto para combatir la delincuencia. Considere que se realiza una
entrevista a una muestra de 25 habitantes y las hiptesis
H 0 : p  0.30
H 1 : p 0.30
Calcule:
a) la probabilidad de cometer el error tipo I cuando p  0.32 .
b) la probabilidad de cometer el error tipo II cuando p  0.28 .
Para esto defina las variables aleatorias X i para i  1, 2, ,25 , la persona entrevistada est en
25
contra del nuevo proyecto. Adems utilice la regin de rechazo T  8X i 1
i 7.

Solucin
25
a) Para calcular las probabilidades, se tiene que la regin de rechazo est dada por T  8X
i 1
i 7 y la

distribucin de T es binomial con parmetros n  25 y p, luego


P(Error tipo I usando Rr | H 0 )  P(T 7 | p  0.30)  PT 7 | p  0.32  FT (6)  0.2657 .
Para los clculos se utiliza la distribucin binomial acumulada
PT 7 | p  0.32  C025 (0.32) 0 (0.68) 25  C125 (0.32)1 (0.68) 24    C625 (0.32) 6 (0.68)19 9 0.2657 .
El resultado tambin se puede obtener de tablas con n  25 y una interpolacin para
FT (6 | p  0.30)  0.3407 y FT (6 | p  0.35)  0.1734 , resultando 0.2738 9 FT (6 | p  0.32)  0.2657.
25
b) Similarmente para calcular la probabilidad del error tipo II con Ra dada por T  8X
i 1
i 7.

P( II usando Ra | H1 )  P(T  7 | p 0.30)  1


PT  6 | p  0.28  0.5753.
Similarmente al inciso (a) para los clculos se utiliza la distribucin binomial acumulada
 ,
1
PT 7 | p  0.28  1
C025 (0.28) 0 (0.72) 25    C625 (0.28) 6 (0.72)19 9 1
0.4247  0.5753.

22
El resultado tambin se puede obtener de tablas con n  25 y una interpolacin para
FT (6 | p  0.25)  0.5611 y FT (6 | p  0.30)  0.3407 , resultando 0.4289 9 FT (6 | p  0.28)  0.4247.
Cmo calcular el tamao de la muestra cuando se indican los tamaos de los errores tipo I y II?
Cuando se consideran conocidos los tamaos de las probabilidades de los errores tipo 1 y 2 junto
con la distribucin de la poblacin se puede determinar el tamao de la muestra.
EJEMPLO 1.9
Suponga que se tiene una poblacin con distribucin normal de la que se conoce su varianza igual a 30
u2 y el contraste de hiptesis; H 0 :   54 contra H 1 :  54 . Adems se ha establecido la regin de
rechazo para x a .
a) Cul debe ser el valor crtico de la prueba, a, y de qu tamao se debe seleccionar la muestra
aleatoria si se quiere un nivel de significancia igual a 0.05 y una probabilidad de error tipo II de
0.01 cuando   50 ?
b) Qu papel toma la informacin referente al nivel de significancia.
Solucin
a) Este tipo de problemas tienen un grado de complejidad ligeramente superior a los anteriores, pero se
resuelve planteando las dos probabilidades que se dan como datos y con ellas se obtiene un sistema
de dos ecuaciones con dos incgnitas (valor crtico y tamao de la muestra). Luego, en este caso
resulta
#
 
0.05  sup PRechazar H 0 |   54  P X a |   54  P! Z
!
a
54  # a
54
 $!! n  .
 54
" 30 n  " 30 
Note que el supremo de la probabilidad se alcanza en el extremo (justo por eso algunos autores
piden que los espacios paramtricos en la hiptesis nula sean cerrados), por tal razn se usa   54 .
Similarmente, para la probabilidad del error tipo II.
#
 
0.01  1
PRechazar H 0 |  54  50  1
P X a |   50  1
P! Z
!
a
50 

# a
50
 1
$!! n  .
" 30 n  " 30 
Es decir,
# a
50 # a
50
0.01  1
$!! n  & $!! n   1
0.01  0.99 .
" 30  " 30 
Simplificando, las dos ecuaciones anteriores resulta el siguiente sistema de dos ecuaciones con
dos incgnitas.
* # a
54
-0.05  $!! n 
- " 30 
)
- # a
50
0.99  $ ! n 
- !
( " 30 

En ambas ecuaciones se extrae la inversa de la funcin acumulada y se despeja a n

23
*
1 a
54 * $
1 (0.05) 30
-$ (0.05)  n -  n
- 30 - a
54
) & )
1
-$
1 (0.99)  a
50 n - $ (0.99) 30
-( -(  n
30 a
50
Igualando ambas ecuaciones resulta
$
1 (0.05) 30 $
1 (0.99) 30
 .
a
54 a
50
Despejando a la incgnita a, resulta
$
1 (0.05)(a
50)  $
1 (0.99)(a
54)
$
1 (0.05) a
50$
1 (0.05)  $
1 (0.99)a
54$
1 (0.99)
$
1 (0.05)a
$
1 (0.99)a  50$
1 (0.05)
54$
1 (0.99)
$
1

(0.05)
$
1 (0.99) a  50$
1 (0.05)
54$
1 (0.99)
Finalmente,
50$
1 (0.05)
54$
1 (0.99) 50(
1.6449)
54(2.3263)
a
1
1
  52.34 .
$ (0.05)
$ (0.99)
1.6449
2.3263
Ahora para el tamao de la muestra se utiliza alguna de las dos ecuaciones originales, por
ejemplo
2
$
1 (0.99) 30 # 2.3263: 30
n & n!   29.65 .
a
50 ! 52.34
50 
" 
Concluyendo que la constante crtica debe ser igual a 52.34, mientras que el tamao de la
muestra de 30.
b) La informacin sobre el nivel de significancia da un valor del parmetro para calcular la
probabilidad del error tipo I. Es decir, la informacin sobre el nivel de significancia se puede sustituir
por algn valor del parmetro dentro de  , mientras cumpla con H 0 .
EJEMPLO 1.10
Suponga que X 1 , X 2 ,, X n constituyen una muestra aleatoria de una distribucin uniforme sobre el
intervalo (0, ) y se han de contrastar las siguientes hiptesis.
H 0 :  2
H1 : 2
Sea Yn  max X 1 , , X n  y considere un procedimiento de contraste tal que la regin crtica
contenga todos los resultados para los que Yn  1.5
a) Determine la funcin de potencia del contraste.
b) Determine el tamao del contraste.
Solucin
a) La funcin de potencia estar dada por la funcin de prueba
*1, si n  1.5
 ( x)  )
(0, si n  1.5
que es igual a:
 ( )  P (X)  1    P n  1.5.
24
Se sabe que la funcin de densidad para n est dada por:
n
1
n
1 #1 # y # 1
f n ( y )  nf ( y ) F ( y )  n! !   n! n  y n
1 .
" "  " 
y
1 1 y
Recuerde que F ( y )  ; dx  ( y)  .
0

De tal forma
1.5 n
yn
 ( )  ; n
1
y n
1 n
dy  n % 1.5
0 
1
1.5n  #! 1.5   .
0 n n n
" 

b) Por definicin, una prueba  es de tamao   (0,1) , si sup  ( )   , en donde




H 0 : 
H1 :  

Como H 0 :   si y slo si  2
n
# 1.5
Del inciso a) resulta que  ( )  !  , esta funcin es montona decreciente con respecto a
" 
, por lo tanto, el mximo se alcanza en el valor ms pequeo de , en este caso cuando  2 , luego
n
# 1.5
max     !   0.75 ,
n
 " 2 
es el tamao del contraste.
EJEMPLO 1.11
Supngase que se desconoce la proporcin p de artculos defectuosos en una gran poblacin de
artculos y se desean contrastar las siguientes hiptesis.
H 0 : p  0.2
H 1 : p  0.2
Adems se selecciona una muestra aleatoria de 20 artculos de la poblacin. Sea Y el nmero de
artculos defectuosos en la muestra y considere un procedimiento de contraste tal que la regin crtica
contenga todos los resultados para los que Y  7 Y  1 .
a) Determine el valor de la funcin de potencia  ( p) en los puntos p  0,0.1,,1 , y represente
grficamente la funcin potencia.
b) Determine el tamao del contraste
Solucin
a) Aqu la funcin de potencia es
*1, si y  7 y 1
 ( x)  )
(0, si 2 y6

 ( p)  P ( X)  1 p  P  7 Y  1
 PY  7  PY  1  1
PY  6  PY  1
6
# 20
 1
8 !!  p y 1
p 
20
y

y 2 " y 

Grficamente quedara de la siguiente manera:

25
p Potencia
0 1.000
0.1 0.394
0.2 0.156
0.3 0.400
0.4 0.751
0.5 0.942
0.6 0.994
0.7 1.000
0.8 1.000
0.9 1.000
1 1.000
Tabla 1.1 Valores de la funcin Figura 11.77 G
Fi Grfica
fi dde la
l ffuncin
i dde potencia
t i dde la
l
potencia de la prueba dado p prueba del ejemplo 1.11
Fuente: Elaboracin propia

b) Se desea encontrar el max  ( p) , como H 0 : p   entonces p  0.2;   0.2


p
6
# 20
Como  ( p)  1
8 !!  p y (1
p) 20
y y  consiste de un solo valor, p  0.2 , resulta que el
y 2 " y 

tamao de prueba es:


6
# 20
 (0.2)  1
8 !! 0.2 y 0.820
y  1
0.9133
0.0692,  1
0.8441 0.1559
y 2 " y 

EJEMPLO 1.12
Suponga que X 1 , X 2 , , X n constituyen una muestra aleatoria de una distribucin normal cuya media
 es desconocida y con varianza 1. Adems,  0 un nmero especfico y se han de contrastar las
siguientes hiptesis
H 0 :   0
H1 :   0
Finalmente, supngase que el tamao muestral n es 25 y considere un procedimiento de
contraste, tal que no se rechace H 0 cuando | xn
 0 | c . Determine el valor de c tal que el tamao del
contraste sea 0.05.
Solucin
La funcin de prueba para este caso queda para una realizacin x n de X n es
*1, si | xn
 0 | c
 ( x)  )
(0 si | xn
 0 | c
Para encontrar c, primero se calcula la funcin de potencia
    P X   1    P| X n
 0 | c
 1
P| X n
 0 | c
# 1
Como X i ~ N  ,1 resulta que X n ~ N !  ,  , luego
" n

26
*- X
 c 0-
    1
P ) n 0
/
-( 1 n 1 n -.

 1
P | Z | n c 
 1
  n c 
 
n c ,
 1
  n c 
1
  n c ,
 2
2  n c   2 
n c 

Ahora se calcula el tamao de la prueba. Para esto se desea calcular max  (  ) , como



H 0 :   y    0 , entonces max  (  0 )  2 , ocurre slo si 2
nc   & 
nc 
  0
   
2
, luego

#

1 ! 

1 # 

nc   !  & c 
" 2  


1
0.025  1.96  0.392 .
"2 n 25 5
EJEMPLO 1.13
Sea X una variable aleatoria con distribucin binomial, donde P( X  1)   1
P( X  0) .
Para una muestra aleatoria de tamao n  10 , pruebe:
H 0 :  1 2
H1 :  1 2
*n 0
Use la regin crtica )8 xi  6/
( i 1 .
i).- Encuentre la funcin potencia de la prueba y grafquela, considere   (0, 1) .
ii).- Cul es el tamao de esta prueba?
Solucin
i) La funcin de prueba es:
* n

-- 1 , si 8 xi  6
 ( x)  ) i 1
n
-0, si 8 xi  5
-( i 1

Entonces la funcin de potencia resulta ser


* 10 0 * 10 0
 ( )  P ( X)  1   P )8 X i  6 /  1
P )8 X i  5 / .
( i 1 . ( i 1 .
10
Como X i ~ Bernoulli   , entonces Y  8 X i ~ Bin(10, ) , luego
i 1
5
# 10
    1
8 !!  y 1
10
y
y 0 "y

27
Potencia
0.02 0.0000
0.04 0.0000
0.06 0.0000
0.08 0.0000
0.1 0.0001
0.2 0.0064
0.3 0.0473
0.4 0.1662
0.5 0.3770
0.6 0.6331
0.7 0.8497
0.8 0.9672
0.9 0.9984
1.0 1.0000
Tabla 1.2 Valores de la funcin Figura 1.8 Grfica de la funcin de potencia de la
potencia de la prueba dado prueba del ejemplo1.13
Fuente: Elaboracin propia

ii) Para el tamao de la prueba se tiene que calcular max  ( ) , como H 0 :   y  1 2 , entonces

  0, 0.5, . As, si  (0,0.5] se tiene  ( )   (0.5)  0.377

*
- #
5 10 0
10
y -
max  ( )  max )1
8 !!  y 1
 /  0.377 .
0, 0.5, 0, 0.5,- -
( y 0 " y  .
EJEMPLO 1.14
Sea X una variable aleatoria con funcin de densidad f ( x; )  x
1 I 0,1 ( x) . Considere la prueba
H0 :  1
H1 :  1
Donde fue seleccionada una muestra de tamao 2 y la regin crtica establecida es
C  ( x1 , x2 ) : (3 4) x1  x2  . Encuentre la funcin de potencia de la prueba y el tamao de esta prueba.

Solucin
La funcin de prueba es
*1, si x  C
 x   )
(0, si x < C
El contraste de hiptesis resulta
H 0 :  1
H1 :  1
En donde, la regin crtica est dada por C  x1 , x2  : (3 4) x1  x2  . Luego la funcin de
potencia es
 ( )  P ( X)  1   PX  C .

28
x2
1
x2  34 x1

34

12

14

0
14 12 34 1 x1

Figura 1.9 Regin crtica establecida C  x1 , x2  : (3 4) x1  x2  del ejemplo 1.14


Fuente: Elaboracin propia

Realizando los clculos para la potencia de la prueba


1 1
 ( )  PX  C   ; ;f x1 , x2 ( )dx2 dx1 .
0 3
x1
4

Como se trata de una muestra aleatoria, se tiene que la funcin de densidad conjunta

 ,
f X1 X 2 (x; )  f X1 ( x1 ; ) f X 2 ( x 2 ; )  x1
1 I 0,1 ( x1 ) x 2
1 I 0,1 ( x 2 ) ,
 2 x1
1 x 2
1 I 0,1 ( x1 ) I 0,1 ( x 2 )
Por lo tanto, se tiene que
1 1 1
# x 2
 ( )  ; ; 2 x1
1 x 2
1 dx2 dx1  ; 2 x1
1 !! 1
dx1

"
3 4 x1
0 3
x1
0 
4

   ,
1 1
 ; x1
1 1
 34 x1  dx1  ; x1
1
3 4  x12
1 dx1

0 0
2
6 x 3 1
 4 x1
= 3 4  1 1 10  1
3 4 

5 2 = 2 2
Para el tamao de la prueba se obtiene el mximo de la funcin de la funcin de potencia:
* 1 0
max  ( )  max  ( )  max)1
3 4 / .
 1 1 ( 2 .
Como 3 4 es montona creciente con respecto a , su valor ms pequeo lo alcanza cuando

*
tiene el valor ms grande  1 , por otra parte, el max)1

1
3 4 0/ se alcanza cuando 3 4
( 2 .
alcanza su mnimo,  1 .
* 1 0 1
max     max)1
3 4 /  1
3 4  1
3 8  5 8 .
> 1 ( 2 . 2

29
NOTA
El problema tambin se puede resolver encontrando la densidad del cociente x1 x 2
*w  x1 x2 *x  u
Sea T  ) ; entonces T
1  ) 1
(u  x1 ( x2  u w
As J
1  u w 2 , por lo tanto la funcin de densidad conjunta
u 2
1
f W ,U (w; u)  2 , 0 u w
w 1
Calculando la densidad marginal
*-( 2) w
1 0 w 1
f W ( w; )  )
-( (2w 1 ) w  1
Cuya funcin de distribucin de probabilidades es

*
-w 2 0 w 1
FW (w )  )
-
(1
1 2w w  1
Luego,   P X 1 X 2  4 3 |  1  PW  4 3 |  1  1
1 (2(4 3))  1
3 8  5 8 .

EJEMPLO 1.15
Sea X una sola observacin de la funcin de densidad f ( x; )  x
1 I ( 0,1) ( x) , donde  0 .
En la prueba
H0 :  1
H1 :  1
encuentre la funcin de potencia y el tamao de la prueba dado por la siguiente regin de rechazo:
Rechazar H 0 si y slo si X  1 2 .
Solucin
La funcin de prueba es
*1, si x  1 2
 ( x)  )
(0, si x 1 2
recordando que
H 0 :  1
H1 :  1
La funcin de potencia estar dada por
12

 ( )  P X  1   PX  1 2   1


PX 1 2   1
; x
1 dx  1
x 12
0  1
1 2 .

Luego, para el tamao de la prueba resulta 1 2 es montona creciente con respecto a ,


entonces su valor ms pequeo lo alcanza cuando tiene el valor ms grande  1 , por otra parte, el

max 1
1 2

 se alcanza cuando 1 2
alcanza su mnimo,  1

 1 1


max  ( )  max  ( )  max 1
1 2  1
1 2  1 2 .

30
EJEMPLO 1.16
Sea X una simple observacin de la funcin de densidad f ( x; )  (2 x  1
) I [0,1] ( x) , donde

1   1 . Para la prueba
H 0 :  0
H1 :  0
Se utiliza la siguiente regla de decisin: Rechazar H 0 si X excede 1 2 . Encuentre la funcin de
potencia y el tamao de esta prueba.
Solucin
La funcin de prueba es
*1 si x  1 2
 ( x)  )
(0 si x  1 2
Por otro lado,
H 0 :  0
H1 :  0
Realizando los clculos para la funcin de potencia resulta
12

 ( )  P ( X)  1   PX  1 2   1
PX  1 2   1
; 2 x  1
dx
0


 1
x  1
x
2
, 12
0 1
 1 2

1
4
1
2
,  1

 1 2,
1
4

 1 2  14

Para el tamao de la prueba se tiene


max  ( )  max  ( )  max 1 2  1 4   1 2  1 4 (0)  1 2 .
 0 
1, 0 ,

EJEMPLO 1.17
Sea X 1 , X 2 ,, X n una muestra aleatoria de f ( x; )  1 I 0,  ( x) y Y1 , Y2 ,, Yn sus estadsticas de
orden correspondientes. Para la prueba
H 0 :  0
H1 :  0
Fue establecida la siguiente regla de decisin: no rechazar H 0 si 0 n   Yn  0 , de otra forma 
rechazar.
a) Determine la funcin de potencia de la prueba.
b) Trace la grfica de la funcin de potencia de la prueba, para 0  1 , n  6 y   0.05 .
Solucin
a) La funcin de prueba es
*
-1, si y n < 0  , 0
 ( x)  )
n
 ,
(0, si y n  0  , 0
- n
 ,
donde Yn es la estadstica de orden mxima. Luego, la funcin de potencia es:
0
  n
,  
 ( )  P ( X)  1   P Yn < 0  , 0  1
P Yn  0  , 0  1
n
, ;f Yn ( y )dy .
0 n 

31
n
1
1#y y n
1
Como se sabe f Yn ( y )  nf ( y ) F n
1 ( y )  n !  n , sustituyendo en la expresin
"  n
anterior, se tiene
0 n
ny n
1 n= y n 0 1 0n
#
 ( )  1
; dy  1
n  1
n [
 ]  1
n (1
 )  1
!! 0  (1
 ) .
n n
0 0
0 n 
n n= 0 n 
" 
Note que  0 n 1
 , se obtiene al resolver  ( )  0 .

b) Para trazar la grfica se evala la funcin de potencia sustituyendo los valores dados,
0.95
obteniendo  ( )  1
6 , para  6 0.95 .

Potencia
1.00 0.0500
1.10 0.4637
1.20 0.6818
1.30 0.8032
1.40 0.8738
1.50 0.9166
1.60 0.9434
1.70 0.9606
1.80 0.9721
1.90 0.9798
2.00 0.9852
2.10 0.9889
2.20 0.9916
2.30 0.9936
2.40 0.9950
2.50 0.9961
2.60 0.9969
2.70 0.9975
2.80 0.9980
Tabla 1.3 Valores de la funcin Figura 1.10 Grfica de la funcin de potencia de la
potencia de la prueba dado prueba del ejemplo 1.17
Fuente: Elaboracin propia

32
Captulo 2
Pruebas de hiptesis y lema de Neyman-
Pearson

Introduccin

E
n Inferencia Estadstica se revisa la estimacin de parmetros por medio de estimadores
puntuales e intervalos de confianza pero los investigadores suelen usar otro tipo de teora para
aumentar su conocimiento sobre los parmetros de la distribucin de la poblacin en estudio,
la cual consiste en llevar a cabo suposiciones o conjeturas sobre dichos parmetros.
En el captulo anterior se revis a detalle los conceptos bsicos de una prueba de hiptesis
estadstica paramtrica. Explicando conceptos bsicos como el tamao de la prueba, potencia de la
prueba, cul es la mejor prueba, etctera, quedando por resolver preguntas, por ejemplo: cmo
encontrar la mejor prueba, cmo establecer las hiptesis nula y alterna, entre otras ms.
En este captulo se dar respuesta a algunas de las preguntas planteadas en el prrafo anterior y
que hasta el momento han permanecido sin respuesta. Para determinar la mejor prueba se revisarn las
pruebas de hiptesis con el mtodo de la razn de verosimilitudes que est basado en el Lema de
Neyman-Pearson, para esto previamente se analizarn algunos conceptos de las pruebas de hiptesis;
posteriormente, se dar inicio con la prueba ms sencilla; hiptesis simple contra hiptesis simple,
continuando con la generalizacin del mtodo para otro tipo de pruebas que son: simple contra
compuesta, compuesta contra simple y compuesta contra compuesta, todas ellas basadas en el lema de
Neyman-Pearson.
2.1 PRUEBAS SIMPLE CONTRA SIMPLE
En el captulo previo se mencion que uno de los problemas de las pruebas de hiptesis reside en la
determinacin de una buena prueba y en caso de existir encontrar la mejor prueba, trabajo que puede
resultar complejo e incluso en la mayora de situaciones no tiene solucin analtica, slo se puede dar
respuesta por medio del mtodo de simulacin. Por tal razn, a partir de la presente seccin se
revisarn diferentes mtodos que pueden aplicarse para encontrar la mejor prueba en un problema
particular.
El estudio de los mtodos para determinar la mejor prueba inicia para el caso en que ambas
hiptesis, nula y alterna, son simples.

33
Pruebas de hiptesis y lema de Neyman-Pearson

Definicin 2.1
Una hiptesis se llama simple, si el conjunto de parmetros que le corresponde contiene un slo
elemento. Por ejemplo, H 0 :   se llama hiptesis simple si    0  , similarmente
H1 :  
 es una hiptesis simple si 
   1  21.

As, en el caso de que    0 , 1  y se tenga el contraste de hiptesis


H 0 :  0
H 1 :  1
Se dice que se tiene un juego de hiptesis simple contra simple. Luego, si  es una funcin de
prueba, entonces las probabilidades de los errores estn dadas de la siguiente forma:
P(Error tipo I, usando  )  P( ( X)  1 |  0 )  
P(Error tipo II, usando  )  P( ( X)  0 |  1 ) 
A partir de la presente seccin inicia la formulacin y prueba de hiptesis. Por tal razn, ha
llegado el momento de dar respuesta a la pregunta:
Cmo establecer las hiptesis nula y alterna en un problema particular?
Cuando se habla sobre la mejor prueba se tienen algunos aspectos muy importantes:
1) La prueba se encuentra con base en la filosofa de rechazar la hiptesis nula (ver tamao de la
prueba). Puesto que se busca la probabilidad de cometer el error tipo I, rechazar la hiptesis nula
siendo que es verdadera.
2) Para determinar el nivel de significancia de la prueba, ste se ha definido con base en el supremo
  sup  * ( ) , aunque en algunas literaturas emplean el mximo en lugar del supremo, en cuyos

casos es importante establecer la parte del espacio paramtrico bajo la hiptesis nula,  , puesto que
si el conjunto es abierto y la funcin de potencia  ( ) es montona, entonces no tendr mximo,
puesto que ste se encuentra en la frontera del conjunto, situacin que no ocurre con el supremo. En
el captulo previo se hizo notar que en caso de conjuntos cerrados supremo y mximo coinciden.
3) Posteriormente, de dichas pruebas se elige la que tenga mayor potencia.
As, del aspecto 1 anterior, el investigador est trabajando con la filosofa de rechazar H 0 , por
consiguiente en la hiptesis alterna plantea la conjetura que quiere probar. Por otro lado, del
aspecto 2 hay que tener cuidado de establecer un conjunto cerrado en  , razn que da origen a
proponer la hiptesis nula con la aseveracin del parmetro con el signo de relacin  ,   .
EJEMPLO 2.1
Sea una variable aleatoria con distribucin binomial X ~ Bin(2, ) y el espacio   0.25, 0.60 y se
desea probar que  0.60 .
a) Plantee el juego de hiptesis del problema.
b) Determine cuntas y cules pruebas se pueden construir para el problema, que resulten de la
combinacin de valores de la variable X  0, 1, 2 .
Solucin
a) Se desea probar que  0.60 , luego el contraste de hiptesis ser:

21
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 415
34
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :  0.25
H 1 :  0.60

b) Como la variable aleatoria X tiene una cantidad finita de resultados y el espacio paramtrico tambin
es finito,   0.25, 0.60 , esto quiere decir que la cantidad de particiones que se pueden formar es
finita. Adems, cada particin tiene dos opciones rechazar o no rechazar. Luego, la cantidad de
pruebas que se pueden construir est dada, por 2 #( X ) , en donde # ( X ) representa la cardinalidad de
X. Es decir, si X  0, 1, 2 , entonces se tiene 2 3  8 pruebas, las que es posible listar y calcular
las probabilidades de los errores tipo I y II, tal y como se muestra en la tabla 2.1
.

Prueba P( (X)  1 |  0.25)   P( (X)  0 |  0.60) 

*1, nunca
1 ( x)  ) 0 1
(0, x  0, 1, 2

*1, x  0
 2 ( x)  ) C02 (0.25) 0 (0.75) 2  0.5625 C12 (0.6)1 (0.4)1  C 22 (0.6) 2 (0.4) 0  0.84
(0, x  1, 2

*1, x 1
 3 ( x)  ) C12 (0.25)1 (0.75)1  0.375 C02 (0.6) 0 (0.4) 2  C 22 (0.6) 2 (0.4) 0  0.52
(0, x  0, 2

*1, x  2
 4 ( x)  ) C22 (0.25) 2 (0.75) 0  0.0625 C02 (0.6) 0 (0.4) 2  C12 (0.6)1 (0.4)1  0.64
(0, x  0, 1

*1, x  0, 1
 5 ( x)  ) C02 (0.25)0 (0.75)2  C12 (0.25)1 (0.75)1  0.9375 C 22 (0.60) 2 (0.40) 0  0.36
(0, x  2

*1, x  0, 2
 6 ( x)  ) C02 (0.25) 0 (0.75) 2  C 22 (0.25) 2 (0.75) 0  0.625 C12 (0.60)1 (0.40)1  0.48
(0, x 1

*1, x  1, 2
 7 ( x)  ) C12 (0.25)1 (0.75)1  C 22 (0.25) 2 (0.75) 0  0.4375 C02 (0.60) 0 (0.40) 2  0.16
(0, x  0

*1, x  0, 1,2
8 ( x )  ) 1 0
(0, nunca
Tabla 2.1 Posibles pruebas para cuando X  0, 1, 2 y clculo de los errores tipo I y II del ejemplo 2.1

35
Pruebas de hiptesis y lema de Neyman-Pearson

Grficamente se pueden representar las pruebas anteriores, si en el eje de las abscisas se ponen
las probabilidades del error tipo II y en el eje de las ordenadas las probabilidades del error tipo I. Ver
figura 2.1.

Figura 2.1. Probabilidades de los errores tipo I y II de las 8 pruebas posibles del ejemplo 2.1
Fuente: Elaboracin propia

2.2 PRUEBAS PURAS Y ALEATORIZADAS


A las pruebas que se encontraron en la tabla anterior se les llama pruebas puras, mientras que las
pruebas resultantes de una combinacin convexa de ellas se les da el nombre de pruebas
aleatorizadas. Es decir, si 1 ,  2 , ,  n  es el conjunto de todas las pruebas puras, entonces
n n
?  8 ? i i con 8? i 1 y ? i  0 para toda i, es una prueba aleatorizada.
i 1 i 1

Definicin 2.2
La prueba  se llama pura, si los nicos valores que puede tomar son 0 y 1,
 : R ' 0, 1 , y se llama prueba aleatorizada cuando ? : R ' 0, 1, 22.

Note que el conjunto de todas las pruebas aleatorizadas es un conjunto convexo, en el caso
anterior el conjunto convexo de pruebas aleatorizadas se muestra en la figura 2.2.

22
Op. Cit., p. 404
36
Pruebas de hiptesis y lema de Neyman-Pearson

Figura 2.2. Conjunto convexo de las pruebas aleatorizadas del ejemplo 2.1
Fuente: Elaboracin propia

En general, una funcin de prueba ser tal que  : R ' 0, 1, y el valor de  (X) se puede
interpretar como la probabilidad de rechazar H 0 . Es decir, si en una prueba aleatorizada:

  (x)  0.34 , esto se interpreta como: rechazar H 0 con probabilidad 0.34.


  (x)  0 , esto se interpreta como: nunca se va a rechazar H 0 .
  (x)  1 , esto se interpreta como: rechazar H 0 con probabilidad 1.

Con las pruebas aleatorizadas es posible reconocer a las pruebas admisibles, entendiendo por
stas a todas las pruebas aleatorizadas que se encuentran en la frontera del conjunto convexo que estn
del lado del origen de coordenadas en la grfica de las probabilidades de los errores I y II. Ver figura
2.3 para el ejemplo de la distribucin binomial.

37
Pruebas de hiptesis y lema de Neyman-Pearson

Figura 2.3. Pruebas admisibles para el ejemplo 2.1


Fuente: Elaboracin propia
2.3 EL LEMA DE NEYMAN-PEARSON PARA PRUEBAS SIMPLE CONTRA SIMPLE
En este momento, para la situacin que se est revisando de pruebas simple contra simple, estn dadas
las condiciones de establecer algn mtodo para determinar la estadstica de prueba y calcular su valor
crtico. Aunque, el caso de simple contra simple es uno de los ms sencillos, de cualquier forma
existen ciertas dificultades para llegar a la estadstica de prueba.
Sea el caso en que    0 , 1  y se desea obtener una buena prueba para el contraste de
hiptesis simple contra simple
H 0 :  0
H 1 :  1
Para esto se requiere de un mtodo que sea estadsticamente razonable en la comparacin de las
verosimilitudes de las hiptesis nula y alterna. Luego, recordando los estimadores de mxima
verosimilitud, que involucran a los parmetros y las variables aleatorias, parece lgico proponer una
razn de verosimilitudes entre las funciones de verosimilitud para cada uno de los valores de los
parmetros segn sea la hiptesis nula o alterna. Es decir, se debe estudiar la razn
Lx ( 0 ) f (x; 0 )
 ( x)   .
Lx ( 1 ) f (x; 1 )
En donde, parece razonable tomar la regla de decisin:

Rechazar la hiptesis nula cuando la funcin de verosimilitud, Lx ( 0 ) , sea


ms pequea que Lx ( 1 )

Es decir, la razn  (x) sea pequea, de esta forma se estara considerando la prueba  (x)
*1, si  (x) k
 ( x)  )
(0, si  (x)  k

38
Pruebas de hiptesis y lema de Neyman-Pearson

En donde, k es el valor crtico, note que  (X) es la estadstica de prueba con la que se tomar la
decisin de rechazar o no la hiptesis nula.
Definicin 2.3
Una prueba  basada en una realizacin x de X, con X ~ f (x; ) para probar
H 0 :  0
H 1 :  1
Se llama prueba de razn de verosimilitudes de tamao  23, si existen dos valores k  0 y
c  0, 1, , tales que
*1, si  (x) k
- *1, si  (x) k
 (x)  )c, si  (x)  k para X discreta;  (x)  ) para X continua
-0, si  (x)  k (0, si  (x)  k
(

Note que al tratarse de hiptesis simples,  ( 0 )   y  ( 1 ) 1


, la prueba  ser la
prueba ms poderosa de tamao  , MP().
LEMA de Neyman-Pearson o lema fundamental de prueba de hiptesis
Para probar el contraste de hiptesis
H 0 :  0 H 0 : X ~ f (x; 0 )

H 1 :  1 H 1 : X ~ f (x; 1 )
f (x; 0 )
con la prueba de razn de verosimilitudes  (x)  , existe una prueba MP()24
f (x; 1 )

NOTA
El lema da respuesta a la existencia de la prueba MP(), pero no indica cmo encontrar los
valores c y k, as como la distribucin de la estadstica de prueba  (X) , problema que en la
prctica suele complicarse.

Demostracin
Denotando f (x; 0 )  f 0 (x) y f (x; 1 )  f1 (x) . Luego para  fijada y tomado el valor de k tal que

P X k f 0     P X  k f 0   P X k f 0  P X  k f 0  .


Con el valor k que da solucin a las desigualdades, existe c  0,1, , tal que
  P X k f 0  c % P X  k f 0 .

23
Op. Cit., p. 404
24
Hoel Paul G., Introduction to Mathematical Statistics_3rdEd. pp. 214
39
Pruebas de hiptesis y lema de Neyman-Pearson

NOTA
1. De esta forma sencilla se est introduciendo una tcnica que sirve para calcular las
constantes crticas k y c.
2. Cuando  (x) es continua, la P X  k f 0   0 y   P  X k f 0  .

Observe que   f 0    , puesto que por definicin


  f 0   P X k f 0  c % P X  k f 0 .

Es decir, se tiene una prueba de tamao  para  . Falta demostrar que para cualquier otra
prueba de tamao  su potencia no podr ser mayor a la de  .

Suponga que   es otra prueba de tamao  ; es decir, E f 0 [  (X)]   , y defina los conjuntos
que formen una particin de X .
A  x  X :  (x) k 
B  x  X :  (x)  k 
D  x  X :  (x)  k 
Considere la diferencia de las funciones de potencia
  
  f 1 
   f 1   E f1  ( X) 
E f1   ( X)  E f1  ( X)
  ( X) 

 ;  ( x)
  (x)f (x)dx
1
X

    
 ;  (x)
  (x) f 1 (x)dx  ;  (x)
  (x) f 1 (x)dx  ;  (x)
  (x) f 1 (x)dx 
A B D
Analizando cada una de las tres integrales de la ltima expresin.
Para la integral en A
f 0 ( x) f ( x) f ( x)
Se sabe que A  x  X :  (x) k y  (x)  & 0 k & f 1 ( x)  0 , luego
f 1 ( x) f 1 ( x) k

;  (x)
  
(x) f1 (x)dx  ;  (x)
  (x)  f k(x) dx  1k ;  (x)
 
 0 
(x) f 0 (x)dx .
A A A

Para la integral en B
f 0 ( x) f ( x) f ( x)
Se sabe que B  x  X :  (x)  k y  (x)  & 0  k & f 1 ( x)  0 , luego
f 1 ( x) f 1 ( x) k

;  (x)
   
1
;

(x) f1 (x)dx   (x)
  (x) f 0 (x)dx .
B
kB
Para la integral en D
Primeramente note que en D,  (x)  k , por consiguiente  (x)  0 , luego
f ( x) f ( x) f ( x) f ( x)
 ( x)  0 & 0  k & f 1 ( x) 0 &
f 1 ( x) 
0 , as se tendr
f 1 ( x) f 1 ( x) k k

;  (x)
     
1

(x) f1 (x)dx  ; 0
  (x) f1 (x)dx  ;  (x)
  (x) f 0 (x)dx .
D D
kD
De tal manera que:

40
Pruebas de hiptesis y lema de Neyman-Pearson

  f1 
   f1  
1
kA;  1
  1
 
 (x)
  (x) f 0 (x)dx  ;  (x)
  (x) f 0 (x)dx  ;  (x)
  (x) f 0 (x)dx
kB kD


1
kX;  1
k
 1

 (x)
  (x) f 0 (x)dx  E f 0  ( X)
  ( X)  
   0
k
Por lo tanto,   f1      f1  , en donde   es cualquier prueba de tamao  .

La bsqueda de los valores c y k se mostrar en las siguientes secciones, en donde se aplica el


Lema demostrado y se dan metodologas para las diferentes situaciones de combinaciones de las
pruebas de hiptesis.
2.4 HIPTESIS NULA SIMPLE CONTRA HIPTESIS ALTERNA SIMPLE
Despus de haber revisado el resultado terico que muestra un mtodo para buscar la prueba MP() en
el caso de hiptesis simple contra simple, ahora se pasar a la aplicacin de dicho resultado, utilizando
una metodologa de solucin.
2.4.1 METODOLOGA PARA EL CASO CONTINUO
Con la siguiente metodologa es posible determinar las pruebas MP() para el caso de variables
aleatorias continuas.

Metodologa para determinar la estadstica de prueba y el valor crtico de un contraste


H 0 :  0 contra H 1 :  1 ; simple contra simple para variables aleatorias continuas
Paso1. Determine la funcin de verosimilitud Lx ( )  f (x; ) .
Lx ( 0 ) f (x; 0 )
Paso 2. Encuentre la razn de verosimilitudes,  (x)   .
Lx ( 1 ) f (x; 1 )
Paso 3. A partir de  (x) k y transformaciones elementales determine una estadstica de prueba que
tenga una distribucin conocida. Generalmente al aplicar este mtodo la estadstica de prueba
coincide con la estadstica suficiente para el parmetro.
Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior y el hecho de que
   ( 0 )  P( (X)  1 |  0 )  P( (X) k |  0 ) ,
encuentre el valor de la constante crtica, k.
Finalmente con el lema de Neyman-Pearson concluya la regla de decisin para la prueba MP().

EJEMPLO 2.2
Sea X 1 , X 2 , , X n una muestra aleatoria de @(4, ) y suponga que el espacio paramtrico de inters
est dado por   2, 3 y se desea probar el contraste de hiptesis
H0 :  2
H1 :  3
a) Encuentre la prueba MP().
b) Suponga que se tiene una realizacin de una muestra aleatoria de tamao 10:
2.765, 5.344, 16.451, 5.989, 6.757, 6.397, 7.943, 5.127, 5.808, 9.686
Aplique la regla de decisin del inciso anterior para probar si es valida la conjetura del
investigador,  3 , al 5% de significancia.
Solucin
41
Pruebas de hiptesis y lema de Neyman-Pearson

a) Siguiendo los pasos mencionados arriba para determinar tanto el estadstico de prueba como la
constante crtica.
Paso1. La funcin de verosimilitud
n



1
8 xi
n n
xi4
1e
xi xi3 e i 1 n
L( ; x)  f (x; )  7 f ( xi ; )  7 7 I (0 x i ) 
I (0 x i ) .
i 1 @( 4) 4 n i 1 @(4)
4
i 1

Note que es de inters conocer los factores que contienen al parmetro, puesto que aquellos
factores que no los tengan sern eliminados al tomar la razn de verosimilitud, por tales razones en la
prctica no se ponen en forma explcita, simplemente se representan por medio de una funcin. Por
n
xi3
ejemplo, en este caso se puede denotar por: A (x)  7 I (0 xi ) , luego
i 1 @( 4)
n

1
8 xi
i 1
e
f (x; )  A ( x) .
4n
Paso 2. La razn de verosimilitudes,
n

1
2 8 xi
i 1
e
A ( x)
1
n n
8 xi  13 8 xi
1
n
8 xi
L (2) f (x;2) 4n
2  3 2 e  3 2 e
2 6
 ( x)  X   n
4n i 1 i 1 4n i 1
.
LX (3) f (x;3)
1 8 xi
3
i 1
e
A ( x)
34n
Paso 3. Para la estadstica de prueba.
n n

1 8 xi
1 8 xi
 (x)  3 2 e k , con k   k 2 3
6 6
k & e &
4n i 1 i 1 4n

n n

16 8 xi k , con k   ln(k ) & 8 xi  k , con k  
6k 
i 1 i 1

n
Luego, una posible estadstica de prueba sera 8 X i , para considerarla como estadstica de
i 1
prueba se tiene que conocer su distribucin, o seguirla transformando hasta encontrar una estadstica
con distribucin conocida.
NOTA
En caso de no conocer la distribucin es cuando el problema suele complicarse y aunque se
sabe, por lema de Neyman-Pearson, que la prueba MP() existe es posible que no se pueda
localizar y en estos casos se suele hacer uso de la simulacin.

De las distribuciones muestrales es conocido que si X i ~ @(4, ) , entonces para una muestra
n
aleatoria X 1 , X 2 , , X n , resulta 8 X i ~ @(4n, ) . As, la estadstica tiene una distribucin conocida,
i 1
el nico problema reside que en general no se tienen tablas estadsticas para esta distribucin, pero si es
transformada a una ji-cuadrada de ella si existen tablas estadsticas. Luego,
n 2 n
8 X i ~ @(4n, ) + 8 X i ~ @(8n 2 ,2)  8n Ji cuadrada con 8n grados de libertad.
2

i 1 i 1

42
Pruebas de hiptesis y lema de Neyman-Pearson

Finalmente, asignndole un valor a (esto se debe a que una estadstica no debe depender del
2 n
parmetro), resulta la estadstica de prueba 8 X i y la regin de rechazo para las realizaciones
i 1

* 2 n 0 2
Rr  )x | 8 xi  k * / , bajo H 0 , en donde k *  k  .
( i 1 .
Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior, y el hecho de que

   (2)  P( ( X) k |  2)  P#! 2 8 X i  k * |  2   1


P#! 2 8 X i  k * |  2 
n n

" i 1  " i 1 
 1
F 2 (k )
*
8n

Es decir, F 2 (k * ) 1
 , finalmente k *  F
21 (1
 ) .
8n 8n

As, del lema de Neyman-Pearson se concluye que dada una realizacin x, la prueba MP(), para
el contraste de hiptesis
H0 :  2
H1 :  3
La regla de decisin est dada por:
n
Rechazar H 0 :  2 , si 8 xi  k *  F
21 (1
 ) .
i 1 8n

b). Aplicando el resultado anterior para la realizacin de una muestra de tamao 10


2.765, 5.344, 16.451, 5.989, 6.757, 6.397, 7.943, 5.127, 5.808, 9.686

En este caso n  10 y   0.05 . Luego, el cuantil k *  F


21 (1
 )  F
21 (0.95)  101.88 es el
8n 80
10
valor crtico, mientras que 8 xi  72.267 . Finalmente de la regla de decisin se concluye
i 1
10
8 xi  72.267 k  101.88
*
i 1
Por lo tanto, con los datos de la realizacin no se tienen evidencias para rechazar H 0 :  2 .
EJEMPLO 2.3
Suponga que para el investigador del ejemplo anterior es fundamental trabajar con distribuciones
gamma, por consiguiente l quisiera tener una frmula para decidir de forma metdica su problema.
Es decir, sea X 1 , X 2 , , X n una muestra aleatoria de @( 0 , ) y suponga que el espacio paramtrico
de inters est dado por   a, b y se desea probar el contraste de hiptesis
H0 :  a
H1 :  b
Encuentre una regla de decisin para las pruebas de tamao  , en donde  0 , a, b y n son
valores conocidos de antemano y positivos, adems a  b .
Solucin
Siguiendo los pasos mencionados arriba para el estadstico de prueba y la constante crtica.
Paso1. La funcin de verosimilitud
43
Pruebas de hiptesis y lema de Neyman-Pearson

 0
1
xi

1
8 xi
n n
xi e e i 1 n
xi 0
1
L( 0 , ; x)  7 f ( xi ;  0 , )  7 I (0 x i )  7 I (0 x i )
i 1 i 1 @( 0 )  0  0n i 1 @ ( 0 )
n

1
8 xi
i 1
e
  0n
A ( x,  0 )

n
xi 0
1
Paso 2. La razn de verosimilitudes con A (x,  0 )  7 I (0 x i )
i 1 @( 0 )
1 n

8
a i 1
xi
e
A (x,  0 )  0n 1 n
8
1 n
8  0n b
a n
8
f (x;  0 , a)  0n
#b
xi  xi
#b
xi
 a
a i 1 b i 1 a b i 1
 ( x)  !  e !  e .
f (x;  0 , b)

1 n
8 xi "a "a
b i 1
e
A ( x,  0 )
b  0n
Paso 3. Para la estadstica de prueba.
b
a n b
a n

8 xi
8 xi
 (x)   ba  k , con k   k a b 
 0n a b i 1 a b i 1  0n
e k & e &
b
a n

8 xi k , con k   ln(k )
ab i 1
En donde resultan dos casos.
*n ab
-- 8 xi  k , si b  a con k  
b
a k 
i 1
)n
- 8 x k , si b a con k  
ab k 
-(i 1 i b
a
n
Luego, una posible estadstica de prueba sera 8 X i ~ @(n 0 , ) .
i 1
n
Finalmente, la estadstica de prueba 8 X i y la regin de rechazo para las realizaciones
i 1

Rr  * 0
n
)x | 8 xi  k , si b  a / , bajo H 0 .
*

( i 1 .

Rr  * 0
n
)x | 8 xi k , si b a / , bajo H 0 .
*

( i 1 .

Paso 4. Con base en la estadstica de prueba encontrada en el paso anterior, la regla de decisin:
Caso 1. Si b  a
44
Pruebas de hiptesis y lema de Neyman-Pearson

#n
   ( a )  P ( ( X ) k |  a )  P ! 8 X i  k * |  a , y b  a 
" i 1 
#n
 1
P! 8 X i  k * |  a, y b  a   1
F@ ( n 0 ,a ) (k * )
" i 1 
Es decir, F@( n0 ,a ) (k * )  1
 , donde k *  F@
(1n0 ,a ) (1
 ) . As, del lema de Neyman-
Pearson y dada una realizacin x, la prueba MP(), para el contraste de hiptesis
H0 :  a
H1 :  b
cuando b  a est dada por la regla:
n
Rechazar H 0 :  a , si 8 xi  k *  F@
(1n 0 ,a ) (1
 ) .
i 1

Caso 2. Si b a
   (a)  P( ( X) k |  a)  P#! 8 X i k * |  a, y b a   F@ ( n 0 ,a ) (k * ) ,
n

" i 1 
Es decir, F@( n 0 ,a ) (k )   , donde k 
* *
F@
(1n 0 ,a ) (  ) . As, del lema de Neyman-Pearson
y dada una realizacin x, la prueba MP(), para el contraste de hiptesis
H0 :  a
H1 :  b
cuando b a est dada por la regla:
n
Rechazar H 0 :  a , si 8 xi k *  F@
(1n 0 ,a ) ( ) .
i 1

EJEMPLO 2.4
Sea X 1 , X 2 ,, X n una muestra aleatoria de @(2, ) ,    {1,2} se desea probar la hiptesis
(simple contra simple)
H0 :  1
H1 :  2
Solucin
Utilizando el resultado anterior con  0  2 , a  1 y b  2 , se cumplen las condiciones del caso 1,
luego la regla de decisin
n
Rechazar H 0 :  1 , si 8 xi  k *  F@
(12 n,1) (1
 ) .
i 1
En caso de desear trabajar con la distribucin Ji-cuadrada, note que la prueba  (x)  1 si

 
n n
 (x)  k es equivalente a  (x)  1 si 28 xi  k1 , k1  2k * , donde 28 X i ~ 42n bajo H 0 .
i 1 i 1

Por lo tanto, de las tablas 2


4n se puede obtener el valor k1 tal que
* n
0 * n
0
  P )28 X i  k1  1/  1
P )28 X i  k1  1/ .
( i 1 . ( i 1 .

45
Pruebas de hiptesis y lema de Neyman-Pearson

* n 0
Luego, P )28 X i k1  1/  1
  F 2 k1  & k1  42n (1
 )  FY 42n (1
 ) .  
( i 1 . 4n


Es el percentil 1
 de la distribucin 4n , es decir 1
  P Y  42n (1
 ) , donde Y ~ 42n
2

Por lo tanto, la prueba ms potente de tamao  es equivalente a:
* n

--1, si 28 x i  4 n (1
 )
2

 ( x)  ) i 1
n
-0, si 28 x i 42n (1
 )
-( i 1

RESUMEN
a) El problema consiste en como plantear la prueba, para que en base a una estadstica se encuentre k.
b) Cuando la distribucin es continua, c  0, no as en la discreta.
c) Generalmente, la prueba de la razn de verosimilitud va a estar en funcin de la estadstica
suficiente.
EJEMPLO 2.5
Sea X 1 , X 2 , , X n una muestra aleatoria de tamao n para la funcin de densidad

x
f ( x; )  xe
2
I (0,) ( x) . Encuentre una MP() para el juego de hiptesis
H0 :  1
H1 :  2
Solucin
Paso1. Se determina la funcin de verosimilitud
n
n n
8 xi
L X ( )  7 f ( xi ; )  7 2 xi e
xi I ( 0, ) ( xi )  2 n e i 1
A ( x)
i 1 i 1

Lx ( 0 ) f (x; 0 )
Paso 2. La razn de verosimilitudes,  (x)  
Lx ( 1 ) f (x; 1 )
n

1 8 xi n n

L (  1) 12 n e i 1 A (x) 8 xi 8 xi
 ( x)  X   2
2 n e i 1  4
n e i 1
L X (  2) n

2 8 xi
2 2 n e i 1 A (x)
Paso 3. La estadstica de prueba.

n
8 xi n
4
n e i 1 k & 8 xi k ; k   ln(4 n k )
i 1

n n
Pero X i ~ @(2,1 ) & 8 X i ~ @(2n,1 ) . Luego, la estadstica de prueba es 8 X i ~ @(2n,1 )
i 1 i 1

Paso 4. Con base en la estadstica de prueba encontrada y


   ( 0 )  P( (X)  1 |  0 )  P( (X) k |  0 ) ,
resulta que bajo la hiptesis nula
46
Pruebas de hiptesis y lema de Neyman-Pearson

n n n
 1 & 8 X i ~ @(2n,1) & 28 X i ~ @(4n 2 ,2)  42n &   P{2 8 X i k }  42n (k )
i 1 i 1 i 1

Despejando a la constante crtica, resulta k   4


n1 ( ) . Finalmente la regla funcin de prueba para la
MP() es
*1, si y 4
n1 ( ) n
 ( x)  ) ; Y  28 X i ~ 42n
(0, si y  4
n1 ( ) i 1

EJEMPLO 2.6
Sea X una variable aleatoria que tiene funcin de densidad f ( x; )  x
1 I (0,1) ( x) .
a) Para una muestra aleatoria de tamao 2, encuentre la prueba ms potente de tamao
(  1 2 (1
ln 2)) para el contraste de hiptesis
H0 :  1
H1 :  2
b) Sea el contraste de hiptesis
H0 :  1
H1 :  2
usando un tamao de muestra igual a 2 y sea  el tamao del error tipo I y el tamao del error tipo
II, encuentre el contraste que minimice el mximo de  y (es decir el mnimx).
Solucin
a) Como es una prueba simple contra simple, se emplear el lema de Neyman y Pearson.
Paso1. Se determina la funcin de verosimilitud

n#
n n n
LX ( )  7 f ( xi ; )  7 xi I ( 0,1) ( xi )  !! 7 xi  A (x)

1

i 1 i 1 " i 1 
Lx ( 0 ) f (x; 0 )
Paso 2. La razn de verosimilitudes,  (x)   , con n  2
Lx ( 1 ) f (x; 1 )
1
# 2
12 !! 7 xi  A (x)
Lx (1) " i 1  1
 ( x)    k
L x ( 2) # 2
2
2 % x1 % x 2
2

2 2 !! 7 xi  A (x)
" i 1 
Paso 3. La estadstica de prueba.
1
Utilizando el logaritmo en 4k , resulta
x1 % x 2

ln(x1 % x2 ) ln(4k )  k1 +
ln(x1 )
ln(x2 ) k1
De las relaciones entre las transformaciones de la distribucin beta y gama, se sabe que
X ~ Beta( ,1) +
ln( X ) ~ @(1,1 ) .

47
Pruebas de hiptesis y lema de Neyman-Pearson

La demostracin se hace por cambio de variable Y 


ln( X ) & X  e
Y su Jacobiano es
dx
 e
y . As de esta forma
dy
f Y ( y)  f (e
y )e
y  (e
y )
1 e
y  e
y & Y ~ @(1,1 ) .
Similarmente, si X ~ @(1,1 ) & Y 
ln( X ) ~ Beta( ,1) .

Por otro lado, es conocido que Y1  Y2 ~ @(2(1),1 ) con Yi 


ln( X i ); i  1,2 & Yi ~ @(1,1 )
Como H 0 :  1 & Z  Y1  Y2 ~ @(2,1) , se puede transformar a una ji-cuadrada o trabajar con
la @(2,1) . Se va a resolver de ambas formas.
Paso 4. Con base en la estadstica de prueba encontrada y la constante crtica
i) Si se pasa a una ji-cuadrada resulta que 2Z ~ @(2,2)  @(4 2 ,2)  42 . De tal forma que si
k2  2k1
  E 1{ (X)}  P{2Z k 2 |  1}  12 (1
ln(2)) .
De donde:
0.153426 B{2Z k |  1}  42 (k 2 ) .
Que es la acumulada de la 42 .
Aproximando, se encuentra el valor de k 2  1.386296. As
*1, si
2(ln(x1 )  ln(x 2 )) 1.3863
 ( x)  )
(0, si
2(ln(x1 )  ln(x 2 ))  1.3863
ii) Ahora, sin pasar a la ji-cuadrada resulta que Z  Y1  Y2 ~ @(2,1) , entonces
k1

  E 1{ ( X)}  P{Z k1 |  1}  ; xe


x dx
0

x
x
k1
k1
 [
xe
e ] |  1
k1 e
k1
0
e  12 (1
log(2))

Resolviendo la ecuacin 1
k1e
k1
e
k1  12 (1
ln(2)) resulta k1 9 0.693147. Luego,

*1, si
ln(x1 )
ln(x 2 ) 0.693147
 ( x)  )
(0, si
ln(x1 )
ln(x 2 )  0.693147
Por lo tanto, la prueba ms potente de tamao   12 (1
ln 2) es

*1, si
ln(x1 x 2 ) 0.693147 *1, si x1 x 2  e
0.693147  0.5
 ( x)  ) )
(0, si
ln(x1 x 2 )  0.693147 (0, si x1 x 2 0.5
b) El ejercicio ser resuelto de dos formas.
Forma 1: Del inciso anterior se encontr en forma general que la funcin de prueba es
*1, si
ln(x1 x 2 ) k1 *1, x1 x 2  k 2
 ( x)  ) )
(0, si
ln(x1 x 2 )  k1 (0, x1 x 2 k 2
Con k 2  e
k1
48
Pruebas de hiptesis y lema de Neyman-Pearson

  P{Error tipo . I |  1}  P{ X 1 X 2  k 2 |  1}
 P{Error tipo II |  2}  P{ X 1 X 2 k 2 |  2}
Para calcular las probabilidades se necesita la distribucin de X 1 X 2 . Para esto se realiza la
transformacin
* Y  X1
T:) 1
(Y2  X 1 X 2
Con ayuda de los Jacobianos se obtendr la funcin de densidad conjunta y posteriormente la
marginal para Y2 . Calculando el Jacobiano
X1  X1 1 0
por lo que J T
1   1 y1 .
X 2  Y2 Y1
y2 y 2
1 1 y1
Luego, por Jacobianos resulta
f X1 X 2 ( x1 x 2 )  f X1 ( x1 ) f X 2 ( x 2 )  ( x1
1 )( x 2
1 )  2 ( x1 x 2 )
1 .
Es decir, la funcin de densidad conjunta estar dada por
f Y1Y2 ( y 2 y1 )  2 ( y 2 )
1 % 1 y1 .
Para determinar los lmites se utiliza la grfica de la transformacin, para esto ntese que
x1  [0,1] & y1  [0,1]; x2 [0,1] & 0 y2 y1  1 & 0 y2 y1 .

X2 Y2

Y1  Y2
1 1
T

0 1 X1 0 1 Y1
Figura 2.4. Limites de la transformacin para el ejemplo 2.6
Fuente: Elaboracin propia
Ahora se calcula la densidad marginal de Y2 , luego
1
dy1
f Y2 ( y 2 )  ; 2 ( y 2 )
1 %  2 y 2
1 % ln y1 |1y2 
2 y 2
1 ln y 2 .
y2
y1
De tal forma que:

49
Pruebas de hiptesis y lema de Neyman-Pearson

1
  P{ X 1 X 2  k 2 |  1}  P{Y2  k 2 |  1} 
; ln y 2 dy2 
[ y 2 ln y 2
y 2 ] k
1
2
k2


[0
1]  [k 2 ln k 2
k 2 ]  1
k 2  k 2 ln(k 2 )
k2

 P{ X 1 X 2 k 2 |  2}  P{Y2 k 2 |  2}  ; (
4 y 2 ln y 2 )dy2
0
k2

4[ y ln y 2 2
y
2 2
4]
2 2 y 2 '0 


4[k 22 ln k 2 2
k 22 4]  4[0
0]
 k 22
2k 22 ln(k 2 )
Se quiere maximizar  y .
En general max(a, b)  ((a  b) | a
b |) 2 , en particular como  y son mayores o iguales a
cero, entonces max( , )  ((  ) | 
|) 2 se obtiene cuando 
 0 &   .
De esta forma resulta la ecuacin:
1
k 2  k 2 ln(k 2 )  k 22
2k 22 ln(k 2 )
La ecuacin se resuelve por aproximaciones, tomando en cuenta que k 2 est restringida a
0  k 2  1 , la cual tiene dos races reales k 2 9 0.312118719 k 2 9 1.600452810.
Como x1 x2  k2 , x1 x2 k 2 y x1 x2  (0,1) , entonces k2 9 0.312118719
Luego la prueba mnima del mximo de  y est dada por:
*1, si x1 x 2  0.312118719
 ( x)  )
(0, si x1 x 2 0.312118719
Forma 2: En el inciso anterior se encontr que:
*1, si
ln(x1 )
ln(x 2 )) k1
 ( x)  )
(0, si
ln(x1 )
ln(x 2 ))  k1
Adems que
log( X 1 )
log( X 2 )  Z ~ @(2,1 ) , de tal forma que:
*1, si z k1
 ( x)  )
(0, si z  k1
k1

  P{Z k1 |  1}  ; ze
z dz  1
k1e
k1
e
k1
0

 P{Z  k1 |  2}  ; 4 ze
2 z dz  2k1e
2 k1  e
2 k1
k1

Por la misma razn que en este inciso el mnimo del ms grande de  y , se obtiene cuando
  , es decir
1
k1e
k1
e
k1  2k1e
2 k1  e
2 k1 .
Resolviendo la ecuacin, resulta k1 9
0.4702866 o k1 9 1.164152296

50
Pruebas de hiptesis y lema de Neyman-Pearson

Como
ln(x1 x2 ) k1 y x1 x2  (0,1) , entonces ln(x1 x2 ) 0 , luego
ln(x1 x2 )  0 , y finalmente
k1 9 1.164152296 .
Lo cual coincide con la relacin k 2  e
k1  e
1.164152296 0.31218719 .
EJEMPLO 2.7
Sea X una sola observacin de la funcin de densidad f ( x; )  x
1 I ( 0,1) ( x) , donde  0 .
a) Encuentre la prueba ms potente de tamao  para el juego de hiptesis
H0 :  2
H1 :  1
b) Entre todas las razones de verosimilitud posibles para el juego de hiptesis
H0 :  2
H1 :  1
encuentre la prueba que minimice   , donde  y son los tamaos de los errores tipo I y tipo
II, respectivamente.
Solucin. El desarrollo para esta distribucin ya se hizo, de tal forma se simplifican los clculos.
a) Ntese que se tiene una prueba simple contra simple, as, por el lema de Neyman y Pearson resulta
*1, si  (x) k
 ( x)  )
(0, si  (x)  k
En este caso, c  0 por ser continua la funcin de densidad. En donde

1
Lx ( 0 ) f (x;  2) x  2
 ( x)     2 x k & x k 2  k1
Lx ( 1 ) f (x;  1) x
1
1

Ahora se calcula k, para esto se tiene


k 2
  E  2 { ( X)}  P{ X k 2 |  2}  ; ( x
1 ) dx
0 2
k 2
; (2 x)dx  x 2 | 0k 2  x 2 | 0k 2 k1
0

 k12

De donde k1  C  , pero x  0 & k1   . Por tanto, resulta la prueba


*
-1, si x 
 (x)  )
(0, si x  
-
b) Del inciso anterior se obtuvo
*1, si x k1
 ( x)  )
(0, si x  k1
Por otro lado, por definicin de los errores
  P{Error tipo I |  2};  P{Error tipo II |  1}
  P{ X k1 |  2};  P{ X  k1 |  1}
As

51
Pruebas de hiptesis y lema de Neyman-Pearson

k1 1
   ; 2 xdx  ; dx  k12  1
k1  k12
k1  1
0 k1

Para minimizar este valor se tiene que k12


k1  1  (k1
1 2) 2  3 4 es una parbola que abre
hacia arriba, por lo tanto, en k1  1 2 se tiene un mnimo. As,   tiene un mnimo en k1  1 2 y
vale 3 4 .
NOTA
El problema se puede resolver aplicando la metodologa del Clculo, es decir encontrando
d (  )
por mnimos y mximos relativos. Se tiene que  2k1
1  0 & k1  1 2 . Ahora, si
dk1
se quiere saber si es mximo o mnimo se aplica el criterio de la segunda derivada, a saber,
d 2 (  )
2
 2  0 & k1  1 2 , se trata de un mnimo y vale (1 2) 2
1 2  1  3 4 .
dk1

EJEMPLO 2.8
Sea X una observacin simple de la funcin de densidad f ( x; )  (2 x  1
) I [0,1] ( x) , donde

1 1 .
a) Encuentre la prueba ms potente de tamao  , para
*H 0 :  0
)
(H 1 :  1
b) Entre todas las razones de verosimilitud posibles para el juego de hiptesis
*H 0 :  0
)
(H 1 :  1
encuentre el contraste que minimice   , donde  y son los respectivos tamaos de los errores
tipo I y tipo II.
Solucin. Se trata de una sola observacin y Lx ( )  f ( x; ) , los clculos se simplifican.
a) Se trata de una prueba simple contra simple, as por el lema de Neyman y Pearson resulta
*1, si  (x) k
 ( x)  )
(0, si  (x)  k
En donde
Lx ( 0 ) f (x;  0) (2 x  1
) | 0 1
 ( x)     k & x  1  k1
Lx ( 1 ) f (x;  1) (2 x  1
) | 1 2 x 2k
Luego,
*1, si x  k1
 ( x)  )
(0, si x k1
Para calcular k1 , se tiene
1 1
  E 0 { ( X)}  P{ X  k1 |  0}  ; (2 x  1
) | 0 dx  ; dx  1
k1
k1 k1

52
Pruebas de hiptesis y lema de Neyman-Pearson

de donde k1 1
 . Por lo tanto, la prueba ms potente es
*1, si x  1

 ( x)  )
(0, si x 1

b) De forma similar que en (6b) resulta
*1, si x  k1
 ( x)  )
(0, si x k1
Adems,
1
  P{ ( X)  1 |  0}  P{ X  k1 |  0}  ; dx  1
k1
k1
k1

 P{ ( X)  0 |  1}  P{ X k1 |  1}  ; 2 xdx  k12


0

Luego, para minimizar se tiene que    k


k1  1  (k1
1 2) 2  3 4 es una parbola que
2
1

abre hacia arriba, por lo tanto, en k1  1 2 se tiene un mnimo.


As,   tiene un mnimo en k1  1 2 y vale 3 4 .
Finalmente,
*1, si x  1 2
 ( x)  )
(0, si x 1 2

2.4.2 METODOLOGA PARA EL CASO DISCRETO


En el caso de variables aleatorias discretas la metodologa sufre una pequea modificacin en el clculo
de la probabilidad del error tipo I.

Metodologa para determinar la estadstica de prueba y el valor crtico de


H 0 :  0 contra H1 :  1 simple contra simple para variables aleatorias discretas
Paso 4. Los primeros tres pasos del caso continuo coinciden, pero el cuarto se diferencia del anterior en
la aparicin del valor c
   ( 0 )  E (X)  P( (X) k |  0 )  c % P( (X)  k |  0 ) .
As, para determinar el valor de k hay que acotar el valor de  con el mnimo y mximo de los valores
que puede tomar c. Es decir, cuando c  0 , y c  1 resultando
P( ( X) k |  0 )    P( ( X) k |  0 )  P( ( X)  k |  0 )
P( ( X)  k
1 |  0 )    P( ( X)  k |  0 )
De esta forma se encuentra el valor de k, y posteriormente con el valor encontrado se determina
el valor de c al despejarlo de la expresin
  P( (X) k |  0 )  c % P( (X)  k |  0 ) .
donde resulta

53
Pruebas de hiptesis y lema de Neyman-Pearson


P( ( X) k |  0 )
c .
P( ( X)  k |  0 )

Las expresiones anteriores se pueden sustituir por sus equivalentes al determinar la estadstica de
prueba, T (X) , puede ocurrir que  (X) k sea equivalente alguno de los siguientes casos.

Caso 1. Cuando  (X) k + T (X) k * , entonces los valores de la constante crtica, k * y el de


c, se obtienen de la siguiente forma.

La constante crtica k * es un valor de la variable aleatoria de la estadstica de prueba, tal que


P (  ( X)  k
1 |  0 )    P (  ( X)  k |  0 ) +
P(T ( X)  k *
1 |  0 )    P(T ( X)  k * |  0 )

Con el valor de k * se calcula el valor de c


P( ( X)  k
1 |  0 ) 
P(T ( X)  k *
1 |  0 )
c c .
P( ( X)  k |  0 ) P(T ( X)  k * |  0 )

Caso 2. Cuando  (X) k + T (X)  k * , entonces los valores de la constante crtica, k * y el de


c, se obtienen de la siguiente forma.

La constante crtica k * es un valor de la variable aleatoria de la estadstica de prueba, tal que


P (  ( X )  k
1 |  0 )    P ( ( X )  k |  0 ) +
P(T ( X)  k *  1 |  0 )    P(T ( X)  k * |  0 ) +
P(T ( X)  k *
1 |  0 )  1
  P(T ( X)  k * |  0 )

Con el valor de k * se calcula el valor de c


P( ( X)  k
1 |  0 ) 
P(T ( X)  k *  1 |  0 )
c c
P( ( X)  k |  0 ) P(T ( X)  k * |  0 )
1

P(T ( X)  k *
1 |  0 )
c .
P(T ( X)  k * |  0 )

Finalmente con el lema de Neyman-Pearson se concluye la regla para la prueba MP().

EJEMPLO 2.9
Sea X 1 , X 2 ,, X n una muestra aleatoria de una distribucin Bernoulli, Ber( ) ,  1 3,1 4 . El
decisor supone que la probabilidad de xito es 1 4 .
a).- Plantee un contraste de hiptesis adecuado y determine la prueba MP().
b).- Resolver para k y c, cuando n  10 y   0.05 .
c).- En el inciso anterior y con la realizacin 1, 0, 0 ,1, 0, 0, 1, 0, 1, 0 determine si rechaza la suposicin
del decisor al 5% de significancia.
Solucin
a).- Se plantea el juego de hiptesis

54
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :  1 3
H1 :  1 4
Para determinar la MP() ser utilizado el mtodo de la razn de verosimilitud.
Paso1. Se determina la funcin de verosimilitud
n n

8 xi 8 xi
# i 1
n n n

L X ( )  7 f ( xi ; )  7 xi 1
  i 1 1
 8 1
n
1
xi n
xi
i 1
! 
i 1 i 1 "1

Lx ( 0 ) f (x; 0 )
Paso 2. La razn de verosimilitudes,  (x)  
Lx ( 1 ) f (x; 1 )
n

# 1/ 3 8
i x

! 
i 1
1
1 / 3n n
8 xi n
LX (1 / 3) " 1
1 / 3  # 3 i 1 # 8
 ( x)   n
!  ! 
LX (1 / 4) 8 xi "2 "9
# 1 / 4 i 1
!  1
1 / 4 n

"1
1/ 4 
Paso 3. La estadstica de prueba. Recordando que  (x) k + ln( (x)) ln(k )  k1 , es decir,
n
ln3 28 xi  n ln8 9 k1
i 1

Luego,
n
ln 3 28 xi k 2 (k 2  k1
n ln(8 9)) .
i 1

n
Considerando que ln3 2 0 , resulta 8x i  k3 (k 3  k 2 ln(3 2)) .
i 1

Es decir, resulta una situacin como en el caso 2 de la metodologa expuesta en la seccin 2.4.2.
n n
Luego, T  8 X i es una estadstica suficiente y X i ~ Ber( ) , entonces 8X i ~ Bin(n, ) .
i 1 i 1

n
Paso 4. Note que bajo H 0 , T  8 X i ~ Binn,1 3 , luego para un tamao de prueba  el valor de k *
i 1

se encuentra con la expresin


P(T  k *
1)  1
  P(T  k * ) .
Con ese valor de k * se obtiene el valor de c tal que
1

P(T  k *
1)
c .
P(T  k * )
As, resulta que la prueba ms potente es

55
Pruebas de hiptesis y lema de Neyman-Pearson

* n

-1 si 8 xi k *
- i 1

- n
 (x)  )c si 8 xi  k *
- i 1
- n
-0 si 8 xi  k *
( i 1

b).- Resolver para k * y c, cuando n  10 y   0.05 . Encontrando el valor de k * a partir de tablas


estadsticas para T ~ Bin(10,1 3)
P(T  k *
1)  1
  P(T  k * ) .
Luego, de clculos o tablas de la distribucin T ~ Bin(10,1 3) , resulta que cuando k *  6
P(T  k *
1)  P(T  5)  0.9234
P(T  k * )  P(T  6)  0.9803
De tal forma que 0.9234  P(T  5)  0.95  P(T  6)  0.9803, luego k *  6 . Ahora con este valor se
determina el valor de c:
1

P(T  k *
1) 0.95
P(T  5) 0.95
0.9234
c    0.1947 .
P(T  k * ) P(T  5) 0.1366
Luego, la regla de decisin queda
* n

-1 si 8 xi 6
- i 1

- n
 (x)  )0.1947 si 8 xi  6
- i 1
- n
-0 si 8 xi  6
( i 1
n
b).- De la realizacin dada (1, 0, 0 ,1, 0, 0, 1, 0, 1, 0) se tiene que 8 xi  4 . As, al 5% de significancia
i 1

se rechaza H 0 :  1 3 y concluye que con la realizacin obtenida no hay evidencias para rechazar la
suposicin del decisor.
EJEMPLO 2.10
Sea X una variable aleatoria con distribucin Bernoulli, donde P( X  1)   1
P( X  0) . Para una
muestra aleatoria de tamao n  10 .
i) Encuentre la prueba ms potente de tamao  , donde   0.0547, para el juego de hiptesis
H0 :  1 2
H1 :  1 4
ii) Encuentre la prueba ms potente cuando  1 4 .

Solucin
i) Similarmente al ejemplo anterior se puede utilizar el lema de Neyman y Pearson, para la funcin de
prueba dada por:

56
Pruebas de hiptesis y lema de Neyman-Pearson

*1, si  (x) k
-
 (x)  )c, si  (x)  k
-0, si  (x)  k
(
n
8 xi
#
Donde la funcin de verosimilitud result f X (x; )  ! 
i 1
1
n
"1

n
8 xi
# 1 2 i 1
!  1
1 2n 8n xi n 10

Lx ( 0 ) f (x;  1 2) !" 1
1 2  8
10
#2 #2
xi
 ( x)     3 i 1
!   !  3 i 1

Lx ( 1 ) f (x;  1 4) n
8 xi "3 "3
# 1 4 i 1
!!  1
1 4 n

"1
1 4 

10 10
8 xk 8 xk
Si  (x) k , resulta 2 3 3 k 1 3 2 k  k1 + 8 x k
10
k + 3 k 1  k 2 . Luego,
10 10 ln(k1 )
ln(3)
k 1
10
T  8 x k k * result una situacin como la del caso 1 y la constante crtica k * se obtiene de
k 1

P(T ( X)  k *
1 |  0 )    P(T ( X)  k * |  0 )
P(T  k *
1 |  0.5, n  10)  0.0547  P(T  k * |  0.5, n  10)
10
Como T  8 X k ~ Bin(10,  1 2) , resulta k *  2 .
k 1

Para el valor de la constante c, con k *  2 en



P(T ( X)  k *
1 |  0 ) 0.0547
P(T  1 |  0.5) 0.0547
0.0107
c   1.
P(T ( X)  k |  0 )
*
P(T  2 |  0.5) 0.0440

Es decir, la prueba ms potente de tamao  est dada por la siguiente funcin de prueba

* 10

-1, si 8x k 2
* 10
-
-
k 1
10 --1, si 8x k 2
 (x)  )1, si 8x k 2 ) k 1
10
-
-
k 1
10
-0, si
-( 8x k 2
-0, si 8x k 2 k 1

( k 1

ii) Como se trata de un solo valor  1 4 , la prueba ms potente estar dada por
mx  ( )  P ( X)  1  1 4  P T  k * |  0.25
 {1 4}
 

De las tablas de la binomial para n  10 y p  0.25 y k *  2 , resulta la potencia


mx  ( )  0.5256 .
 1 4

57
Pruebas de hiptesis y lema de Neyman-Pearson

Los ejemplos anteriores se pueden generalizar por medio del siguiente resultado.

TEOREMA 2.1
Sea X 1 , X 2 ,, X n una muestra aleatoria de Ber( p) , entonces se pueden tener alguno de los
siguientes contraste de hiptesis
a) H 0 : p  p0 contra H1 : p  p1 , con p0  p1 entonces la prueba de tamao MP ( ) , para
  (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 : p  p0 , con probabilidad 1, si t k en donde k se encuentra de
P(T  k
1 | p  p0 )    P(T  k | p  p0 ) .

P(T  k
1 | p  p 0 )
Rechazar H 0 : p  p0 , con probabilidad c, si t  k , en donde c  .
P(T  k | p  p 0 )
Estadstica de prueba T ~ Binn, p  y Constante crtica: k
b) H 0 : p  p0 contra H1 : p  p1 , con p0 p1 entonces la prueba MP ( ) , para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 : p  p0 , con probabilidad 1, si t  k en donde k se encuentra de
P(T  k
1 | p  p0 )  1
  P(T  k | p  p0 ) .
1

P(T  k
1 | p  p 0 )
Rechazar H 0 : p  p0 , con probabilidad c, si t  k , en donde c  .
P(T  k | p  p 0 )
Estadstica de prueba T ~ Binn, p  y Constante crtica: k

Despus de revisar la distribucin discreta tipo Bernoulli se puede ampliar la metodologa propuesta en
el Teorema 2.1 a cualquier distribucin discreta que se conozca la distribucin para la suma de
variables. Por otro lado, en Inferencia Estadstica antes del tema de prueba de hiptesis se ven las
distribuciones discretas y continuas junto con las distribuciones de sus sumas.
n
Sea X 1 , X 2 , , X n una muestra aleatoria y T  8X
i 1
i , entonces se sabe que:

1) Si X i tiene distribucin Bin(m, ) , entonces T tiene distribucin Bin(mn, ) .


2) Si X i tiene distribucin Poi( ) , entonces T tiene distribucin Poi(n ) .
3) Si X i tiene distribucin Geo( ) , entonces T tiene distribucin Binneg(n, ) .
4) Si X i tiene distribucin Binneg(m, ) , entonces T tiene distribucin Binneg(nm, ) .
EJEMPLO 2.11
El dueo de un comercio estableci que la llegada de clientes a su negocio tiene una distribucin de
Poisson con una razn   2, 3 clientes cada 15 minutos, para esto propone el contraste de hiptesis

58
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :   2 y su opuesta H 1 :   3 . Para probar este juego de hiptesis el negociante realiza un


muestreo de 10 intervalos independientes de 15 minutos y anota la cantidad de clientes que llegan a su
negocio, obteniendo: 3, 6, 1, 3, 7, 6, 3, 1, 4 y 3. Encuentre la MP ( ) al 5% de significancia.
Solucin
Se est ante una situacin similar a la del inciso b del Teorema 2.1. Luego, se requiere calcular la
constante crtica, k que se encuentra de P(T  k
1 |   0 )  1
  P(T  k |   0 ) .
Por otro lado, se tiene que T ~ Poisson(n0 )  Poisson(100 ) . De esta forma se tiene que
encontrar un valor entero no negativo de k que cumpla:
P(T  k
1 |   2)  1
  P(T  k |   2)
En este caso la razn de la distribucin de T es 20 y se puede recurrir a las tablas de la
distribucin Poisson. As,
27
e
20 20i 28
e
20 20i
8
i 0 i!
 0.9475 0.95  0.9657 8
i 0 i!
.

Es decir, k  28 , para el valor de c,


1

P(T  k
1 |   0 ) 1
0.05
P(T  28
1 |   2) 0.95
0.9475
c    0.1367 .
P(T  k |   0 ) P(T  28 |   2) 0.9657
0.9475
Finalmente, la regla de decisin.
Rechazar: H 0 :   2 , con probabilidad 1, si t  k  28 y con probabilidad 0.1367 si t  28 .
Grficamente se tiene:

regin de no rechazo R a

28 regin de rechazo R r
Figura 2.5. Regin de rechazo para el ejemplo 2.11
Fuente: Elaboracin propia
Por ltimo se aplica la regla de decisin, para esto se recuerda que t  37  28 y, con lo cual se
concluye que con la realizacin tomada se rechaza H 0 :   2 al 5% de significancia.
2.5 PRUEBAS SIMPLE CONTRA COMPUESTA
Se revis un resultado poderoso, pero sencillo, sobre las pruebas de hiptesis simple contra simple, el
Lema de Neyman-Pearson. Este resultado garantiza la existencia de la prueba MP() cuando se utiliza
la razn de verosimilitudes para el caso simple contra simple.
Qu pasa cuando alguna de las hiptesis no es simple?
Definicin 2.4
Una hiptesis se llama compuesta, si el conjunto de parmetros que le corresponde contiene
ms de un elemento. Por ejemplo, H 0 :   se llama hiptesis compuesta si  contiene ms
de un elemento, similarmente H1 :  
 es una hiptesis compuesta si 
 contiene
ms de un elemento25.
Luego, el contraste de hiptesis

25
Alexander M. Mood, Franklin A. Graybill y Duane C. Boes. Introduction to the Theory of Statistics. pp. 402
59
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :  0 , para    0 
H1 :  

En donde 
 contiene ms de un elemento se le da el nombre de hiptesis simple contra
compuesta. En esta situacin la prueba deseable de encontrar debe ser de tamao  y que tenga la
mayor potencia con respecto a todas las otras pruebas del mismo tamao, si la funcin de prueba 
con tales caractersticas existe se le llama la prueba uniformemente ms potente de tamao  , y se
denota por UMP().
Cmo obtener la prueba UMP() para el caso simple contra compuesta?
En general, no existe algn resultado, como el lema de Neyman-Pearson en el caso simple contra
simple para determinar la prueba UMP() para el caso simple contra compuesta, ya que de hecho
puede ser que sta no exista. Sin embargo, para tratar de encontrar la prueba UMP() en el caso
simple contra compuesta se puede seguir la siguiente metodologa.

Paso 1. Se elige un valor del parmetro 1  


 y se establece el contraste de hiptesis reducido,
simple contra simple.
H 0 :  0
H 1* :  1

Paso 2. Al contraste de hiptesis reducido se le aplica el lema de Neyman-Pearson, obteniendo la


prueba MP(), sea sta  . Si la prueba  no depende de 1 , entonces  es la prueba
UMP(), para el problema original.

EJEMPLO 2.12
Sea X 1 , X 2 , , X n una muestra aleatoria de una N ( , 4) y se desea probar el contraste de hiptesis
H 0 :   10
H 1 :   10
a) Emplee el mtodo anterior para ver si existe la prueba UMP().
b) Suponga que se tiene una realizacin de una muestra aleatoria de tamao 10,
10.45, 13.40, 9.45, 12.23, 8.50, 8.10, 14.20, 12.85, 10.90, 9.15
Aplique la regla de decisin del inciso anterior al 5% de significancia e indique si existe
evidencia para rechazar H 0 .
c) Cmo quedara el problema formulado en una situacin general?
Solucin
a) Siguiendo los pasos anteriores.
Paso 1. Se elige 1  10 y se estable el contraste de hiptesis reducido
H 0 :   10
H 1* :   1
Paso 2. Aplicando el lema de Neyman-Pearson al contraste de hiptesis reducido
1. La funcin de verosimilitud

60
Pruebas de hiptesis y lema de Neyman-Pearson

n # n
( xi
 ) 2
n n
1

1 8 (
2 xi   2 ) n
e

1 xi2
8
1 8!
2 
! 8 xi  n 2 

f (x;  , 4)  7 f ( xi ;  , 4)  7 72
8
e 2( 4)
e i 1
e " i 1 
A ( x) .
i 1 i 1 2 2? i 1 2?
n
1 xi2
e 8
2. La razn de verosimilitudes, con A (x)  7
i 1 2 2?
# n

! 8

1 8!
2:1 0 xi  n1 0 0

# n

f (x; 10, 4) e "


A ( x)
i 1  ! 8

1 8! 2 ( 1
1 0) xi  (1 0 0
12 ) n 

 ( x)   e " i 1 
.
f (x; 1 , 4) # n

1 8!
2 1 8 xi  n1 
2
! 
e " i 1 
A ( x)
3. Para la estadstica de prueba.
# n
( 1
10) n

1 8! 2 ( 1
10) 8 xi  (100
12 ) n  (100
12 ) n
! 
8 xi
 (x)  e k , con k  
"  4
i 1
k & e i 1
ke 8 &
( 1
10) n n 4

8 x i k , con k   ln(k ), pero 1  10 & 8 xi  k , con k  
k 
4 i 1 i 1 1
10
n
Luego, la estadstica de prueba sera 8 X i X , ahora se requiere conocer su distribucin. Pero
i 1
de las distribuciones muestrales se sabe que en el caso de variables aleatorias con distribucin normal,
el promedio X ~ N  , 4 n . Es decir, se obtuvo una estadstica con distribucin conocida. Finalmente,
de la estadstica de prueba X y la regin de rechazo para las realizaciones
 
Rr  x | x  k * , bajo H 0 , en donde k *  1 n k  .
4. Con base en la estadstica de prueba encontrada en el paso anterior y el hecho de que

   (10)  P( ( X) k |   10)  P X  k * |   10  1
P X  k * |   10   
# k *
10  6# k *
10 3
 1
P! Z   1
$ 4!!  n1

! 
" 2 n  54" 2  12
6# k *
10 3
Es decir, $ 4!!  n 1  1
 , finalmente despejando la constante crtica de esta expresin

45" 2  12
2 2
k *  10  $
1 (1
 )  10  Z 1
 .
n n
En donde, Z 1
 representa el cuantil 1
 de la distribucin normal estndar, dado por

1
$ (1
 ) . As, del lema de Neyman-Pearson y una realizacin x se concluye que la prueba  ,
MP(), para el contraste de hiptesis
H 0 :   10
H 1* :   1

est dada por la regla de decisin: Rechazar H 0 :   10 , si x  k *  10  2  


n Z1
 .
Pero la prueba  no depende del valor de 1 , luego la prueba es UMP() para

61
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :   10
H 1 :   10

Dada por la regla de decisin: Rechazar H 0 :   10 , si x  10  2  


n Z1
 .
b). Aplicar el resultado anterior para la realizacin de una muestra de tamao 10
10.45, 13.40, 9.45, 12.23, 8.50, 8.10, 14.20, 12.85, 10.90, 9.15
A un nivel del 5% de significancia.
Buscando en las tablas de la distribucin normal estndar el valor crtico se tiene
2 2
10  Z 1
  10  Z 0.95  11.04 .
n 10

Calculando x  10.923 y comparando con el valor crtico, x 10  2 n Z1
 . Luego de la 
regla de decisin se concluye que con los datos de la realizacin no existe evidencia para rechazar
H 0 :   10 .
c). La prueba encontrada se puede formular de la siguiente manera:

Sea X 1 , X 2 , , X n una muestra aleatoria de N (  ,  02 ) entonces el contraste de hiptesis

H 0 :   0
H 1 :   1

Con  0 , 1  R , 1   0 y  02  0 valores conocidos de antemano, tiene una prueba


UMP(), para   0, 1, dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn :
0 0
Rechazar H 0 :    0 , si x   0  Z 1
   0  $
1(1
 ) .
n n
En donde, Z1
 representa el cuantil (1
 ) de la distribucin normal estndar donde
  0, 1, .

EJEMPLO 2.13
Sea X ~ N ( ,1) , se desea probar
H0 :  0
H1 :  0
(simple contra compuesta) existe la prueba UMP()?
Solucin
Es posible seguir la metodologa expuesta, pero el problema est en la forma del inciso c del ejemplo
2.12. Luego, utilizando el resultado para 0  0 , n  1 y  02  1 , resulta que existe la prueba UMP()
y est dada por
* 1
--1, si x  0  Z1

 ( x)  ) 1
1
-0, si x 0  Z1

(- 1
62
Pruebas de hiptesis y lema de Neyman-Pearson

Por lo tanto, si   0.05 & $


1(1
 )  $
1 (0.95)  1.65 . De tal forma que la prueba UMP()
*1, si x  1.65
 ( x)  )
(0, si x 1.65
2.6 PRUEBAS COMPUESTA CONTRA SIMPLE
En la seccin anterior se revis el caso simple contra compuesto, la pregunta lgica se referir a la
situacin cuando la hiptesis nula es compuesta y la alterna simple. En esta situacin no se puede
hablar de las pruebas UMP(), sino de las pruebas MP() porque slo existe un elemento en la
hiptesis alterna.
As, el problema consiste en encontrar una prueba MP() para el contraste de hiptesis
H 0 : 
(1)
H 1 :  1 , para 
   1 

En donde,  contiene ms de un elemento y 1 <  al problema se le da el nombre de hiptesis


compuesta contra simple.
Cmo obtener la prueba MP() para el caso compuesta contra simple?
Usando las ideas del mtodo anterior para el caso simple contra compuesta, es posible obtener la
prueba MP(), para el juego de hiptesis expuesto en (1).

Paso 1. Se elige un valor del parmetro 0   y se estable el contraste de hiptesis reducido,


simple contra simple.
H 0* :  0
(2)
H 1 :  1

Paso 2. Al contraste de hiptesis reducido se le aplica el lema de Neyman-Pearson, obteniendo la


prueba MP(), entonces  es la prueba MP(), para el problema original.

Comprobacin
La justificacin del mtodo es la siguiente. Del lema de Neyman-Pearson existe la prueba MP() para
el contraste de hiptesis reducido, sea sta  * . Denotando al conjunto de todas las pruebas  de
tamao  para el contraste de hiptesis (1) por
$   |  ( )   , .

Similarmente, denotando al conjunto de todas las pruebas  de tamao  para el contraste de


hiptesis (2) por
$*   |  ( 0 )   , 0  .

Ntese que $  D $ * , puesto que si   $  &  ( )   para toda   , en particular para


 0 ,  ( 0 )   &   $ * .

63
Pruebas de hiptesis y lema de Neyman-Pearson

Por otro lado, si  *  $  , entonces  * es la prueba MP() para el contraste de hiptesis (1), de
~
lo contrario, entonces existe otra prueba   $  ms potente que  * . Pero del hecho de que
~
$  D $ * , resulta  *  $ * y   $ * , pero  * es la prueba MP() para (2), esto contradice que
~
  $  es ms potente que  * .
Es decir, se demostr que la prueba MP(), $ 
  $  para (2), y si adems   $  , entonces
* * *

tambin es la prueba MP() para el contraste de hiptesis $


(1).

En este tipo de pruebas a diferencia de la anterior,


 si puede depender del valor elegido en 0   para
*

pasar al problema reducido. Generalmente, el elemento


elegido de  es el valor de menos favorable para la Figura 2.6. Conjunto de todas las
hiptesis nula, el cual coincide con el valor de  ms pruebas  de tamao 
prximo a 1 .
EJEMPLO 2.14
Sea X 1 , X 2 , , X n una muestra aleatoria de una N (  ,  2 ) y se desea probar el contraste de hiptesis
H 0 :   12
H 1 :   10
a) Emplee el mtodo anterior para ver si existe la prueba MP().
b) Suponga que se tiene una realizacin de una muestra aleatoria de tamao 10,
16.45, 13.40, 9.45, 12.23, 8.50, 15.10, 14.20, 12.85, 10.90, 14.15
Aplique la regla de decisin del inciso anterior al 5% de significancia e indique si existe
evidencia para rechazar H 0 .
c) Cmo quedara el problema formulado en una situacin general?
Solucin
a) Siguiendo los pasos anteriores.
Paso 1. Eligiendo  0  12 el contraste de hiptesis reducido queda
H 0* :    0
H 1 :   10
Paso 2. Aplicando el lema de Neyman-Pearson al contraste de hiptesis encontrado
1. La funcin de verosimilitud
( xi
 ) 2 1 #! n n
8 xi  n 2 
1
n n
1

2!

2 


8 ( xi ) 2 n
1
f (x;  ,  2 )  7 f ( xi ;  ,  2 )  7 7
2 " 2
2 i 1
e
2 
2 i 1
e e .
i 1 i 1  2? i 1 2?
n
1

8 ( xi ) 2 n
1
2. Para la razn de verosimilitudes se denota A (x,  )  e 2 2 i 1
7
i 1 2?
.

64
Pruebas de hiptesis y lema de Neyman-Pearson

1 #! n

2!

2 0 8 xi  n 02 
 1 #! n

f (x;  0 ,  2 ) e
2 " i 1 
A ( x,  )

2!
2 "
8
2 (1 0
 0 ) xi  (  02
1 0 0) n 

 ( x)   e i 1 
.
f (x;10,  2 )

1 #! n
8

2:1 0 xi  n1 0 0
2! 
2 "
e i 1 
A ( x,  )
3. Para la estadstica de prueba.
1 #! n
(10
 0 ) n
(  02
100) n

2 (10
 0 ) 8 xi  (  02
100) n 
8 xi
2! 
2 "  2
 (x)  e i 1 
k & e i 1
k , con k   ke 2 2 &
(10
 0 ) n n  2

8 x i k , con k   ln(k ), pero  0  12 & 8 x i k , con k   k 
 2
i 1 i 1  0
10

 
n
Luego, una estadstica de prueba es 8 X i X , cuya distribucin X ~ N  , 2 n . As, la
i 1
regin de rechazo quedar establecida como:
 
Rr  x | x k * , bajo H 0 , en donde k *  (1 n)k  .
4. Con base en la estadstica de prueba encontrada en el paso anterior, y el hecho de que
# X
0
! 
!  n k *
0 
   (  0 )  P ( ( X) k |    0 )  P X k * |    0   P! 
! (n
1) S n
1
2
S n
1 n 
! (n
1) 
" 2 
# k *
0  # k *
0 
 P!
Z
  P! T 
! S n
1 n  ! S n
1 n 
" n
1 (n
1)
2
 "

# k *
0 
Es decir,   P! T  , finalmente despejando la constante crtica de esta expresin
! S n
1 n 
"
s n
1 s n
1
k *  0  t (n
1) . Ftn

11 ( )   0 
n n
En donde, t (n
1) representa el cuantil  de la distribucin t-student. Luego, del lema de
Neyman-Pearson, y una realizacin x la prueba  , MP(), para el contraste de hiptesis

H 0* :    0
H 1 :   10
s n
1
estar dada por la regla de decisin: Rechazar H 0* :    0 , si x  k *   0  t (n
1) .
n
Eligiendo el valor  0   menos favorable cuando el error
# k *
0 
  P! T  ,
! S n
1 n 
"
es mximo, esto ocurre cuando  0 es mnimo (da una mayor probabilidad porque est restando),
luego  0  12 y la prueba MP() para
65
Pruebas de hiptesis y lema de Neyman-Pearson

H 0 :   12
H 1 :   10
s n
1
estar dada por la regla de decisin: Rechazar H 0 :   12 , si x 12  t (n
1) .
n
b). Aplicando el resultado anterior para la realizacin de una muestra de tamao 10
16.45, 13.40, 9.45, 12.23, 8.50, 15.10, 14.20, 12.85, 10.90, 14.15
Con un nivel del 5% de significancia.
Calculando x  12.723 y por valores de tablas el valor crtico est dado por
s n
1 2.502
12  t (n
1)  12  t 0.05 (9)  10.55 12.733 .
n 10
s n
1
Finalmente, resulta x  12  t (n
1) de donde se concluye que con los datos de la
n
realizacin no hay evidencias para rechazar H 0 :   12 .
c). La prueba encontrada se puede formular de la siguiente manera:

Sea X 1 , X 2 , , X n una muestra aleatoria de una N (  ,  2 ) entonces el contraste de


hiptesis
H 0 :   0
H 1 :   1

Con  0 , 1  R y  0  1 valores conocidos de antemano y  2  0 desconocida, tiene


una prueba MP(), para   0, 1, dada por la siguiente regla de decisin, para una
realizacin x1 , x2 , , xn :

s n
1
Rechazar H 0 :    0 , si x  0  t (n
1) .
n
En donde, s n
1 es la desviacin estndar de la varianza muestral correspondiente a la
realizacin de la muestra aleatoria y t (n
1) representa el cuantil  de la distribucin t-
student con n
1 grados de libertad, para   0, 1, .

2.7 PRUEBAS COMPUESTA CONTRA COMPUESTA


Siguiendo la lgica de trabajo le toca el turno al caso en que ambas hiptesis son compuestas. El
objetivo principal en estas pruebas reside en encontrar la prueba UMP(), la cual si tiene sentido
buscarla porque el conjunto 
 tiene ms de un punto.
As, el problema consiste en encontrar una prueba UMP() para el contraste de hiptesis
H 0 : 
(1)
H1 :  

En donde, tanto  como 
 contienen ms de un elemento, al problema se le da el nombre
de hiptesis compuesta contra compuesta.
66
Pruebas de hiptesis y lema de Neyman-Pearson

Cmo obtener la prueba UMP() para el caso compuesta contra compuesta?


Usando las ideas de los mtodos anterior es posible obtener la prueba UMP(). Es decir, a partir
del problema original expuesto en (1) resultan dos opciones.
a) Resolverlo como un problema de hiptesis compuesta contra simple eligiendo un valor
1  

H 0 : 
(2)
H 1* :  1  


Posteriormente, determinar  la prueba MP() del problema reducido (2) y si est no depende
del valor elegido 1 , entonces necesariamente  es la prueba UMP() para el problema original (1).
b) Resolverlo como un problema de hiptesis simple contra compuesto, eligiendo un valor
0 

H 0* :  0  
(3)
H1 :  


Posteriormente, determinar  la prueba UMP() del problema reducido (3) y si est no depende
del valor elegido 0 , entonces necesariamente  es la prueba UMP() para el problema original (1).
EJEMPLO 2.15
Sea X ~ N ( ,1) y se desea probar
H0 :  0
H1 :  0
Solucin
Sea 0  0 y el problema simple contra compuesta
H 0* :  0
H1 :  0
Del ejemplo 2.13 se obtuvo que la funcin de prueba es
*1, si x  1.65
 ( x)  )
(0, si x 1.65
esto es para un   0.05 ya que la prueba ms potente de tamao  del problema reducido
H 0 :  0 vs H 1 :  1 (o cualquier valor mayor a 0) y adems   no depende de 1  1 . Por lo tanto,
  es UMP().
EJEMPLO 2.16
Sea X 1 , X 2 , , X n una muestra aleatoria de una distribucin N (  ,  2 ) y se desea probar el contraste
de hiptesis
H 0 :   12
H 1 :  12
a) Compruebe si existe la prueba UMP().
b) Cmo quedara el problema formulado en una situacin general?
Solucin
67
Pruebas de hiptesis y lema de Neyman-Pearson

a) Ntese que el problema es similar al de la seccin anterior, para el caso compuesta contra simple.
Luego, se utilizar el resultado encontrado, para esto se reduce a una prueba compuesta contra
simple.
Se elige 1 12 y se prueba el contraste de hiptesis
H 0 :   12
H 1* :   1

Siguiendo exactamente el mismo desarrollo que en el ejemplo 2.14, se obtiene

# k *
0 
  P! T  .
! S n
1 n 
"
# k *
0 
Es decir,   P! T  , y finalmente despejando la constante crtica de esta expresin
! S n
1 n 
"
s s
k *   0  n
1 Ftn

11 ( )   0  n
1 t (n
1) .
n n
En donde, t (n
1) representa el cuantil  de la distribucin t-student. As, se concluye del
lema de Neyman-Pearson, y una realizacin x la prueba  , MP(), para el contraste de hiptesis
reducido con  0  12
H 0 :   12
H 1* :   1
s n
1
estar dada por la regla de decisin: Rechazar H 0* :    0 , si x  k *   0 
t (n
1) .
n
Pero se observa que la prueba no depende del valor elegido 1 12 . Por lo tanto, se ha
encontrado la prueba UMP() para
H 0 :   12
H 1 :  12
s n
1
Dada por la regla de decisin: Rechazar H 0 :   12 , si x  0  t (n
1) , con  0  12 .
n
b). La prueba encontrada se puede formular de la siguiente manera:

Sea X 1 , X 2 , , X n una muestra aleatoria de N (  ,  2 ) entonces el contraste de hiptesis

H 0 :   0
H1 :   0

Con  0 , 1  R y  0  1 valores conocidos de antemano y  2  0 desconocida, tiene


una prueba MP(), para   0, 1, dada por la siguiente regla de decisin, para una
realizacin x1 , x2 , , xn :

s n
1
Rechazar H 0 :    0 , si x  0  t (n
1) .
n

68
Pruebas de hiptesis y lema de Neyman-Pearson

En donde, s n
1 es la desviacin estndar de la varianza muestral correspondiente a la
realizacin de la muestra aleatoria y t (n
1) representa el cuantil  de la distribucin t-
student con n
1 grados de libertad, para   0, 1, .

EJEMPLO 2.17
Sea X 1 , X 2 , , X n una muestra aleatoria de tamao n para la funcin de densidad

x
f ( x; )  xe
2
I ( 0 ,  ) ( x) .
Pruebe si existe una prueba uniformemente ms potente de tamao  para el juego de hiptesis
H0 :  1
H1 :  1
Solucin
Se va a trasladar a una prueba simple contra compuesta
H 0 :  0 ; 0  1
H1 :  1
Ahora se pasa a una prueba simple contra simple
H 0 :  0 ; 0  1
H 1 :  1 ; 1  1  0
Siguiendo los mismos pasos que en el ejemplo 2.5, se obtiene
Paso1. Funcin de verosimilitud
n
n n
8 xi
L X ( )  7 f ( xi ; )  7 xi e 2
xi
I ( 0, ) ( x i )  e2n i 1
A ( x)
i 1 i 1

Lx ( 0 ) f (x; 0 )
Paso 2. Razn de verosimilitudes,  (x)  
Lx ( 1 ) f (x; 1 )
n

0 8 xi n
( 1
0 ) 8 xi
2n
LX ( 0 ) ( 0 ) e 2n
A ( x) # 0 i 1

 ( x)    !  e i 1

LX ( 1 ) n ! 

1 8 xi " 1
( 1 ) 2 n e i 1 A (x)
Paso 3. La estadstica de prueba,  (x) k es equivalente a
ln( (x)) k1 ; k1  ln(k )
n
2n ln( 0 1 )  ( 1
0 )8 x i k1
i 1
n
( 1
0 )8 x i k 2 ; k 2  k1
2n ln( 0 1 )
i 1
n
k2
8x
i 1
i k3 ; k3 
1
0
; ( 1  0 )

n n
Finalmente, la estadstica de prueba X i ~ @(2,1) & 8 X i ~ @(2n,1) & 28 X i ~ @(2n,2)  42n .
i 1 i 1

69
Pruebas de hiptesis y lema de Neyman-Pearson

Paso 4. Con base en la estadstica determinar la constante crtica


* n
0 * n
0
  E 1{ (X)}  P{ ( X) k |  1}  P )8 X i k 3 |  1/  P )28 X i k 4 /
( i 1 . ( i 1 .
De tal forma que la MP ( ) resulta del lema de Neyman y Pearson
* n

--1, si 28 xi k 
 (x)  ) i 1
n
-0, si 28 xi  k 
-( i 1

En donde,   P{Y k }  42n (k ) acumulada de la ji-cuadrada.


Ntese que la prueba no depende de 0 ni de 1 , luego para el caso general
H 0 :  1 vs H 1 :  1 se tiene prueba UMP ( )
* n

-- 1, si 2 8 xi b
 (x)  ) i 1
n
-0, si 28 xi  b
-( i 1

En donde,   P(Y  b) & P(Y b)  1


  42n (b)

Figura 2.7 Ilustracin de P(Y b)  1


  4n (b) del ejemplo 2.17
2

Fuente: Elaboracin propia

70
Pruebas de hiptesis y lema de Neyman-Pearson

Nota
*H 0 :  1
Se pudo haber iniciado con la prueba compuesta contra simple )
( H 1 :  2
*H 0 :  1
Se pasa a una prueba simple contra simple )
( H 1 :  2
Donde
n

f (x;  1)
7 (x e i

xi
I ( 0, ) ( xi )) n
8 xi
 ( x)   i 1
 4
2 n e i 1
f (x;  2) n

7 (2
i 1
2
xi e
2 xi I ( 0, ) ( xi ))

Luego
n n
8 xi 8 xi n
 ( x) k + 4
2n
e i 1 k + e i 1 k1 + 8 xi k 2 (k1  4 2 n k ; k 2  log(4 2 n k ))
i 1
De aqu ya se sigue el mismo desarrollo.
2.8 PRUEBAS COMPUESTA CONTRA COMPUESTA PARA POBLACIONES DE VARIABLES
DISCRETAS
n
Sea X 1 , X 2 , , X n una muestra aleatoria y T  8Xi 1
i , entonces se sabe que:

1) Si X i tiene distribucin Ber( ) , entonces T tiene distribucin Bin(n, ) .


2) Si X i tiene distribucin Bin(m, ) , entonces T tiene distribucin Bin(mn, ) .
3) Si X i tiene distribucin Poi( ) , entonces T tiene distribucin Poi(n ) .
4) Si X i tiene distribucin Geo( ) , entonces T tiene distribucin Binneg(n, ) .
5) Si X i tiene distribucin Binneg(m, ) , entonces T tiene distribucin Binneg(nm, ) .
TEOREMA 2.2
Sea X 1 , X 2 , , X n una muestra aleatoria del tipo 1, 2, 3 4 mencionados anteriormente, entonces
se pueden tener alguno de los siguientes contraste de hiptesis
a) H 0 :  0 contra H1 : 0 , entonces la prueba de tamao UMP(), para   (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn
Rechazar H 0 :  0 , con probabilidad 1, si t k en donde k se encuentra de
P(T  k
1 |  0 )    P(T  k |  0 ) .

P(T  k
1 |  0 )
Rechazar H 0 :  0 , con probabilidad c, si t  k , en donde c  .
P(T  k |  0 )
EP: Ver 1, 2, 3 4 y CC: k
b) H 0 :  0 contraH1 :  0 , entonces la prueba UMP(), para   (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 :  0 , con probabilidad 1, si t  k en donde k se encuentra de
P(T  k
1 |  0 )  1
  P(T  k |  0 ) .
71
Pruebas de hiptesis y lema de Neyman-Pearson

1

P(T  k
1 |  0 )
Rechazar H 0 :  0 , con probabilidad c, si t  k , en donde c  .
P(T  k |  0 )
EP: Ver 1, 2, 3 4 y CC: k
c) H 0 : 0   1 contra H 1 : 0 o  1 entonces la prueba UMP(), para   (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn :
Rechazar H 0 : 0   1 , con probabilidad 1, si t k1 o t  k 2 en donde k1 y k 2 se encuentra
P(T  k1
1 |  0 )   2  P(T  k1 |  0 ) .
P(T  k 2
1 |  0 )  1
 2  P(T  k 2 |  0 )
Rechazar H 0 : 0   1 , con probabilidad c1 , si t  k1 , probabilidad c 2 , si t  k 2 , en donde
 2
P(T  k1
1 |  0 ) 1
 2
P(T  k 2
1 |  0 )
c1  y c2  .
P(T  k1 |  0 ) P(T  k 2 |  0 )
EP: Ver 1, 2, 3 4 y CC: k1 y k 2
n
Con 0 , 1  0, 1, para 1, 3 y 4, para 2 0 , 1 R  valores conocidos de antemano; t  8x
i 1
i .

Donde:
EP: Estadstico de prueba
CC: Constante crtica
EJEMPLO 2.18
Resuelva el problema del canal televisivo cuyo director asegura que la proporcin de audiencia que ve
cierto programa el sbado por la noche es mayor al 40%, con una muestra de 100 televidentes a
quienes se entrevisto, resultando que 45 de ellos vean el programa. Sin utilizar la aproximacin.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 2.5% pruebe si la afirmacin es vlida.
c) Calcule la potencia de la prueba, suponiendo que p  0.60 .
Solucin
a) El contraste de hiptesis es: H 1 : p  0.40 y su opuesta H 0 : p  0.40 .
b) Siguiendo los pasos de la metodologa
i) H 0 : p  0.40 contra H 1 : p  0.40 .
ii) Nivel de significancia   0.025.
iii) Se est ante una situacin similar a la del inciso b del Teorema 2.2. Luego, se requiere
calcular la CC, k que se encuentra de P(T  k
1 | p  p0 )  1
  P(T  k | p  p0 ) .
As, se ha llegado a uno de los principales problemas que se tiene al no utilizar la
aproximacin, puesto que la EP es T ~ Bin(n, p0 )  Bin(100,0.40) . De esta forma se tiene que
encontrar un valor de k entre 0 y 100 que cumpla:
P(T  k
1 | p  0.40)  1
0.025  P(T  k | p  0.40)
k
1 k

8C
i 0
100
i
i
(0.4) (0.6) 100
i
 0.975  8C
i 0
100
i (0.4) i (0.6)100
i

72
Pruebas de hiptesis y lema de Neyman-Pearson

Para realizar estos clculos es obvio que se requiere del apoyo de algn paquete estadstico. As,
49 50

8
i 0
C i100(0.4) i (0.6)100
i  0.9729  0.975  0.9832  8C
i 0
100
i (0.4) i (0.6)100
i

Es decir, la CC es k  50 , note que con la aproximacin se obtuvo CC 49.60. Para el valor de c,


1

P(T  k
1 | p  p 0 ) 1
0.025
P(T  50
1 | p  0.4) 0.975
0.9729
c    0.2524 .
P(T  k | p  p 0 ) P(T  50 | p  0.4) 0.9832
0.9729
Finalmente, la regla de decisin.
Rechazar: H 0 : p  0.40 , con probabilidad 1, si t  k  50 y con probabilidad 0.2524 si t  50 .
Grficamente se tiene:
regin de no rechazo R a

50 regin de rechazo R r
Figura 2.8. Regin de rechazo para el ejemplo 2.18.
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto se recuerda que t  45 50 . As, se
concluye que, con la realizacin tomada no hay evidencias para rechazar H 0 : p  0.40 al
2.5% de significancia.
Conclusin: Al 2.5% de significancia y la realizacin obtenida no existen evidencias para validar
la afirmacin del director de la televisora que p  0.40 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | p  0.40  PT  50 | p  0.60  1
PT  50 | 0.6   1
0.0271 0.9729 .
Valor muy prximo al encontrado con la aproximacin 0.983.
Comentarios finales de la seccin: En el caso de una diferencia de proporciones se tiene el
problema de la distribucin de la estadstica de prueba, ya que se trata de una diferencia de
distribuciones binomiales con diferentes parmetros y no se conoce que distribucin tiene.
EJEMPLO 2.19
El dueo de un comercio estableci que la llegada de clientes a su negocio tiene una distribucin de
Poisson con una razn  de ms de dos clientes cada 15 minutos. Para probar su afirmacin el
negociante realiza un muestreo de 10 intervalos independientes de 15 minutos y anota la cantidad de
clientes que llegan a su negocio, obteniendo: 3, 6, 1, 3, 7, 6, 3, 1, 4 y 3. Justifique estadsticamente la
afirmacin del dueo.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si la afirmacin es valida.
c) Calcule la potencia de la prueba, suponiendo que   3 .
Solucin
a) El dueo del negocio afirma que la razn   2 clientes 15minutos , luego las hiptesis sern:
H 0 :   2 y su opuesta H 1 :   2 .
b) Siguiendo los pasos de la metodologa
i) H 0 :   2 contra H 1 :   2 .
ii) Nivel de significancia   0.05 .
73
Pruebas de hiptesis y lema de Neyman-Pearson

iii) Se est ante una situacin similar a la del inciso b del Teorema 2.2. Luego, se requiere
calcular la CC, k que se encuentra de P(T  k
1 |   0 )  1
  P(T  k |   0 ) .
Por otro lado, se tiene que T ~ Poi(n0 )  Poi(100 ) . De esta forma se tiene que encontrar un
valor entero no negativo de k que cumpla:
P(T  k
1 |   2)  1
  P(T  k |   2)
En este caso la razn de la distribucin de T es 20 y se puede recurrir a las tablas de la distribucin
Poisson. As,
27
e
20 20i 28
e
20 20i
8i 0 i!
 0.9475 0.95  0.9657 8i 0 i!
.

Es decir, la CC es k  28 . Para el valor de c,


1

P(T  k
1 |   0 ) 1
0.05
P(T  28
1 |   2) 0.95
0.9475
c    0.1374.
P(T  k |   0 ) P(T  28 |   2) 0.9657
0.9475
Finalmente, la regla de decisin.
Rechazar: H 0 :   2 , con probabilidad 1, si t  k  28 y con probabilidad 0.1374 si t  28 .
Grficamente se tiene:
regin de no rechazo R a

28 regin de rechazo R r
Figura 2.9. Regin de rechazo para el ejemplo 2.19
Fuente: Elaboracin propia

iv) Por ltimo se aplica la regla de decisin, para esto se recuerda que t  37  28 y, con lo
cual se concluye que con la realizacin tomada se rechaza H 0 :   2 al 5% de
significancia.
As, se concluye que al 5% de significancia y la realizacin obtenida es vlida la afirmacin del
dueo.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | T  2  PT  28 | T  3  1
PT  27 | T  30   1
0.3329  0.6671.
Que es una potencia elevada.

74
Captulo 3

Pruebas de razn de verosimilitud


generalizada

INTRODUCCIN
n el captulo anterior se analizaron las pruebas de hiptesis utilizando el mtodo de la razn

E de verosimilitud, basado en el lema de Neyman-Pearson, para determinar la mejor prueba.


Para ello se explic la metodologa para los posibles juegos de hiptesis: hiptesis simple
contra simple, simple contra compuesta, compuesta contra simple y compuesta contra
compuesta.
En el presente captulo continuar el estudio de las pruebas de hiptesis, introduciendo nuevos
mtodos para determinar la prueba UMP ( ) . Se empezar definiendo a las familias con razn de
verosimilitud montona y a partir de sta se enunciar un Teorema para encontrar la prueba
UMP ( ) .
Tambin, se abordar el caso de las pruebas insesgadas, en donde el parmetro que se quiere
probar en el juego de hiptesis est delimitado en un intervalo dado, y de cmo encontrar la mejor
prueba para este tipo de casos.
Finalmente, como una generalizacin a la prueba de Neyman-Pearson, se revisar el mtodo de
la razn de verosimilitud generalizada en donde los contrastes de hiptesis que se desea probar no
necesariamente tienen un slo parmetro, sino que pueden tener varios parmetros. Por ejemplo, la
distribucin normal con dos parmetros desconocidos, en donde se revisarn los resultados para la
media cuando se desconoce la varianza, la prueba para la varianza y en el caso de dos muestras para la
razn entre varianzas. Los resultados encontrados sern utilizados en el siguiente captulo sobre la
metodologa de las pruebas de hiptesis para la distribucin normal.
3.1 FAMILIAS DE DISTRIBUCIN CON RAZN DE VEROSIMILITUD MONTONA
En el caso de los contrastes de hiptesis compuesta contra compuesta obtener la prueba UMP ( ) con
el mtodo del lema de Neyman-Pearson resulta un poco laborioso, de tal manera y debido a su
importancia del tema se buscan nuevos mtodos que sean ms fciles de manejar para determinar la
prueba UMP ( ) en el caso de hiptesis compuesta contra compuesta. En general el problema es
complicado, pero sin embargo existen distribuciones que tienen propiedades buenas para determinar la

75
Pruebas de razn de verosimilitud generalizada

prueba UMP ( ) , algunas de estas distribuciones pertenecen a las familias que se enunciarn
enseguida.

Definicin 3.1
Se dice que una familia de distribuciones
{ f (x; ),   D R}
Tiene razn de verosimilitud montona en si existe una funcin real T(x) tal que para 
f (x; )
las densidades f (x; ) y f (x; ) son distintas y la razn es una funcin no decreciente
f (x; )
f (x; )
de T(x) . Es decir  RT (x)  , en donde R es una funcin no decreciente de T(x) 31.
f (x; )

EJEMPLO 3.1
Sea F  {N ( ,1) :  R} y  , entonces
1
1
( x
 ) 2
2
e
f ( x; ) 2?
  exp[x( 
)
1 2 (  2
2 )]  R(x) ,
f ( x; ) 1
1

( x
) 2
2
e
2?
R(x) es creciente (o no decreciente) ya que 
 0 en T(x)  x .
TEOREMA 3.1

Sea X ~ f ( x; ) , donde   D R tal que la familia de densidades tiene razn de verosimilitud


montona en T(x) , entonces existe la prueba UMP ( ) para probar:

*H 0 :  0 *H 0 : 0 *H 0 :  0 *H 0 :  0
a) ) ) b) ) )
(H1 :  0 (H1 :  0 (H1 : 0 (H1 :  0
Con 0 conocida, la cual est dada por: Con 0 conocida, la cual est dada por:
*1, si T (x)  k *1, si T (x) k
- -
 (x)  )c, si T (x)  k  (x)  )c, si T (x)  k
-0, si T (x) k -0, si T (x)  k
( (
Donde c  (0,1) y k 0 tales que Donde c  (0,1) y k 0 tales que
  E 0 { (X)} .   E 0 { (X)} .
Note que T(X) es la estadstica de prueba. Note que T(X) es la estadstica de prueba32.

31
Op. Cit., p. 423
32
Op. Cit., p. 423
76
Pruebas de razn de verosimilitud generalizada

El Teorema se deduce usando las tcnicas de reduccin de hiptesis donde se puede ver que la
funcin  ( ) de la prueba del Teorema es montona no decreciente, luego se obtiene la prueba
UMP ( ) , ver figura 3.1.
La parte (a) del Teorema se puede apreciar en la figura 3.1, similarmente se puede trazar la
grfica para la parte (b).

 ( )

  ( )

H H
0 1

Figura 3.1 Comportamiento de la funcin  ( ) de la prueba


Fuente: Elaboracin propia.
EJEMPLO 3.2
Sea X una sola observacin de la funcin de densidad f ( x; )  (2 x  1
) I [0,1] ( x) , donde
1   1 .
Encuentre la prueba uniformemente ms potente de tamao  para el juego de hiptesis
H0 :  0
H1 :  0
Solucin
Si se aplica la razn de familias montonas se elige  , tal que
f (x; ) 2 x  1

 .
f (x; ) 2 x  1

Para ver si es montona creciente, se toma la derivada con respecto a x
d 6 f ( x; ) 3 (2 x  1
)(2 )
(2 x  1
)(2 ) 4 x
4 x  2 (1
)
2 (1
)
4 1 
dx 5 f ( x; ) 2 (2 x  1
) 2 (2 x  1
) 2
2( 
)
 0
(2 x  1
) 2
Entonces la funcin es creciente.
77
Pruebas de razn de verosimilitud generalizada

2 x  1

Con T (X)  x ; R(T (x))  , por el Teorema de familias montonas se sabe que
2 x  1

existe una prueba UMP ( ) dada por:
*1, si xk
 (x)  )
(0, si x k
Para determinar la constante crtica se resuelve
1
  E 0 { ( X)}  P{ X  k |  0}  ; 1dx  1
k ,
k

entonces se tiene que k 1


 , as la prueba queda
*1, si x 1

 ( x)  )
(0, si x 1

EJEMPLO 3.3
(1
)
1
Sea X 1 , X 2 , , X n una muestra aleatoria de f ( x; )  x
I ( 0,1) ( x) y el juego de hiptesis

H 0 :  0
H1 :  0
a) Para una muestra de tamao n, encuentre la UMP ( ) para el juego de hiptesis.
b) Tome n  2, 0  1 , y   0.05 y bosqueje la funcin potencia de la prueba UMP ( ) .
Solucin
a) Por el mtodo de las familias montonas, sea  y la razn de verosimilitud
n
# 1 (1
  ) n (1
 )

7  i (0,1) i 
! x I ( x )  1   n
7 x  1
 1

f (x; ) i 1 " 6 3
i n 
 n  i 1
    n
47 x 1
f (x; )
i
# 1 (1
) n (1
)
5 i 1 2
7 ! xi I ( 0,1) ( xi )  1  7 xi
n

i 1 "  i 1

Tomando el logaritmo se tiene que


 
ln    6
3 8 ln(xi )  n ln    6
3 8 ln(xi )
n n
n
45  12 i 1 45  12 i 1
 # n
 n ln    6
3!!
8 ln(x i ) 
45  12" i 1
   
0

0

n
entonces la funcin es creciente con respecto a T (x) 
8 ln(xi ) . Por el Teorema 3.1 existe una
i 1

*H 0 :  0
prueba UMP ( ) para probar ) , dada por
(H 1 :  0

78
Pruebas de razn de verosimilitud generalizada

* n

-- 1, si
8 ln(xi )  k
 (x)  ) i 1
n
-0, si
8 ln(xi ) k
-( i 1

n
Como X ~ Beta(1 ,1) , entonces
ln( X ) ~ @(1, ) &
8 ln( X ) ~ @(n, ) . Luego, bajo H 0 se
i 1
n
tiene
20 8 log( X ) ~ @(2n 2 ,2) 
i 1
2n . As, la funcin de prueba (para k1  20 k )

* n

--1, si
0
2
8 ln(x )  ki 1
 ( x)  ) i 1
n
-0, si
2
-( 0 8 ln(x ) k
i 1
i 1

Para determinar la constante crtica


n n
  E 0 { ( X)}   ( )  P{
20 8 ln( X i )  k1 |  0 }  1
P{
20 8 ln( X i ) k1 |  0 }
i 1 i 1

n
De donde P{
20 8 log( X
i 1
i ) k1 |  0 }  1
 & 22n (k1 )  1
 , es decir

* n

--1, si
8 ln(xi )  2 k1
0

 ( x)  ) i 1
n
-0, si
8 ln(xi ) 20 k1
(- i 1

k  es el (1
 ) percentil de 2n
2
.

b) Potencia de la prueba
 ( )  P{
2 ln( X 1 , X 2 )  k1 |  0 }  1
P{
2 ln( X 1 , X 2 ) k1 |  1}  1
P{Y k1 |  1}  0.05

donde Y ~ 42,0.25 , de tal forma que evaluando para diferentes valores del parmetro, se tiene

79
Pruebas de razn de verosimilitud generalizada

Potencia Potencia
0.1 1.21E-19 4.9 0.74747915
0.5 0.000794718 5.3 0.77428627
0.9 0.032224419 5.7 0.79715319
1.3 0.120941658 6.1 0.81679101
1.7 0.232699298 6.5 0.83376402
2.1 0.340422497 6.9 0.84852256

Potencia
2.5 0.434446882 7.3 0.86142833
2.9 0.513439683 7.7 0.87277375
3.3 0.578945182 8.1 0.88279691
3.7 0.633168806 8.5 0.89169292
4.1 0.678206739 8.9 0.89962271
4.5 0.71583224 9.3 0.90671986
Tabla 3.1 Valores de teta con su respectivo Figura 3.2 Grfica de la funcin de potencia de la
valor de potencia de la prueba del ejemplo 3.3 prueba del ejemplo 3.3
Fuente: Elaboracin propia.

EJEMPLO 3.4
Sea X 1 , X 2 , , X n una muestra aleatoria de la distribucin Poisson con parmetro ( Poi( ) ) donde
 0 . Se desea probar:
H0 :  1
.
H1 :  1
La familia de distribuciones Poisson es montona?
Solucin
Note que
6 n xi 3
n
e
xi
4 8 i 1 1
f (x; )  7  e
n %4 n 1
xi ! 4 1
4 7 x i !1
i 1

5 i 1 2
Para 

80
Pruebas de razn de verosimilitud generalizada

n
8 xi n

n 
 i 1 7x !
n
e 8 xi
f (x; ) n (
 ) #  i 1
i
i 1
 e !   R(T (x))
f (x; ) 8
n
xi n " 
e
n i 1 7x !
i 1
i

Donde
n
T (x)  8 xi  y
i 1

 # 
y

Note que R(y )  e n (


) !  es una funcin no decreciente en y, la base es mayor a 1 y los
" 
valores de T son positivos (o considera el logaritmo de la funcin, lnR(y)  n(
)  y ln   , que
es no decreciente en y, luego la funcin original tambin es no decreciente (como resultado de una
funcin montona creciente). Por lo tanto, la familia tiene razn de verosimilitud montona en
n
T (x)  8 xi .
i 1

Entonces, por el Teorema 3.1, existe una prueba UMP ( ) dada por:
* n

-1, si 8x i k
- i 1
- n
 (x)  )c, si 8x i k
- i 1
- n

-0, si 8x i k
( i 1

Donde c y k son tales que


* n
0 * n
0
  E 0  ( X)  1 % P )8 X i  k |  1/  c % P )8 X i  k |  1/  0
( i 1 . ( i 1 .
Para obtener c y k se procede de la siguiente manera:
Primero, se encuentra el valor de k, tal que
# n # n # n
P!! 8 X i  k |  1    P!! 8 X i  k |  1  P!! 8 X i  k  1 |  1
" i 1  " i 1  " i 1 
Por ejemplo, si   0.05 y n  10 , luego de tablas estadsticas para la distribucin Poisson se
tiene que k  15 . Es decir,
# 10
P!! 8 X i  15 |  1  0.0834  0.05
" i 1 
# 10
P!! 8 X i  15 |  1  0.0487 0.05
" i 1 
10
Donde 8X
i 1
i ~ Poi(10 : 1)

Ahora con k  15 , se encuentra c tal que


81
Pruebas de razn de verosimilitud generalizada

0.05
0.0487
0.05  0.0487  c % (0.0347) & c   0.0375
0.0347
Por lo tanto, la funcin de prueba est dada por la siguiente funcin:
* 1 n
- 1, si 8 xi  150.1  1.5
10 i 1
-
- 1 n
 (x)  )0.0374, si 8 xi  1.5
10 i 1
-
- 1 n
- 0, si 8 xi 1.5
( 10 i 1
EJEMPLO 3.5
e
x
Sea X 1 , X 2 , , X n una muestra aleatoria de la distribucin Poisson f ( x; )  I ( 0,1, 2,) ( x) .
x!
a) Encuentre la prueba UMP ( ) para
H 0 :  0
H1 :  0
b) Esboce la funcin potencia para 0  1 y n  25 , (use el Teorema de Lmite Central y un   0.05 ).
Solucin
n
a) Realizando el mismo desarrollo del ejemplo anterior se obtiene que 8X
i 1
i ~ Poi(n ) pertenece a la

familia montona. Por el Teorema 3.1 existe una prueba UMP ( ) tal que
* n

-1, si 8x i k
- i 1
- n
 (x)  )c, si 8x i k
- i 1
- n

-0, si 8x i k
( i 1

Primero, se encuentra k, tal que: FPn (k


1 |  0 )  1
  FPn (k |  0 ) .
Donde FPn (a) es la funcin de distribucin acumulada hasta a, de una variable aleatoria
Poisson.
Despus de obtener k, se sustituye en
n

P{8 X i  k |  0 }
i 1
c n
.
P{8 X i  k |  0 }
i 1

b) Para el caso particular de 0  1 y n  25 , k se encuentra de la relacin

82
Pruebas de razn de verosimilitud generalizada

* FP25 (k
1)  1
  FP25 (k )
- *n 0
-- 0.05
P )8 xi  k |  1/
)c  ( i 1 .
- *n 0
- P )8 xi  k |  1/
-( ( i 1 .
FP ( 25) (32)  0.9420 0.05
0.04 5
/ & k  33; c  
FP ( 25) (33)  0.960. 0.960
0.942 9
k  33 y c  5 9
Si se hace una aproximacin por el Teorema de Lmite Central se tiene que
n *- X
 k n
0 0- *- # k n
0 0-
P{8 X i  k |  0 }  B )  /  B )Z  n !! /
i 1 -( n 0 n -. -( " 0 -.
*- # k
n 0 0- *- # k
n 0 0
 B )Z  n !! /  B )Z  ! -/
! n -
-( " n 0 -. -( " 0 .
Para el caso particular donde 0  1 y n  25 se tiene:
* k
25 0 k
25
1
  0.95  P)Z  /&  1.649 & k  25  8.225  33.225 9 33
( 5 . 5

Potencia Potencia
0.1 0.000 1.1 0.128
0.2 0.000 1.2 0.256
0.3 0.000 1.3 0.419
0.4 0.000 1.4 0.590
0.5 0.000 1.5 0.738
0.6 0.000 1.6 0.849
0.7 0.000 1.7 0.920
0.8 0.003 1.8 0.962
0.9 0.014 1.9 0.983
1.0 0.050 2 0.993
Tabla 3.2 Valores de la potencia de la prueba Figura 3.3 Funcin de potencia de la prueba del
del ejemplo 3.5 ejemplo 3.5
Fuente: Elaboracin propia.

83
Pruebas de razn de verosimilitud generalizada

EJEMPLO 3.6
Sea X una sola observacin de la funcin de densidad f ( x; )  x
1 I ( 0,1) ( x) , donde  0 . Existe
una prueba uniformemente ms potente de tamao  para la siguiente prueba?
H0 :  2
H1 : 2
Solucin
Para darle solucin se utilizar el mtodo de familias montonas.
Sea  y la razn de verosimilitud

f (x; ) x I ( 0,1) ( x) #  


1

1  ! x  R(T (x))
f (x; ) x I ( 0,1) ( x) " 

Esto es una funcin potencial, en donde 


 0 , luego R(T (x)) es una funcin no
decreciente con T (x)  x .
*H 0 :  2
Por el Teorema 3.1 existe una prueba UMP() para probar ) en donde la funcin de
(H 1 : 2
prueba es
*1, si x k
 (x)  )
(0, si xk
Esto es
k
  E 0 2 { (X)}  P{ X k |  2}  ; 2 x 2
1 dx  x 2 k
0  k2 &k   ,
0

pero k  0 , por lo tanto la prueba uniformemente ms potente es:


*
-1, si x 
 (x)  )
-
(0, si x 

EJEMPLO 3.7
Sea X una sola observacin de la funcin de densidad f ( x; )  (1  ) x I (0,1) ( x) ; donde 
1
Encuentre la prueba uniformemente ms potente de tamao  para el juego de hiptesis
H0 :  0
H1 :  0
Solucin
Sea  y la razn de verosimilitud

f ( x; ) (1  ) x # 1   

 (x)   ! x  R(T (x))
f ( x; ) (1  ) x " 1  
Es una funcin creciente en x, porque 
 0 y 1   y 1   0 . ( 
1) . En donde
T (x)  x , as la funcin de prueba es:

84
Pruebas de razn de verosimilitud generalizada

*1, si  ( x)  k
 ( x)  )
(0, si  ( x) k
Para cualquier k
1
  E 0 { ( X)}  P{ X  k |  0}  ; dx  1
k & k  1

k

De esta forma, la funcin de prueba uniformemente ms potente es:


*1, si  (x)  1

 ( x)  )
(0, si  (x) 1

TEOREMA 3.2

Sea X ~ f ( x; ) ,   D R , donde f (x; )  c( )h(x)e  ( )T ( x) ,es una familia exponencial donde


 ( ) es una funcin montona, entonces pertenece a una familia de razn de verosimilitud
montona33.
Su demostracin es muy sencilla, obteniendo la razn de verosimilitudes.
Con este Teorema algunos de los ejemplos se pueden resolver fcilmente, ya que cumplen tambin el
Teorema 3.1.
EJEMPLO 3.8
(1
)
1
Sea X 1 , X 2 , , X n una muestra aleatoria de f ( x; )  x
I ( 0,1) ( x) y el juego de hiptesis

H 0 :  0
H1 :  0
a) Para una muestra de tamao n, encuentre la UMP ( ) para el juego de hiptesis.
b) Tome n  2, 0  1 , y   0.05 y bosqueje la funcin potencia de la prueba UMP ( ) .
Solucin
1 #! n


8 ln(xi )

1 
n
# n ! 
LX ( )  #! 1  !! 7 xi  e " i 1 
"  " i 1 
a) Entonces LX ( ) pertenece a una familia exponencial. Por lo tanto, tiene una prueba UMP ( ) para
H 0 :  0 vs H1 :  0 y est dada por
* n

--1, si
8 ln(xi )  k
 (x)  ) i 1
n
-0, si
8 ln(xi )  k
-( i 1

n
Ahora para encontrar k, se necesita la densidad W 
8 ln( X i )
i 1

Como

33
Op. Cit., p. 424
85
Pruebas de razn de verosimilitud generalizada

ln( X ) ~ @(1, ) & P{


ln( X i )  y}  P{X i  e
y } & W ~ @(n, )
Luego
* n
0
  P )
8 ln( X i )  k |  0 /  P{W  k |  0 }  1
P{W  k |  0 }  1
FW (k |  0 )
( i 1 .
& FW (k |  0 )  1
 & k  FW
1 (1
 ) |  0
  P{W  k |  0 }  P{ 20 W  20 k |  0 }  1
P{ 22n  20 k}

~ @ ( n, 2)

1 0
& 0 k  F 2 (1
 ) & k 
2
2
F
21 (1
 )
2n 2n

As, la prueba UMP ( ) est definida como:


* n

--1, si
8 ln(x i )  FW
1 (1
 )
 ( x)  ) i 1
n
-0, si
8 ln(xi )  FW
1 (1
 )
-( i 1

b) Esto es, se debe probar


H0 :  1
H1 :  1
Del resultado anterior para n  2
W ~ @(2, ) & k  FW
1 (1
 )  FW
1 (0.95)
w
2 xe
x 1 w
FW ( w)  ; dx  ; xe
x dx  1
e
w ( w  1)
0
@(2) 0

k
FW (k )  0.95  1
e (k  1) & k  4.744

0
k F
21 (1
 )
2 2n
1
k  F
21 (0.95)  12 (9.4877)  4.74385
2 4
As la funcin potencia para esta prueba es:
4.744e
4.744  e
4.744 e
4.744 (  4.744)
 ( )  P{W  4.744 | }  1
P{W  4.744 | }   .

3.2 PRUEBAS INSESGADAS

Supngase que X ~ f ( x; ) ,  R , se desea probar


H 0 : 1   2
H 1 : 1  2
A este tipo de pruebas se les llama de dos colas o bilaterales, que a diferencia de las pruebas
anteriores (de una cola izquierda, H1 : 1 , o derecha, H 1 :  1 ) su funcin de potencia no podr
permanecer por debajo de la lnea del nivel de significancia, como se muestra en la figura 3.4.
86
Pruebas de razn de verosimilitud generalizada

1
 2


1 2

Figura 3.4 Comportamiento de las pruebas insesgadas 1 y  2


Fuente: Elaboracin propia.

La pregunta que surge de forma inmediata es:


Ser posible encontrar una prueba UMP ( ) ?
Respuesta: En general, no existe tal prueba explique por qu?

Definicin 3.2
Se dice que  es una prueba insesgada34, si
1)  ( )   para  
2)  ( )   para  

Cuando se dese aprobar
H0 : 
H1 :  

Para hiptesis de dos colas es deseable encontrar la prueba UMP ( ) . Es decir, se busca la
prueba que satisface 1) y 2) tal que
 ( )   ( ) ,

para  
 y cualquier otra prueba   insesgada, la prueba que cumple con la desigualdad se le
llama prueba uniformemente ms potente insesgada de tamao  y se denota por UMPI ( ) .
TEOREMA 3.3

Sea X ~ f ( x; ) ,   D R , donde f ( x; )  c( )h(x)e  ( )T ( x) , donde  ( ) es una funcin


montona. Entonces existe una prueba para UMPI ( ) para probar:
H 0 : 1   2
H 1 : 1  2

34
Op. Cit., p. 425
87
Pruebas de razn de verosimilitud generalizada

Donde 1 , 2 son conocidos, la cual es dada por


*1 si T ( x ) k1 T ( x)  k 2
-c T ( x )  k1
- si
 ( x)  ) 1
-c 2 si T ( x)  k 2
-( 0 si k1 T ( x) k 2
Donde c1 , c2 , k1 y k 2 son tales que:
  E 1  (X)  E 2  (X)
Si T (x) es continua, entonces c1  c2  0 .

EJEMPLO 3.9
Sea X 1 , X 2 , , X n una muestra aleatoria que se distribuyen N ( ,1) . Se desea probar
H 0 :1   2
H1 : 1  2

Solucin
n n n
8 ( xi
) 2 8 xi2 8 xi
1 1

n

n 2
2 2
1
1 ( xi
) 2
1 1
f (x; )  7
i 1 i 1 i 1
  % e % e .
2
e 2
e e
2? (2? ) n 2 (2? ) n 2
i 1
   h(x) e  ( ) T ( x )
c ( )
n
De donde, T (x)  8 xi por el Teorema 3.3 la prueba UMPI ( ) estar dada por
i 1

* n n

-1 si 8x i k1 8x i  k2
- i 1 i 1

-0
n
* n n

-
si 8 x i  k1 -- 1, si 8 x i k 1 8 xi  k 2
 ( x)  ) i 1
n ) i 1
n
i 1

-0
-
si 8x
i 1
i  k2 -0,
-(
si k1  8 x i  k 2
i 1
- n
-0 si k1 8 x i k 2
( i 1

Luego,
n n
  E 1  ( X)  E 2  ( X)  P(8 X i k1 | 1  1)  P(8 X i  k 2 | 2  2)
i 1 i 1

# k1

#

k2
# ( k
n) # k
2n
  P! Z n   P! Z     !! 1
n
  1
 !! 2 
! 1 
n ! 
1 n  " n  " n 
" 1 " 2

Despejando las constantes crticas

88
Pruebas de razn de verosimilitud generalizada

# ( k1
n)
   !!  & k1  n
1 ( )  n
" n 
# k
2n
1
   !! 2  & k 2  n
1 (1
 )  2n
" n 
Finalmente la prueba UMPI ( ) queda
* n n

--1, si 8 xi n
1 ( )  n 8 xi  n
1 (1
 )  2n
 ( x)  ) i 1
n
i 1

-0, si n ( )  n  8 xi  n
1 (1
 )  2n

1
-( i 1

3.3 METODO DE PRUEBA DE LA RAZN DE VEROSIMILITUD GENERALIZADA


Suponga que se tiene el conjunto X  {x : f X ( x; )  0} , donde X ~ f X ( x; ),   , y X es el soporte
de la funcin de densidad. El problema general de una prueba de hiptesis fue comentado en el
captulo 1 y consiste en buscar formas para particionar a X de manera eficiente; es decir, que
minimice la probabilidad del error tipo II (o que la funcin de potencia se maximice), conservando un
tamao de prueba  . Note que ahora se ha aumentado el nmero de parmetros  ( 1 ,, m ) ,
donde la hiptesis a probar est dada por:
H0 : 
H1 :  

En el desarrollo de las pruebas de hiptesis, uno de los problemas consiste en determinar la
estadstica de prueba para indicar la regla de decisin por medio de la funcin de prueba
*1, si T (x)  k
 ( x)  )
(0, si T (x) k
Por tales razones se va a introducir una tcnica para construir una prueba de hiptesis, ms
general que las estudiadas en el captulo previo.
Para esto considere la funcin de verosimilitud LX () , LX ()  f (x; ) .
NOTA
Idealmente se requiere resolver todo en trminos de X , pero en muchas ocasiones no es
posible y se recurre a una realizacin x , ya que son nmeros y se pueden hacer
aproximaciones.

Por otro lado, sea  el estimador de mxima verosimilitud de cuando el espacio de


 
parmetros est restringido a la hiptesis H 0 . Entonces LX  denota la verosimilitud bajo H 0 . En
forma similar, L (
X 
) denota la verosimilitud bajo la misma H . Luego, es el estimador de
1 

mxima verosimilitud restringido al espacio 
 . Como una generalizacin a la prueba de Neyman-
Pearson para el caso simple contra simple, es razonable basar la decisin en la razn de
verosimilitudes, definida como:
LX (  )
 (x)  ,
L (
X 
 )

89
Pruebas de razn de verosimilitud generalizada

La cual es una estadstica que ya no depende de ningn parmetro desconocido.


As, la decisin de rechazar sera cuando  (x) es pequea (porque esto significa que hay ms
verosimilitudes bajo L (
X 
) que bajo L ( ) ). Es decir
X 

*1, si  (x) k rechazar con probabilidad 1, si  (x) k


-
 (x)  )c, si  (x)  k rechazar con probabilidad c, si  (x)  k
-0, si  (x)  k rechazar con probabilidad 0, si  (x)  k
(
Donde c  (0,1) y k  0 , tal que
  maxE  ( X)  ()
 

 ( )

Para que  (x) sea una prueba de tamao  ; es decir, se deben encontrar las constantes c y k
que hagan que se cumpla () .
Note que 0   (x)  . Adems que este tipo de prueba es una generalizacin directa de las
pruebas de Neyman-Pearson en el caso simple contra simple.
Generalmente, las pruebas de razn de verosimilitud generalizada estn basadas en:
LX (  )
 ( x)  ,
L ( )
X 

donde LX (  ) es el estimador de mxima verosimilitud sobre todo el espacio de parmetros  .

LX (  ) L ( )
Note que esencialmente  (x)  y  (x)  X  son pruebas equivalentes, pero
LX ( 
 ) LX (  )
resulta ms prctico estudiar los parmetros bajo todo  que bajo 
 . Con esto siempre
0   (x)  1 . De esta manera:
*1, si  (x) k
-
 (x)  )c, si  (x)  k
-0, si  (x)  k
(
A veces,  (x) resulta ser una funcin montona de una estadstica sencilla y por lo tanto, es
conveniente basar la prueba en esa estadstica.
Para aplicar el mtodo de razn de verosimilitud generalizada en la prueba de hiptesis se
recomienda seguir los siguientes pasos.
Metodologa para la aplicacin del mtodo de razn de verosimilitud generalizada
Sea X 1 , X 2 ,, X n una muestra aleatoria con funcin de densidad f ( x; ) en donde
 ( 1 ,, m ) y se desea probar el contraste de hiptesis
H0 : 
H1 :  


LX (  )
Con el mtodo de razn de verosimilitud generalizada  (x)  .
L ( )
X 

90
Pruebas de razn de verosimilitud generalizada

Paso 1. Calcular la funcin de verosimilitud LX () , identificando  y  .


Paso 2. Determinar los estimadores de mxima verosimilitud bajo   .
Paso 3. Determinar los estimadores de mxima verosimilitud bajo   .
LX (  )
Paso 4. Determinar  (x)  y por medio de reducciones encontrar una estadstica de
L ( )
X 
prueba e intentar que sta tenga una distribucin conocida. En esta etapa se requiere de bastante
habilidad y arte, para obtener una buena estadstica de prueba, ver los ejemplos.
Paso 5. Con la estadstica de prueba calcular la constante crtica al nivel de significancia
indicado y establecer la regla de decisin.
Nota: En caso de que la estadstica de prueba no tenga distribucin conocida, se hace uso de
simulacin.

EJEMPLO 3.10
Sea X una sola observacin de la funcin de densidad f ( x; )  x
1 I ( 0,1) ( x) , donde  0 . Encuentre
la prueba de razn de verosimilitud de tamao  para probar la siguiente hiptesis:
H0 :  1
H1 :  1
Solucin
Paso 1. . Se observa que   (0, )  R  y   {1} . Por otro lado, la funcin de verosimilitud es
LX ( )  x
1 I (0,1) ( x) o X ( )  ln( )  (
1) ln(x)  ln(I (0,1) ( x))

Paso 2. El estimador de mxima verosimilitud, bajo todo   (0, )  R  se obtienen derivando con
respecto al parmetro la funcin de verosimilitud o log-verosimilitud
d X ( ) 1 1
  ln(x)  0 & 

d ln(x)
Paso 3. El estimador de mxima verosimilitud, bajo   {1} se obtiene sustituyendo  1 en la
funcin de verosimilitud
LX (1)  1 % x1
1  1
Paso 4. La razn de verosimilitudes
L X (  1) 1 1 1
 ( x)   
ln(x) % x ln(x ) k
L ( ) |
X  (
1
)x

1
1
ln(x )
ln(x )

La estadstica de prueba en este momento est dada por


1 1

T (x) 
(ln(x))x ln(x )
Pero su distribucin no es conocida, por tal razn es conveniente seguir reducindola. Tomando
el logaritmo en ambos lados

ln(x) % x % x 1 ln(x ) k 0 ; 0 k0 1
ln(
x ln(x))  ( 1
ln(x )
) ln(x) k1 ; k1  ln(k 0 ) 0

91
Pruebas de razn de verosimilitud generalizada

Reduciendo
ln(
x ln(x)) k 2 ; k 2  k1
1

x ln(x) k 3 ; k 3  e k2  0
En este momento la estadstica de prueba est ms reducida

X ln(X ) , con X ~ Beta( ,1)
Pero su distribucin sigue siendo desconocida. La mecnica trabajada en la parte de
transformaciones entre variables, sugiere realizar algo similar, pero la funcin de la estadstica de
prueba con respecto a X no es invertible.
En este momento es donde se debe de efectuar algo de arte, para llegar a una estadstica
conocida. El proceso siguiente es muy utilizado en este tipo de pruebas, por tales razones se
recomienda poner mucha atencin.
Paso 5. En la bsqueda de la constante crtica se tiene que resolver
  P{ (X) k}  P{
X ln( X ) k 3 }  P{X ln( X )  k}
Si se denota g ( x)  x ln(x) , se tiene una funcin como la mostrada en la figura 3.5, y la
bsqueda de la constante crtica es equivalente a buscar los valores de a y b que hace
g ( x)  k + x a x  b .
Luego, el problema de la bsqueda de la constante crtica es equivalente a:
  P{X ln X  k }  {X a X  b}  P( X a)  P( X  b) .

2

1


Figura 3.5 Ilustracin de   P{ X ln X  k } del ejemplo 3.10


Fuente: Elaboracin propia.

Entonces,
  P( X a)  1
P( X  b)  1  FX (a)
FX (b)
En donde
x
FX ( x)  ; w
1 dw  x .
0

Obteniendo bajo la hiptesis nula (  1 ) a:

92
Pruebas de razn de verosimilitud generalizada

 1  a
b
As, la bsqueda de a y b es complica porque se tiene una sola ecuacin con dos incgnitas y
determinar cul eleccin es mejor no resulta sencillo. Pero se tiene otra condicin que deben cumplir a
y b, esta consiste en que g (a)  g (b) + a ln(a)  b ln(b)
a ln(a)
b ln(b)  0
a
b 1

Por ejemplo, para   0.05 , se obtiene
a 
0.00852152 *1, si x 0.008521 x  0.958521
 ( x)  )
b 
0.958521 (0, si x [0.008521,0.958521]
EJEMPLO 3.11
Para la muestra aleatoria X 1 , X 2 , , X n de la funcin de densidad f ( x; )  e
x I ( 0,) ( x) . Encuentre
una prueba de razn de verosimilitud de tamao  para el juego de hiptesis
H0 :  1
H1 :  1
Solucin
Paso 1.Se identifica a  y  y se obtiene la funcin de verosimilitud. En este caso:
H 0 :  1 &   (0,1]
H 1 :  1 & 
  (1, )
As   R  y   (0,1] . La funcin de verosimilitud es
n
n
8 xi n
LX ( )  7 e
xi I ( 0, ) ( xi )  n e i 1
7I ( 0, ) ( xi ) .
i 1 i 1

Paso 2. Se determina el estimador de mxima verosimilitud bajo   . Para esto se aplica la funcin
log-verosimilitud
n
ln(LX ( ))  n ln( )
8 x i  0
i 1

d n n n
ln(LX ( )) 
8 x i  0 &  n
d i 1 8 xi
i 1

Luego
n

8 xi n # n n
# n !!
n 8 xi  8 xi n n e
n
LX (  )  e
n i 1
 !! n 8 xi  %e " i 1  i 1
 n
" i 1  # n
!! 8 xi 
" i 1 
Paso 3. Se determina el estimador de mxima verosimilitud bajo   , para esto
n
ln(LX ( ))  n ln( )
8 xi 0 con  1
i 1

La funcin bajo la hiptesis nula es montona creciente, se puede obtener derivando

93
Pruebas de razn de verosimilitud generalizada

d n n
ln(LX ( )) 
8 xi 0 con  1
d i 1
Luego, su mximo lo alcanza cuando  1 es mximo, es decir  1 , con esto
n
~
8 xi
LX (  )  e i 1

Paso 4. La razn de verosimilitudes


n

8 xi
n n # n
n
# n # n
1 2!! 2 8 xi 
~
8 xi !! 8 xi  e i 1 2!! 8 xi  e " i 1 
LX (  )
"  " i 1 
i 1
e i 1
 ( x)   n
n

L ( ) # n
n
n e 2n n e
n
e
n n n !! 8 xi 
X 

" i 1 
n n
Como X i ~ @(1,1) bajo H 0 , entonces 28 X i ~ @(n,2)  22n ; sea Y  28 X i ~ 22n
i 1 i 1


1 y
y n e
1 2 y y ne 2 1
n
2 y *1, si  (x) k
 ( x)  & k + y e k1 &  ( x)  )
(0, si  (x)  k
n
n n
n
2n e 2n e

1 y
En este momento se procede como en el ejemplo anterior con la funcin g ( y)  y n e 2
.
Paso 5. Determinar la constante crtica.

1 y
Sea g ( y)  y n e 2

Figura 3.6 Ilustracin de   P{g (Y ) k1} donde Y ~ 22n del ejemplo 3.11
Fuente: Elaboracin propia.
  P{g (Y ) k1}; Y ~ 22n .
Como es de una sola cola, H 0 :  1 vs H 1 :  1
  P{Y  b}; Y ~ 22n
 1
P{Y b}
P{Y b}  1
 ; en donde b es el percentil 22n,1
 .
EJEMPLO 3.12
Sea X una sola observacin de la funcin de densidad f ( x; )  (1  ) x I (0,1) ( x) ; donde 
1
94
Pruebas de razn de verosimilitud generalizada

Cul es la razn de verosimilitud generalizada para el siguiente juego de hiptesis?


H0 :  0
H1 :  0
Solucin
Paso 1. Se identifica a  y  , y se obtiene la funcin de verosimilitud. Aqu   {0} ;   (
1, )
Para la funcin de verosimilitud
LX ( )  (1  ) x .
Paso 2. Se determina el estimador de mxima verosimilitud bajo   .
Para maximizar LX ( )  (1  ) x se usar el logaritmo

d ln(LX (  )) d
 [ln(1  )  ln(x)]
d d
 11  ln(x)  0
Despejando a , se tiene que:
1
1

ln(x)
1  
1 ln(x)
 
ln1(x )
1
Paso 3. Se determina el estimador de mxima verosimilitud bajo   .
Para  , se tiene que  0
LX (  )  1 .
Paso 4. La razn de verosimilitudes
1 1
1 1
 ( x)   
ln(x) x ln(x ) k0 .
(1  ) x (1


1
1
1
ln(x )

1) x ln(x )

Siguiendo el mismo procedimiento que en el ejemplo 3.10, se tiene


1


ln(x) % x % x ln(x ) k 0 ; 1  k0  0
ln(
x ln(x))  1
ln (x )
ln(x) k1 ; k1  ln(k ) 0
ln(
x ln(x)) k 2 ; k 2  k1
1

x ln(x) k 3 ; k 3  e k2  0
x ln(x)  k k 
k 3 0
Paso 5. Determinar la constante crtica.
  max E { ( X)}  max P{ ( X)  1 | }
 
  P{ ( X) k 0 }  P{ X ln( X )  k}
Se determina la funcin g ( x)  x ln(x) , como la mostrada en la figura 3.5, y la bsqueda de la
constante crtica es equivalente a buscar los valores de a y b que hace
g ( x)  k + x a x  b .
Luego, el problema de la bsqueda de la constante crtica es equivalente
95
Pruebas de razn de verosimilitud generalizada

  P{X ln X  k}  {X a X  b}  P( X a)  P( X  b) .

Luego,
  P( X a)  1
P( X  b)  1  FX (a)
FX (b) .
En donde
x
FX ( x)  ; (1  ) w dw  x 1 .
0

Obteniendo bajo la hiptesis nula (  0 )


 1  a
b .
As, la bsqueda de a y b se obtiene del sistema
*a ln(a)
b ln(b)  0
)
( a
b 1

La prueba queda definida por a y b que satisfacen el sistema anterior y
*1, si x a x  b
 ( x)  )
(0, si x [a, b]
EJEMPLO 3.13
Sea X una sola observacin de la funcin de densidad f ( x; )  (2 x  1
) I [0,1] ( x) , donde
1   1 .
Construya la razn de verosimilitud generalizada para la prueba
H0 :  0
H1 :  0
Solucin
Paso 1. Se observa que   [
1,1] y   {0} . Por otro lado, la funcin de verosimilitud es
LX ( )  (2 x  1
) I [ 0,1] ( x)  [ (2 x
1)  1]I [ 0,1] ( x) .
Paso 2. Se obtiene el estimador de mxima verosimilitud, bajo   
1,1, . Se puede apreciar que
d
LX ( ) es lineal en y adems [
1,1] . Para toda  , se tiene que LX ( )  2 x
1  0 . Es decir,
d
se hace cero cuando 2 x
1  0 .
* 1, si 2 x
1  0 & x
1 2  0
 max L X ( )  max { (2 x
1)  1}I [ 0,1] ( x)  )
[
1,1]
(
1, si 2 x
1 0 & x
1 2 0
Paso 3. La razn de verosimilitud se obtiene bajo   {0} , sustituyendo  0 en la funcin de
verosimilitud
LX (0)  [0 % (2 x
1)  1]I [0,1] ( x)  1 .
Paso 4. Se determina la razn de verosimilitudes
~
LX (  ) 1
 ( x)   .
LX (  ) LX (  )
Por lo tanto, se rechaza si y solo si | x
1 2 | k , donde k es tal que

96
Pruebas de razn de verosimilitud generalizada

P 0 {| X
1 2 | k}   & P 0 {| X
1 2 | k}  1

k 1 2
1

; dx  (k  1 2)
(
k  1 2)  2k  1
 & k  2

k 1 2

Finalmente,
* 1

-1, si | x
1 2 | 2
 ( x)  ) .
1

-0, si | x
1 2 |
( 2
EJEMPLO 3.14
Sea X 1 , X 2 , , X n una muestra aleatoria que tiene distribucin N ( ,  2 ) , se desea probar
H 0 :  2  1,   R
H 1 :  2  1,   R
Solucin
Paso 1. Note que el espacio de parmetros   R : R  y   R : {1}  {(  ,  2 ) :   R,  2  1}

R


1 

R R

Figura 3.7 Espacio de parmetros para  y  del ejemplo 3.14


Fuente: Elaboracin propia.

Por otro lado, la funcin de verosimilitud est dada por


n
1 # 1 1 # 1 n
LX (  ;  2 )  7 exp!
( xi
 ) 2   exp!
8 ( xi
 ) 
2

i 1 2? 2 " 2 2
 (2? )
2 n 2
" 2 2 i 1 
n 1 n n
X (  ;  2 ) 
ln( 2 )
8 ( xi
 )
ln(2? )
2
2 2 i 1
2
2
Paso 2. Los estimadores de mxima verosimilitud bajo todo   R : R  se obtienen derivando
parcialmente con respecto a cada uno de los dos parmetros la funcin de verosimilitud

97
Pruebas de razn de verosimilitud generalizada

E X (  ;  2 ) 1 n
 2 8 ( xi
 )  0 &   x
E  i 1
E X (  ;  2 ) n 1 n 1 6 n ( x
 ) 2
n 2 3  0

 8 ( xi
 ) 2  0 &
E 2
2 2
2( ) i 1
2 2
2( 2 ) 2 45i8
1
i 12
n
8 ( x i
 )
2

&  2  i 1

n
Resolviendo el sistema de ecuaciones se tiene   ( X , S ) los estimadores de mxima verosimilitud
2
n
sobre todo  .
Paso 3. Los estimadores de mxima verosimilitud, bajo   R : {1}  {(  ,  2 ) :   R,  2  1} se
obtienen sustituyendo  2  1 en la funcin de verosimilitud
1 # 1 n
LX (  ;1)  exp!
8 ( xi
 ) 2  ,
(2? ) n 2
" 2 i 1 
maximizando
dLX (  ;1) 1 # 1 n n n
 exp!
8 ( xi
 ) 2  8 ( xi
 )  0 & 8 ( xi
 )  0 .
d (2? ) n 2
" 2 i 1 i 1 i 1

Resolviendo se encuentra que   X .


Paso 4. La razn de verosimilitudes
1 # 1 n
exp!!
8 ( xi
x ) 
2
LX ( x ,1) (2? (1)) n 2
" 2(1) i 1  e
y 2
 ( x)    ,
LX ( x , s n2 ) 1 # 1 n ( ny )
n 2 e
n 2
exp!
2 8 ( xi
x )  2

(2?s n2 ) n 2 " 2s i 1 
n
donde y  8 ( xi
x ) 2  nsn2 . Simplificando
i 1


 (x)  ( ny ) n 2 exp
( y 2
n) . 
Para obtener una buena estadstica de prueba, primero se requiere conocer la distribucin de Y.
n
Para esto se observa que Y  8 ( X i
X ) 2 no depende de  ; por lo tanto, con H 0 :  2  1 , como la
i 1
n
muestra aleatoria son normales estndar bajo H 0 :  2  1 , entonces Y  8 ( X i
X ) 2 ~ n2
1 , ya que
i 1

Yn n 2 exp
(Y 2
n) .
2
nS
~ n2
1 . Pero qu distribucin tiene T 
 2

Trabajando de forma similar que en los ejemplos anteriores. Considrese la funcin


y
g ( y)  ( n ) n 2 exp{
( y
n) 2} y trace su grfica

98
Pruebas de razn de verosimilitud generalizada

Figura 3.8 Grfica de la funcin g ( y ) donde se desea encontrar a y b tales que g (a)  g (b)  k
Fuente: Elaboracin propia.

Ahora recuerde el problema original para determinar la constante crtica k, tal que
 
 (x)  ( ny ) n 2 exp
( y
2 n) k es equivalente a determinar los valores del argumento de la funcin
g ( y) , para que g ( y) k en la figura 3.8 se denotaron por a y b, pero el argumento es y, que como
variable aleatoria, Y se conoce su distribucin Y ~ n2
1 .
Paso 5. Determinar la constante crtica. Como las variables aleatorias son continuas, entonces c  0 .
Falta calcular el valor de k. Este valor debe cumplir que
  max E  (X)  max P{ (X)  1 | }  max P{ (X) k | } .
  

Con lo expuesto arriba se tiene


[ (x) k ] + [ y a y  b] ,
donde g (a)  g (b)  k . As la prueba se puede basa solo en g ( y) .
n
  max P{Y a, Y  b | } y Y  8 ( X i
X ) 2 ,

i 1

donde X 1 , X 2 , , X n una muestra aleatoria que se distribuyen de manera N ( ,1)


El problema consiste en encontrar a y b, tal que se cumpla g (a)  g (b)  k y adems
  max P{Y a, Y  b | } .


Luego, se debe obtener a y b tales que


  P{Y a, Y  b |  2  1} .
Bajo la restriccin g (a)  g (b) . As de las tablas de la 2 se puede calcular la constante crtica
y la prueba  (x) es equivalente a:
*1, si y a y  b
 (x)  )
(0, si a  y  b
Falta determinar las constantes a y b, las cuales deben cumplir g (a)  g (b)  k .
Con
  max P{Y a, o Y  b | }  max{1
P{a  Y  b |  ,  2 }} .
 R
 2 1
99
Pruebas de razn de verosimilitud generalizada

En esta ltima probabilidad, se nota que el clculo no depende de  , puesto que Y ~ n2


1 slo
depende de los grados de libertad.
  1
P{a  Y  b |  2  1} .
Como
g ( y)  ( ny ) n 2 exp{
( y
2 n) } .
Esto es, se desea resolver el sistema de dos ecuaciones en los valores a y b.
*Fy (b)
Fy (a)  1
 ; Y ~ n2
1
)
( g (a)  g (b)

NOTA
1) Para resolver el sistema, se hacen iteraciones con a y b, tales que
* g (a1 )  g (b1 )
a1 ' b1 ) 91

(FY (b1 )  FY (a1 )
Se toma una segunda, tercera y as sucesivamente
2) La prueba no depende de  .

EJEMPLO 3.15
Sea X 1 , X 2 , , X n una muestra aleatoria que se distribuye N (  ,  2 ) . Supngase que
*H 0 :   0 ,  2  0
) ;  0 conocido
( H1 :    0 ,   0
2

Solucin
Intuicin: Como  2 es desconocida, se tiene que buscar en una distribucin t, cuando se quiere probar
sobre la varianza se usa la distribucin 2 .
Paso 1. Se identifica a  y  y se obtiene la funcin de verosimilitud. En este caso   { 0 } : R  ,
  R : R  . La funcin de verosimilitud es
n
# 1
 exp* 0
n
1
LX (  ,  )  !
2
! 2 
)
8 (x
)2 / .
( 2
2 i
" 2?  i 1 .
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo   R : R  .
Se observa que en  , los estimadores de mxima verosimilitud son ( ,  2 )  ( x , sn2 ) .
Paso 3. Se obtienen los estimadores de mxima verosimilitud, bajo todo   { 0 } : R  .

100
Pruebas de razn de verosimilitud generalizada

n
# 1
 exp* 0
n
1
Bajo  : LX (  0 ,  )  !
!
2
2 
)
8 (x
0 )2 / .
( 2
2 i
" 2?  i 1 .
Se puede ver que
max
2
LX (  0 , 2 )  LX (  0 , 2 ) ,
 0

n
donde  2  1
n 8 (x
i 1
i
0 )2 .

Por otro lado, se observa que en  , los estimadores de mxima verosimilitud son
# n
(  0 ,  2 )  !!  0 , 1n 8 ( xi
 0 ) 2  .
" i 1 
Paso 4. La razn de verosimilitudes
n 2
# 1 * 1 n 0
LX (  0 ,  2 )  !! 
2 
exp)
8 ( xi
 0 ) 2 /
" 2?   ( 2 
2
i 1 .
n 2
6 3 * 0
4 1 -- -
2-
n
1 1
4
4 n
1
2 1
exp)
n
% 8 ( x i
 0 ) /
4 2? % 1 n 8 ( xi
 0 ) 1
- 2(1 n)8 ( x
 ) 2 i 1 -
5 i 1 2 -( i 1
i 0
-.

n 2
6 n
2 3
4 2? % 8 ( xi
 0 ) 1
4 i 1 1 exp{
n 2}
4 n 1
4 1
5 2
~
n 2
6 2?y 3 n
4
5 n 1
2
exp{
n 2 }; ~
y  8
i 1
( xi
 0 ) 2

Cuando se evala en todo  , la funcin de verosimilitud es:



n 2
6 2?y 3 n
LX ( x , s )  4
2
1 exp{
n 2}; y  8 ( xi
x ) 2
5 n 2 i 1

Con estas expresiones se toma la razn de verosimilitud



n 2
6 2?~
y3
exp{
n 2}
LX (  0 ,  2 ) 45 n 12
n 2
(~y )
n 2 # y
 ( x)     !  .
LX ( x , s 2 ) 6 2?y 3

n 2
( y )
n 2 !" ~
y
4 n 1 exp{
n 2}
5 2
Paso 5. Determinar la constante crtica.
#y
Procediendo con el mtodo, falta conocer la distribucin de !! ~  , pero no resulta fcil. Por lo
"y
que se debe hacer un anlisis del problema. Se tiene que encontrar   max  () basadas en  (x) .


Se sabe que   max  ()  max P{ ( X) k | } .


 

101
Pruebas de razn de verosimilitud generalizada

Se va a simplificar a  , para llegar a calcular la probabilidad en la ltima expresin, con lo que


se obtiene a k, resultando:
n 2 n 2
6 n 2 3 6 n
3
#y
n 2 4 8 ( xi
x ) 1 4 8 ( xi
x ) 2 1
 (x)  !! ~   4 ni 1 1  4 n i 1 1
"y 4 2 1 4 2 1
4 8 ( xi
 0 ) 1 4 8 ( xi
x  x
 0 ) 1
5 i 1 2 5 i 1 2
n 2
6 3
4 n 1
4 8 ( xi
x ) 2 1
4 n i 1 1
4 n
2 1
4 8 ( x i
x )  2( x
 0 )8 ( xi
x )  ( x
 0 ) n 1
2

4 i 1 i 1
 1
5 0 2
n
6 n
32
4 8 ( xi
x ) 2 1 n 2

4 n i 1 1  #! 1 
4 2 1 "1  T 
2

48 i


2
( x x ) n ( x 0 ) 1
5 i 1 2
 h(T ) 2

n( x
 0 ) 2
Donde, T 2  n
,y
8 (x
i 1
i
x) 2

n 2
# 1 1
Finalmente,  (x) k & ! 2 
k& k1 & 1  T 2  k 2 & T 2  k 
"1 T  1 T 2

As  (x)  h(T 2 ) es montona decreciente con respecto a T 2 , de tal forma que


[ (x) k ] + [T 2  k ] , luego se tiene

n (x
0 ) * n (x
0 )
- ~ N (0,1)
n( x
 0 ) 2
x
0 x
0  - 
T n
   ; pero )
2
n 2
ns 2 - ns
8 ( xi
x ) 2 1 n 8 ( xi
x ) 2
s
-(  2 ~ n
1
2

i 1 i 1 2
Z Z 1
   %T 
Y Y n
1
n
1
n
1

102
Pruebas de razn de verosimilitud generalizada

Figura 3.9 Grfica de  (x)  h(T 2 ) del ejemplo 3.15


Fuente: Elaboracin propia.
Recuerde que si
n (x
0 )
Z

2
ns
Y
2
Z
Adems si Z y Y son independientes; entonces T   ~ t n
1
Y
n
1
Note que [T 2  k ] y

P{T 2  k  |    0 ,  2  0}  1
P{T 2  k  |    0 ,  2  0}  1
P{
k   T  k  |    0 ,  2  0}
1
 1
P{
k   T   k  |    0 ,  2  0}
n
1
 1
P{
k (n
1)  T   k (n
1) |    0 ,  2  0}
de tal forma que k  debe cumplir
  max P{T 2  k  |  ,  2 }  max{1
P{
k (n
1)  T   k (n
1) |  ,  2 } .
  0   0
 2 0  2 0

Como    0 y  2  0 , T  ~ t n
1 , se observa que la parte derecha no depende de  y  2
  1
P{
k (n
1)  T   k (n
1) }
 P{T 
k (n
1) T   k (n
1) }

Donde T  ~ t n
1 .
Por lo tanto, k  debe ser tal que P{
k (n
1)  T   k (n
1)}  1
 .
De las tablas de t n
1 se buscan los valores de t1
 2 tales que

Ftn
1 (t1
 2 )
Ftn
1 (
t1
 2 )  1
  Ftn
1 (t1
 2 )
(1
Ftn
1 (t1
 2 )) .

103
Pruebas de razn de verosimilitud generalizada

Por simetra, 2Ftn


1 (t1
 2 )
1  1
 & Ftn
1 (t1
 2 )  1
 2 Ftn
1 (
t1
 2 )   2

1


F (
t1*
 2 ) F (t1*
 2 )
t t
n
1 n
1
Figura 3.10 Grfica de una T  ~ t n
1 tales que Ftn
1 (
t1
 2 )  1
  Ftn
1 (t1
 2 ) del ejemplo 3.15

Fuente: Elaboracin propia.


De tal forma que t1
 2  k (n
1) & k   1
n
1
(t1
 2 ) 2 .
Por lo tanto,
*
-1, si T 
2 1
(t1
 2 ) 2
 ( x)  ) n
1

(0, si T 
-
2 1
n
1
(t1
 2 ) 2

Note que la prueba puede ser basada en la estadstica T  , rechazando cuando


T 
t1*
 2 T   t1*
 2 .
Pero, si la funcin de prueba se basa en  (x) , se tiene que regresar a las expresiones iniciales.
NOTA
n (x
0 )
Aqu lo importante fue que la estadstica T   no depende de  2 .
ns (n
1)
2

3.4 PROPIEDAD ASINTTICA DE LAS PRUEBAS DE RAZN DE VEROSIMILITUD


GENERALIZADAS
Una de las propiedades de la razn de verosimilitud generalizada consiste en una prueba asinttica. Sea
el juego de hiptesis
H0 : 
H1 :  

con X 1 , X 2 , , X n una muestra aleatoria de f (x; ),   . Dada una sucesin de funciones de
prueba se definir la consistencia de pruebas.
Definicin 3.3
Se dice que la sucesin { n }n1 de pruebas para
104
Pruebas de razn de verosimilitud generalizada

H0 : 
H1 :  

es consistente, si
lim n ( )  1 F  

n'

En donde, n ( )  1
P{Error tipo II | }

Note que si { n }n1 es consistente, entonces P{Error tipo II cuando  n } GnG'


'
0 . Por lo tanto,
en ocasiones se dice que  n es consistente en probabilidad.
CLASE DE HIPTESIS SIMPLES
Supngase que  tiene dimensin r y sea   { 0 } incluye un solo punto
LX ( 0 )
 n ( x) 
LX (  )
Para probar
H 0 :  0
H1 :  0
Note que bajo algunas condiciones de regularidad sobre { f ( x; ) :  } la prueba
*1, si
2 ln n (x)  k
 n ( x)  )
(0, si
2 ln  n (x) k
es consistente, adems para  0


2 ln n (x) ~% r2 , n'
[
2 ln n (x)  k ] + [n (x) k ]
Por lo tanto, para una  dada, es posible obtener el valor crtico k cuando la distribucin
asinttica de la estadstica de prueba es:

2 ln n (x) bajo H 0
CLASE DE HIPTESIS COMPUESTA
Suponga  de dimensin r y se desea probar
H 0 : i  i0 , i  1,2,, k ;
H 1 : i  i0 , i  1,2,, k
En este caso, k  r sobre los primeros k parmetros, donde, 10 , , k0 son valores conocidos. Note
que bajo H 0 , toma valores de la forma
( 10 , , k0 , k01 , , r0 )

libres

Se tiene una prueba compuesta. Se puede probar que cuando n '  ,


2 ln n (x) ~% k2
Adems, la sucesin de pruebas:

105
Pruebas de razn de verosimilitud generalizada

*1, si
2 ln n (x)  k
 n ( x)  )
(0, si
2 ln  n (x) k
es consistente.
EJEMPLO 3.16
Sea X 1 , X 2 , , X n una muestra aleatoria que se distribuyen N (  ,  2 ) se desea probar
H 0 :   0,  2  1
H 1 :   0,  2  1
Solucin
Paso 1. Se identifica a  y  , se obtiene la funcin de verosimilitud.
En este caso   {0} : {1} y   R : R  . Para la funcin de verosimilitud se tiene
n
# 1 * n 0
LX (  ,  )  !
2  exp-)
1 8 ( x
 ) 2 -/
! 2 
-( 2 i  1 i
2
-. .
" 2? 
n 1 n n
X (  ;  2 ) 
ln( 2 )
8 ( x i
 )
ln(2? )
2

2 2 2
i 1 2
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo   R : R  .
E X (  ;  2 ) 1 n
 2 8 ( xi
 )  0 &   x
E  i 1
E X (  ;  2 ) n 1 n 1 6 n ( x
 ) 2
n 2 3  0

 8 ( xi
 ) 2  0 &
E 2
2 2
2( ) i 1
2 2
2( 2 ) 2 45i8
1
i 12
n
8 ( x i
 )
2

&  2  i 1

n
Resolviendo el sistema de ecuaciones se obtiene   ( X , S 2 ) los estimadores de mxima
n
verosimilitud sobre todo  ; donde s 2  1
n 8 (x
i 1
i
x)2 .

Paso 3. Para la funcin de verosimilitud, bajo todo   {0} : {1} se tiene:


* 20
n
# 1 - 1 n -
!
LX (0,1)  ! 
 exp)
8 ( x ) /
" 2?  - i -
( 2 i 1 .
Paso 4. La razn de verosimilitudes

1 2?
n
 exp*-)-

n 2 0-
8 ( xi ) /
-.
1
2

 n ( x)  ( i 1
.

1 2?s 2
n *- 1 n

exp)
2 8 ( x
x ) /
-( 2 s i  1 i
2 0-
-.
* n 0
 
Por lo tanto,  n (x)  s 2
n 2 - -
exp)
12 8 xi2  n 2/ .
-
( i 1 -
.
Paso 5. Determinar la constante crtica.
106
Pruebas de razn de verosimilitud generalizada

Se tiene que ,
2 ln( n (x)) 
n ln(s 2 )  8 xi2
n ~% 22 , cuando   0,  2  1, n '  .
n

i 1

Por lo tanto, dado  de la distribucin 22 se obtiene k tal que


  P{
2 ln  n ( X)  k |   0,  2  1}
 1
P{Y  k}, Y ~ 22
Es decir, k es el cuantil k  22,1

Por lo tanto, las pruebas son:
* n

-- 1, si
n ln(s 2
)  8 xi2
n  22,1

 n ( x)  ) i 1
n
-0, si
n ln(s 2 )  8 x i2
n 22,1

-( i 1

NOTA
No importa si f ( x;) es discreta, la distribucin asinttica es continua

3.5 RAZN DE VEROSIMILITUD GENERALIZADA EN MUESTRAS INDEPENDIENTES


En general, las pruebas de razn de verosimilitud generalizadas son ms aplicables que las de las
familias montonas. Adems se pueden extender al caso de muestras independientes.
EJEMPLO 3.17
Sea X 1 , X 2 , , X m una muestra aleatoria de la funcin de densidad f ( x; )  1 x 1
1 I ( 0,1) ( x) , y
Y1 , Y2 , , Yn otra muestra aleatoria de la funcin de densidad f ( y; )  2 y 2
1 I ( 0,1) ( y) . Asuma que las
muestras aleatorias son independientes. Sea
U i 
ln X i , i  1,2, , m , y V j 
ln Y j , j  1,2, , n
a) Encuentre la razn de verosimilitud generalizada para el juego de hiptesis
H 0 : 1  2
.
H 1 : 1  2
b) Muestre que la razn de verosimilitud generalizada para el juego de hiptesis anterior puede ser
expresada en trminos del siguiente estadstico
m

8u
i 1
i
T m n

8 ui  8 v j
i 1 j 1

Solucin a)
Paso 1. Se identifica a  y  y se obtiene la funcin de verosimilitud.
En este caso   {( 1 ; 2 ) : 1  2 } y   R  : R 

107
Pruebas de razn de verosimilitud generalizada

2  w
2

1 1
Figura 3.11 Espacio de parmetros para  y  del ejemplo 3.17
Fuente: Elaboracin propia.
La funcin de verosimilitud est dada en los parmetros 1 y 2 .
m n
LX,Y ( 1 , 2 )  f X ( x; 1 ) f Y (y; 2 )  7 1 x i 1
1 I ( 0,1) ( x i ) % 7 2 y j 2
1 I ( 0,1) ( y j )
i 1 j 1

1
1 2
1
# m # n
 1m !! 7 x i  % 2n !! 7 y j 
" i 1  " j 1 
1
1 2
1
# m # n
 !! 7 x i 
1
m n
2
!7 y j 
! j 1 
" i 1  " 
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo  .
Para maximizar es preferible utilizar el logaritmo de la funcin de verosimilitud, obteniendo
m n
ln(LX,Y ( 1 , 2 ))  m ln( 1 )  n ln( 2 )  (
1)8 ln(x i )  (
1)8 ln( y j )
1 i 1
2 j 1

E ln(LX,Y ( 1 , 2 )) m
m
 m 1  8 ln(x i )  0 & 1 

E 1 m
i 1
8 ln(x )
i 1
i

E ln(LX,Y ( 1 , 2 )) n
n
 n 2  8 ln( y j )  0 & 2 

E 2 n
j 1
8 ln( y
j 1
j )

E2 E2
Se tiene un mximo porque ln(LXY ()  )  ln(LXY ( )  )  0 y las segundas
E 1E 2 E 2 E 1
derivadas son negativas y los menores cambian de signo de menos a ms. Es decir, los estimadores de
mxima verosimilitud bajo todo el espacio paramtrico son:
* m
- 1  m ; u i 
ln(xi )
-
-
8
i 1
ui
) n
- 2  n ; v j 
ln( y j )
-
- 8 vj
( j 1

Paso 3. Se obtienen los estimadores de mxima verosimilitud, bajo todo  .

108
Pruebas de razn de verosimilitud generalizada


1
# m n
LX,Y ( 1 , 2 ) |  mn
! 7 xi 7 y j 
! i 1 j 1 
" 
6m n 3
ln(LX,Y ( 1 , 2 ) | )  (m  n) ln( )  (
1) 48 ln(xi )  8 ln( y j )1
5 i 1 j 1 2
E ln(LX,Y ( 1 , 2 )) mn 6m n 3
  48 ln(x i )  8 ln( y j )1  0
E 5 i 1 j 1 2
El estimador de mxima verosimilitud bajo la hiptesis nula es
mn mn
 m n
 m n
.

8 ln(xi )
8 ln( y j ) 8u  8v i j
i 1 j 1 i 1 j 1

Paso 4. La razn de verosimilitudes


~

1
~ # m n

~ m  n !! 7 xi 7 y j 
L X ,Y (  ) " i 1 j 1 
 ( x, y )  
2
1
; como a  e ln a
L X ,Y (  ) 1
1
# m # n
1m 2n !! 7 xi  !7 y j 
! 
" i 1  " j 1 
# # m n
mn ! m  n ! 8 u  8 v 
1 
# m n 6 *m n 03 !" ! i 1 i j 1 j  
"  
!m  n
! 8u  8v i j

 % 4exp)8 ln(xi )  8 ln( y j )/1

" i 1 j 1  54 ( i 1 j 1 .21
# m # n
n ! m 8 ui 
1 ! n 8 v j 
1
# m #
m
n 6 *m !
03 " i 1  6 *n 03 !" j 1 

!! m 8 u i  !! n 8 v 
j  4 exp)8 ln( x i /1
) 4 )8
exp ln( y j /1
)
" i 1  " j 1  5 ( i 1 .2 45 ( j 1 .12
## m n
! ! m  n 8 u  8 v 
1 
mn
#
8m ui
8n v j !" !"
i j
j 1  
# # m n
! e i 1 % e j 1 
i 1
!m  n ! 8 ui  8 v j  
! ! i 1  ! 
" " j 1  " 
 #
# m n
! n 8 v j 
1
!! m 8 ui 
1
# m #
m
#
8m ui "
n
n i 1  #
8n v j !" j 1 


!! m 8 u i  !! n 8 v j  ! e i 1  ! e j 1 
"  " j 1  !"  ! 
i 1
 " 
n m 6 m n 3
# n # m
4 m  n
8 ui
8 v j 1
!8v j  !! 8 u i  % e 54 i 1 j 1 21

( m  n) m  n ! j 1 
" i 1 
 %" 
mn
mmnn m n # m n
8 v j !! 8 ui  8 v j 
8 ui
e
m e i 1 e
n e j 1 " i 1 j 1 

m n
( m  n) m  n # m m n # n m n
 % !! 8 u i 8 u i  8 v j  !! 8 v j 8 u i  8 v j 
mmnn " i 1 i 1 j 1  " j 1 i 1 j 1


109
Pruebas de razn de verosimilitud generalizada

8v
j 1
j

b) De la expresin de la razn  (x,y ) y notando que 1


T  m n
, quedar
8u  8v
i 1
i
j 1
j

( m  n) m  n
 (x, y )  % T m (1
T ) n
mmnn
De tal forma que la funcin de prueba
*1, si  (x, y ) k
 (x, y )  )
(0, si  (x, y )  k
* ( m  n) m  n
% T m (1
T ) n k
--
1, si m n
) m n
mn
-0, si (m  n) % T m (1
T ) n  k
-( mmnn
*1, si T m (1
T ) n k  mmnn
) ; k k
(0, si T (1
T )  k  ( m  n) m  n
m n

EJEMPLO 3.18
Sea X 1 , X 2 , , X m una muestra aleatoria de la funcin de densidad f ( x; )  1e
1x I ( 0,) ( x) , y
Y1 , Y2 , , Yn otra muestra aleatoria de la funcin de densidad f ( y; )  2 e
2 y I (0,) ( y) . Asuma que
las muestras aleatorias son independientes.
a) Encuentre la razn de verosimilitud generalizada para el juego de hiptesis
H 0 : 1  2
H 1 : 1  2
b) Muestre que la prueba de razn de verosimilitudes generalizada puede expresarse como
m

8x
i 1
i
T m n
.
8x 8y
i 1
i
j 1
j

Solucin a)
Paso 1. Se identifica a  y  y se obtiene la funcin de verosimilitud.
En este caso,   R  : R  ,   {( 1 , 2 ); 1  2 } , y la funcin de verosimilitud es
m n
LXY ()  7 1e
1xi I ( 0, ) ( x i ) % 7 2 e

2 y j
I ( 0, ) ( y j )
i 1 j 1
m n

( 1 8 xi  2 8 y j ) # m # n
 1m 2n e i 1 j 1
!! 7 I ( 0, ) ( xi ) ! 7 I ( 0, ) ( y j ) 
! 
" i 1 " j 1 
Paso 2. Se obtienen los estimadores de mxima verosimilitud de 1 , 2 en 

110
Pruebas de razn de verosimilitud generalizada

m n
LXY ()   7 1 e
1xi I ( 0, ) ( x i ) % 7 2 e

2 y j
I ( 0, ) ( y j )
i 1 j 1
m n

( 1 8 xi  2 8 y j ) # m # n
 1m 2n e i 1 j 1
!! 7 I ( 0, ) ( xi ) ! 7 I ( 0, ) ( y j ) 
! 
" i 1 " j 1 
Calculando el logaritmo natural y derivando parcialmente con respecto a cada parmetro se
obtiene:
m n ## m # n
ln(LXY ()  )  m ln( 1 )  n ln( 2 )
1 8 xi
2 8 y j  ln! !! 7 I ( 0, ) ( x i ) !! 7 I ( 0, ) ( y j )  
! " i 1 " j 1 
i 1 j 1
" 
E m m m
ln(LXY ()  ) 
8 xi  0 & 1  m 8 xi
E 1 1 i 1 i 1

E n n n
ln(LXY ()  ) 
8 y j  0 & 2  n 8 y j
E 2 2 j 1 j 1

E2 E2
Se tiene un mximo porque ln(LXY ()  )  ln(LXY ( )  )  0 y las segundas
E 1E 2 E 2 E 1
derivadas son negativas y los menores cambian de signo de menos a ms. Es decir, los estimadores de
mxima verosimilitud bajo todo el espacio paramtrico son:
m 1
1  m

8 xi x
i 1
n 1
2  n

8 yj y
j 1

Paso 3. Se obtienen los estimadores de mxima verosimilitud, bajo todo  .


La muestra aleatoria es de tamao n  m de @(1,1 i ) i  1,2 ,  1  2
m n
LXY ()   7 e
xi I ( 0, ) ( xi ) % 7 e

y j
I ( 0 , ) ( y j )
i 1 j 1
m n

( 8 xi  8 y j ) # m # n
 mn e i 1 j 1
!! 7 I ( 0, ) ( x i ) ! 7 I ( 0, ) ( y j ) 
! 
" i 1 " j 1 
Calculando el logaritmo resulta
m n ## m # n
ln(LXY ()  )  (m  n) ln( )
( 8 xi  8 y j )  ln! !! 7 I ( 0, ) ( xi ) !! 7 I ( 0, ) ( y j )  
! " i 1 " j 1 
i 1 j 1
" 
d mn m n
ln(LXY ()  ) 
( 8 xi  8 y j )
d i 1 j 1

As, el estimador bajo la hiptesis nula es:



1
6 1 m n 3 mn
 4 ( 8 xi  8 y j )1  .
5 m  n i 1
m n
j 1 2 8 xi  8 y j
i 1 j 1

111
Pruebas de razn de verosimilitud generalizada

Paso 4. La razn de verosimilitudes est definida como:


m n

( 8 xi  8 y j )
LXY (  ) m  n e i 1 j 1
 (x, y )  
LXY (  ) m n

1 8 xi
2 8 y j )
m n e i 1 1 2
j 1

Sustituyendo , 1 , y 2
n m
6 3
4 # m n 1
4
nm ! 8 x  8 y 11 
4
4 ! i j
4 "i  1 j  1  11
 (x, y )  5
6
2
n3
4# m# n 1
m ! 
4!  ! 1
4! m 8x  n 8 y  1
 !!
i
4 !" i 1 j 1
4 
" j 1  1
5 2

Sustituyendo
m
X  8 X i ~ @(m,1 1 )
i 1
n
Y  8 Y j ~ @ ( n, 1 2 )
j 1

Se obtiene
mn
#mn
!! 
" x  y  ( m  n) m  n xm yn
 (x, y )   %
#m
m
#n
n
mmnn ( x  y) nm
!  !! 
"x " y
xm yn mmnn
Como  (x, y ) k & k1 ; con k1  k % .
( x  y) nm (n  m) n  m
La funcin de prueba est dada por
* xm yn
m

- 1, si k X  8 X i ~ @(m,1 1 )
( x  y) nm
1
- i 1
 (x, y )  ) con
-0, si xm yn n

-( ( x  y) nm
 k 1 Y  8
j 1
Y j ~ @ ( n, 1 2 )

a) De la prueba anterior
m n
xm yn # x # y x y x
nm
 !!  !!  ; si T  y 1
 T m (1
T ) n
( x  y) "x y "x y x y x y x y
Finalmente,
*1, si T m (1
T ) n k1
 (x, y )  )
(0, si T (1
T )  k1
m n

112
Pruebas de razn de verosimilitud generalizada

EJEMPLO 3.19
Supngase que se tienen dos muestras aleatorias independientes tales que X 1 , X 2 ,, X n una muestra
aleatoria que se distribuyen N ( 1 ,  12 ) y Y1 , Y2 , , Ym una muestra aleatoria que se distribuye
N ( 2 ,  22 ) . Se desea probar:
H 0 : 1   2
H 1 : 1   2
En donde,  12 y  22 pueden satisfacer algunas condiciones.
a) Si  12 y  22 son conocidas, el problema se resuelve fcilmente como en el caso de una muestra
# 2 2
para X
Y ~ N ! 1
 2 , 1  2  .
! n m 
"
b) Supngase que  12   22   2 desconocida; se tiene el problema Behrens-Fisher, desarrollado
entre los aos 1935 y 1939. En este caso se tienen 3 parmetros 1 ,  2 y  2 .
NOTA
En el caso general, cuando  12 y  22 son desconocidos, el problema se estudia desde los
aos 20s, y sigue estudindose, porque no se ha obtenido solucin satisfactoria.
Solucin
Para resolver el problema cuando  12   22   2 , se necesita la razn de verosimilitud, para esto las
muestras son independientes.
n
* 1 n 20
f (x; 1 ,  2 )  #!1 2? 2  exp)
8 ( x i
1 ) /
"  ( 2 i 1
2
.
m
* 1 m 20
f (y;  2 ,  2 )  #!1 2? 2  exp)
8 ( yi
 2 ) /
"  ( 2 i 1
2
.
Luego,
LX,Y (1 ,  2 ,  2 )  f X (x; 1 ,  2 ) % f Y (y;  2 ,  2 )
Esto es, en  bajo H 0 ; ~1 , ~2 y ~ 2 son estimadores de 1 ,  2 y  2 , esto es
LX,Y (~1 , ~2 , ~ 2 ) y bajo todo  se tiene LX,Y ( 1 ,  2 ,  2 ) . As,

LX,Y ( ~1 , ~2 , ~ 2 )


 (x, y )  .
LX,Y (  1 ,  2 ,  2 )
Paso 1. Se identifica a  y  y se obtiene la funcin de verosimilitud.
Aqu   R 2 : R  y   {( 1 ,  2 ) : 1   2 }
n m
# 1 *
- 1 6n m 30
2 -
LX,Y ( 1 ,  2 ,  )  !
2
!

2 
exp)
4 8 ( x
 ) 2
 8 ( y
 ) 1/
( 2 5 i 1
i 1 j 2
- 2-
2
" 2?  j 1 .
Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo  . Despus de calcular el
logaritmo natural, derivando parcialmente y resolviendo el sistema de ecuaciones, se obtiene que

113
Pruebas de razn de verosimilitud generalizada

1 *
-n m 0
2-
1  x ,  2  y y  2  )8 ( xi
x )  8 ( y j
y ) / .
2
nm-
( i 1 j 1 -
.
Paso 3. Se obtienen los estimadores de mxima verosimilitud, bajo todo  , H 0
n m
# 1 *
- 1 6n m 30-
LX,Y ( ~1 , ~2 , ~ 2 )  !  exp)
~ 2 48 ( xi
~1 ) 2  8 ( y j
~2 ) 2 1 /
! ~2 
" 2?  ( 2 5 i 1
- j 1 2-.
Bajo H 0 , se tiene una muestra aleatoria de tamao m  n de la distribucin N ( 1 ,  2 ) . Por lo
tanto, los estimadores de mxima verosimilitud se obtienen fcilmente despus de calcular el logaritmo
natural y derivar parcialmente
n m
(8 x i  8 y j )
2 2

i 1 j 1
~1 
nm
1 6n m
~ 23
48 ( x i
1 )  8 ( y j
1 ) 1
~ 2  ~ 2
n  m 45 i 1 j 1 12
1 6n m
nm 3
 48 ( x i
x )  8 ( y j
y )  (x  y) 2 1
2 2
n  m 54 i 1 j 1 nm 12
Paso 4. La razn de verosimilitudes
Bajo H 0
nm 2 nm 2
# 1 # 1
LX,Y ( ~1 , ~2 , ~ 2 )  !  e
( n  m 2~ 2 )~ 2
!  e
( n  m ) 2 .
! ~2  ! ~2 
" 2?  " 2? 
Bajo todo 
nm 2 nm 2
# 1 # 1
LX,Y (  1 ,  2 ,  )  !
2  e
( n  m 2 2 ) 2
!  e
( n  m ) 2 .
! 2  ! 2 
" 2?  " 2? 
Por lo tanto
( n m ) 2 ( n m ) 2
#  2 6 # nm 3
 1 1  z 
( n m ) 2
n (x, y )  !! ~ 2   4 2 !  2  ( x
y ) 2 1 .
"  5 " nm 2
Donde
nm (n  m) ( x
y ) 2 nm( x
y ) 2 nm( x
y ) 2
z  
 2 (n  m) 2 n m

8 ( xi
x ) 2  8 ( y j
y ) 2
i 1 j 1

Paso 5. Determinar la constante crtica. Note que los eventos son equivalentes
n (x, y) k + z  k 
Puesto que
nm 2
# 1 1 1
n (x, y )  !  k + k 2 n  m  k1 + k 2  1  z + z  k 2
1  k  .
"1  z  1 z k1

114
Pruebas de razn de verosimilitud generalizada

Por lo tanto, la prueba de razn de verosimilitudes generalizadas puede basarse en Z, rechazando


cuando z  k  con k  tal que la prueba es de tamao  . Esto es para   (0,1) , donde k  debe ser tal
que
  max P{Z  k  | 1 ,  2 ,  2 }
1   2
 2 0

Ahora se tiene que identificar la distribucin de Z bajo H 0 : 1   2 , note que


X
Y ~ N (0,  2 ( nnm
m
)) . De tal forma que al estandarizar resulta

X
Y
~ N (0,1) .
 (n  m) nm
Adems, se sabe que
n m

8 ( xi
x ) 2
8(y
j 1
j
y) 2
i 1
~ n2
1 y ~ m2
1 ,
 2
 2

como
n m

8 ( xi
x ) 2 8(y j 1
j
y) 2
i 1
y
2 2
son independientes, entonces
n m

8 ( xi
x ) 2 8(y
j 1
j
y) 2
i 1
 ~ n2 m
2 y es independiente de X
Y .
 2
2
Por lo tanto,
nm x
y
nm 
~ t n m
2
n m

8 (x
i 1
i
x)  8 ( y j
y)
2

j 1
2
 (n  m
2)
2

T2
Luego, Z  . Como la distribucin de Z bajo H 0 no depende de 1   2 , entonces
nm
2
k  debe ser tal que
* T2 0
  P)  k /
(n  m
2 .
 1
P{T 2  k ( n  m
2)}
 1
P{
k ( n  m
2)  T  k (n  m
2) }
As

P
k (n  m
2)  T  k (n  m
2)  1
 
Por lo tanto, de las tablas de la distribucin t nm
2 , se tiene el valor t n*m
2,1
 2

115
Pruebas de razn de verosimilitud generalizada

1


*

tm *
n
2,1
 2 tm n
2,1
 2
Figura 3.12 Grfica de una t n m
2 tales que
t n*m
2,1
 2  1
  t n*m
2,1
 2 del ejemplo 3.19

Fuente: Elaboracin propia.


Por lo tanto, t n*m
2,1
 2  k (n  m
2) y si se quiere la prueba en base a k  se tiene

t n* m
2,1

k 
2

nm
2
Por lo que se concluye
*1, si z  k 
 (x, y )  )
(0, si z k 
EJEMPLO 3.20
En las condiciones del ejemplo anterior, sean X 1 , X 2 , , X n una muestra aleatoria N ( 1 ,  2 ) y sean
Y1 , Y2 ,, Ym una muestra aleatoria N ( 2 ,  2 ) . Qu pasa, cuando se quiere probar la siguiente
hiptesis?
H 0 : 1   2 ,  2  0 H 0 : 1
 2  0

H 1 : 1  2 ,   0
2
H 1 : 1
 2 0
Solucin
En este caso ( H1 : 1
2 0 ) es razonable plantear una pregunta de una cola, basada en T de la forma
 (x)  1 si T c , entonces se tiene c tal que
  P{ ( X)  1 | 1   2 }
 P{T c | 1   2 }
 FT (c )
Luego, T ~ t nm
2 & c  t nm
2, .

116
Pruebas de razn de verosimilitud generalizada

EJEMPLO 3.21
Sean las muestras independientes X 1 , X 2 , , X n una muestra aleatoria N ( 1 ,  12 ) y sean
Y1 , Y2 ,, Ym una muestra aleatoria N (1 ,  22 ) . Se desea probar
H 0 :  12   22 , 1 ,  2  R
H 1 :  12   22 , 1 ,  2  R
Solucin
Paso 1. Se identifica a  y  y se obtiene la funcin de verosimilitud. Se tiene que
  R 2 ' R 2 y   {( 12 ,  22 ) :  12   22 } : R 2 .
En este caso, hay cuatro parmetros  1 ,  2 , 1 ,  2 de tal forma que la funcin de verosimilitud es
LX,Y ( 1 ,  2 ,  12 ,  22 )  f X (x; 1 ,  12 ) f Y (y;  2 ,  22 )
n m
n 2 1 m 2 1
# 1
8 ( xi
1 ) 2 # 1
8 ( yi
 2 ) 2
!  e 2 12 i 1
%!  e 2 22 i 1
! 2? 2  ! 2? 2 
" 1  " 2 

Paso 2. Se obtienen los estimadores de mxima verosimilitud, bajo todo   R 2 ' R 2 , se puede ver
como en el ejemplo19 que:
1 n 1 m
 1  x ,  2  y ,  12  8
n i 1
( xi
x ) 2 y  22  8 ( y j
y ) 2 .
m j 1
Paso 3. Se obtienen los estimadores de mxima verosimilitud, bajo todo
  {( 1 ,  2 ) :  1   2 } : R .
2 2 2 2 2

Note que bajo H 0 cada vez que se calcula la funcin de mxima verosimilitud, bajo H 0 es como si se
tuviera otro problema. Adems en este caso se puede apreciar que bajo H 0 : ( 12   22 ) se est en el
caso del ejemplo 3.19, en donde se obtuvo que ~1  x; ~2  y

1 *n m 0
~ 2  )8 ( xi
x )  8 ( y j
y ) /
2 2

n  m ( i 1 j 1 .
Paso 4. La razn de verosimilitudes. Con estos estimadores de mxima verosimilitud, se puede calcular
la razn
L ( ~ , ~ , ~ 2 , ~ 2 )
 (x, y )  X,Y 1 2 12 22 .
LX,Y (  1 ,  2 ,  1 ,  2 )
Con la sustitucin de los estimadores y simplificando se obtiene
( n m) 2
* nm 0
) /
( 2? ( z1  z 2 ) .
 (x, y )  n 2 m 2
.
# n # m
!  ! 
! 2?z  ! 2?z 
" 1  " 2 

Donde
n m
z1  8 ( xi
x ) 2 ; z 2  8 ( y j
y ) 2 .
i 1 I 1

117
Pruebas de razn de verosimilitud generalizada

Z1 Z2
Se observa que bajo H 0 , ~ n2
1 y ~ m2
1 y adems son independientes.
 2
2
Note que en las expresiones anteriores se tiene Z1  2 y Z 2  2 en lugar de Z1  12 y Z1  22
puesto que bajo se tiene el caso H 0 :  12   22   2 .
Paso 5. Determinar la constante crtica.
Defnase la estadstica

F
Z 1  2  n
1 Z1 (n
1)

Z2  2  m
1 Z 2 (m
1)
~ Fn
1,m
1

Despus de hacer algunas operaciones, se puede llevar a  a la siguiente forma:


( m  n) ( m  n ) 2 ((n
1) (m
1) F ) n 2
 (x, y )  %  g (F ) .
mm 2nn 2 (1  (n
1) (m
1) F ) ( m n ) 2

Se puede proseguir con identificar la distribucin de F, pero si se utiliza a la funcin g (F ) y se


analiza, se tiene que:
 (x, y)  1 , si g ( F ) k
Si g (F ) fuese montona, se podra utilizar el resultado sobre familias montonas, pero g (F )
no es montona. Pero es de la forma que se han estado trabajando la razn de verosimilitudes
montona, para el caso de dos colas.

Figura 3.13 Grfica de la funcin g (F ) donde g (a)  g (b)  k del ejemplo 3.21
Fuente: Elaboracin propia.

Entonces, note que  (x, y) k es equivalente a que F a F  b donde g (a)  g (b) y la


prueba es de tamao  . Por lo tanto, a y b deben ser tales que g (a)  g (b) y adems
  max
2 2
P{F a o F  b | 1 ,  2 ,  12 ,  22 } , falta encontrar a y b que satisfagan lo anterior, para
1  2

simplificar el mximo, se observa que F no depende de 1 ni de  2 ,  12 ,  22 , luego


  P{F a F  b |  12   22 } . As, resulta el sistema en las incgnitas a y b

*  P{F a F  b |  12   22 }  1
P{a  F  b |  12   22 }
)
( g (b)
g (a)
118
Pruebas de razn de verosimilitud generalizada

* FF (b)
FF (a)  1

)
( g (b)
g (a)  0
Donde FF es la funcin de distribucin de la distribucin Fn
1,m
1 . Resolviendo el sistema
anterior, se obtienen las constantes crticas.
Por lo tanto
*1, si F a F  b
 (x, y )  )
(0, si a F b
F estima a la razn  12  22 . Cuando  12  22 est prximo a 1, no se debe rechazar H 0 .

NOTA
En los libros de inferencia que son metdicos, en realidad no se encuentran a y b que
cumplan el sistema anterior, es decir, se est resolviendo en forma aproximada,
considerando que las colas izquierda y derecha son iguales a a 2 .
En la prctica a  Fn
1,m
1, 2 y b  Fn
1,m
1,1
 2 ; 1
  P(a F b)  FF (b)
FF (a) , pero
estos no son los valores que se obtienen en la razn generalizada.

 2
 2

Figura 3.14 Grfica de la funcin 1


  P(a F b) del ejemplo 3.22
Fuente: Elaboracin propia.
Est abierta la pregunta sobre:
Las pruebas utilizadas en metodologa y en la razn de verosimilitud generalizada tienen
la misma potencia?

EJEMPLO 3.22
Sean las muestras independientes X 1 , X 2 , , X n una muestra aleatoria N ( 1 ,  12 ) y sean
Y1 , Y2 ,, Ym una muestra aleatoria N (  2 ,  22 ) .
Se desea probar
H 0 :  12   22 , 1 ,  2 H 0 :  12  22  1

H 1 :  12  22 , 1 ,  2 H 1 :  12  22 1
prueba de una cola (cola izquierda).
Solucin

119
Pruebas de razn de verosimilitud generalizada

En este caso se considera una prueba de una cola, esto es


-1 si F  Fn
1,m
1,1

*
 (x, y )  )
(0 si F Fn
1,m
1,1

-
Similarmente, si la prueba es de cola derecha.

120
Captulo 4
Pruebas de hiptesis para los parmetros de una
distribucin normal

Introduccin

E
n captulos anteriores se revisaron los mtodos para llevar a cabo las pruebas de hiptesis,
sus metodologas y algunos casos particulares que se presentan al momento de contrastar un
juego de hiptesis dado.
As, en el primer captulo se exponen los conceptos bsicos para la construccin de
hiptesis estadsticas; en el segundo, por medio del lema de Neyman-Pearson, se abordan dichas
hiptesis utilizando la metodologa de las pruebas de razn de verosimilitud simple y en el tercer
captulo se habl de las pruebas de razn de verosimilitud generalizada.
En el campo de las distribuciones; la distribucin normal ocupa un lugar muy especial, ya que
gracias al teorema de lmite central, prcticamente cualquier distribucin (bajo ciertas restricciones),
con un tamao de muestras grande se aproxima a la distribucin normal. En este contexto, en el
presente captulo se ver la parte metodolgica de las pruebas de hiptesis para los parmetros de esta
distribucin, es decir, su media y su varianza.
Se abordar el estudio de poblaciones con distribucin normal o aproximadamente normal, por
ejemplo las distribuciones tipo Bernoulli o binomial, de la siguiente manera. Dada una realizacin de la
muestra aleatoria con la que se est trabajando, se utilizarn los resultados vistos en los captulos
anteriores, por ejemplo, las pruebas MP(), UMP() y UMPI(), para obtener las reglas de decisin
para el juego de hiptesis con el que se est trabajando.
4.1 METODOLOGA PARA PROBAR UNA HIPTESIS ESTADSTICA
Para las pruebas de hiptesis que se realizarn en las siguientes secciones se recomienda seguir los
siguientes pasos.
i) Establecer la hiptesis nula y la hiptesis alterna. Las hiptesis nula y alterna se establecen
con base en las reglas mencionadas en el captulo anterior.
ii) Fijar el nivel de significancia,  , lo propone el investigador.
iii) Con el valor de  realizar los clculos para determinar los cuantiles correspondientes, su
estadstica de prueba (EP) y la constante crtica (CC) que se requieren en la regla de decisin
dada en la frmula segn la metodologa del caso a tratar.
iv) Aplicar la regla de decisin de la metodologa, calculando el valor de la estadstica de prueba
para la realizacin dada y decidir si se rechaza o no la hiptesis nula.

121
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Los resultados de las pruebas que se establezcan en las metodologas que se revisarn estn dadas
para el caso compuesta contra compuesta, se pueden usar para las situaciones restantes: simple contra
simple, simple contra compuesta o compuesta contra simple. Adems, aunque ya no se
mencionar, las frmulas que utilicen la distribucin normal se pueden aplicar a poblaciones que no
sean normales, pero slo con muestras grandes.
4.2 PRUEBAS DE HIPTESIS PARA MEDIAS
Hasta el momento se ha revisado que una de las principales distribuciones en el comportamiento de las
poblaciones se refiere a la normal y que sta tiene dos parmetros, la media (  ) y la varianza (  2 ).
Por tal razn, el desarrollo metodolgico para las pruebas de hiptesis iniciar con el parmetro media,
sobre el que se analizarn dos situaciones. En este momento cabe aclarar que la aplicacin de los casos
que se analizarn, se restringen a poblaciones normales o aproximadamente normales.
4.2.1 PRUEBAS DE HIPTESIS PARA LA MEDIA DE POBLACIONES APROXIMADAMENTE
NORMALES CUANDO SE CONOCE 
TEOREMA 4.1
Sea X 1 , X 2 , , X n una muestra aleatoria de N ( ,  02 ) entonces se pueden tener alguno de los
siguientes contraste de hiptesis
a) H 0 :    0 contra H 1 :   0 , entonces la prueba UMP(), para   (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x 2 , , xn
0 0
Rechazar H 0 :    0 , si x  0  $
1 ( ) x  0
Z .
n n
# 2 X
0 
EP: X ~ N !!  , 0  Z  ~ N (0, 1) y CC:  0  0 $
1 ( )
" n  0 n n
b) H 0 :    0 contraH 1 :    0 , entonces la prueba UMP(), para   (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x2 , , xn
0 0
Rechazar H 0 :    0 , si x   0  $
1 (1
 ) x   0  Z .
n n
# 2 X
0 
EP: X ~ N !!  , 0  Z  ~ N (0, 1) y CC:  0  0 $
1 (1
 )
" n  0 n n
c) H 0 :  0    1 contra H 1 :   0 o   1 entonces la prueba UMPI(), para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn :
0 0
Rechazar H 0 :  0    1 , si x  0  $
1 ( 2)   0
Z 2
n n
0 0
x  1  $
1 (1
 2)  1  Z 2 .
n n
# 2  #  # 
EP: X ~ N !!  , 0  y CC:  0  0 $
1 !  y 1  0 $
1 !1

" n  n "2 n " 2

122
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Con  0 , 1  R y  02  0 valores conocidos de antemano. En donde, $


1 (H ) representa el cuantil
H de la distribucin normal estndar para H  (0, 1) , Z H representa el valor de la variable
normal estndar cuya rea a la derecha es H  (0, 1) .

EJEMPLO 4.1
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de 9 piezas cuyos
dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 milmetros. Supngase que los dimetros
tienen una distribucin aproximadamente normal con una varianza de 0.64 milmetros 2. Si el
fabricante de dichas piezas afirma que el dimetro promedio de stas es de 10 milmetros.
a) Plantee el contraste de hiptesis adecuado al problema.
b) Aplique la metodologa indicada en el Teorema 4.1 y, determine la prueba UMPI() para   0.01.
c) Qu puede usted decir con respecto a la afirmacin del fabricante con un nivel de significancia de
0.01?
d) Si el valor de   10.5 milmetros calcule la potencia de la prueba con la regla de decisin (b).
Despus de calcular la potencia de la prueba cambiara su impresin de la afirmacin sobre la
prueba.
Solucin
a) Se pide una prueba de hiptesis para la media, en donde se desea probar que la media de las piezas
metlicas es igual a 10 milmetros (espacio paramtrico cerrado), H 0 :   10 . Luego, la hiptesis
alterna ser el opuesto, es decir diferente de 10, H 1 :   10 .
b) Siguiendo los pasos para una prueba de hiptesis.
i) H 0 :   10 contra H 1 :   10 .
ii) Nivel de significancia   0.01.
iii) Se est ante una situacin como la del inciso c del Teorema 4.1, con 1   0 . Luego, se
 
requiere calcular la CC:  0  0 $
1 ( 2) y  0  0 $
1 (1
 2) . As, de las tablas
n n
porcentuales para la distribucin normal estndar, $
1 (0.01 2)  $
1 (0.5%) 
2.5758, y
$
1 (1
0.01 2)  $
1 (99.5%)  2.5758. Por otro lado,  0  0.64  0.80 , n  9 y  0  10 .
Finalmente, la regla de decisin.
0 0.80
Rechazar: H 0 :   10 , si x  0  $
1 ( 2)  10
(2.5758)  9.31
n 9
0 0.80
x  0  $
1 (1
 2)  10  (2.5758)  10.69 .
n 9
Es decir, rechazar H 0 :   10 si x 9.31 x  10.69 . Grficamente se tiene:

regin de rechazo Rr regin de rechazo Rr


9.31 regin de no rechazo Ra 10.69
Figura 4.1. Regin de no rechazo y rechazo para el ejemplo 4.1
Fuente: Elaboracin propia

123
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de
prueba segn la realizacin, obteniendo x  10.12 y, con esto se concluye que H 0 :   10 no
se rechaza al 1% de significancia.
c) Al 1% de significancia se puede concluir, que con la realizacin obtenida no existen evidencias para
rechazar la hiptesis nula.
d) Para calcular la potencia de la prueba se utiliza la regin de rechazo
# 9.31
10.50 10.69
10.50 
PRechazar H 0 |   10  PX 9.31 X  10.69 |   10.5  P! Z Z
! 0.80 9 
" 0.80 9
 PZ
4.46  P Z  0.71  0.2389
Aunque la prueba es la UMPI(0.01), en el caso de que la verdadera media sea 10.5, la potencia
es baja y la prueba no es muy adecuada. Luego, surgen las preguntas
Se puede aumentar la potencia?, en caso afirmativo cmo aumentar la potencia?
Resulta que, en cualquier situacin la potencia puede aumentarse de varias formas; una
aumentando el nivel de significancia y la otra aumentando la informacin, ya que mientras ms
informacin se tiene de un problema la incertidumbre disminuye.
EJEMPLO 4.2
En el ejemplo anterior aumente la potencia de la prueba
a) Con un nivel de significancia del 10%.
b) Agregando informacin: 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1, 11.2, 10.4, 9.8, 10, 10.2, 9.7, 9.9,
10.1, 10.2, 10.1, 9.5, 9.9, 9.9, 10.5, 10.7, 10.1 y 10.2 milmetros.
Solucin
Del ejemplo anterior ya se tienen planteadas las hiptesis, slo se deben agregar los cambios en los
clculos.
a) En este caso al aumentar el nivel de significancia los clculos sern:
i) H 0 :   10 contra H 1 :   10 .
ii) Nivel de significancia   0.10 .
0 0
iii) Se requiere calcular la CC:  0  $
1 ( 2) y  0  $
1 (1
 2) . As, de las tablas
n n
porcentuales para la distribucin normal estndar, $ (0.10 2)  $
1 (5%) 
1.6449, y

1

$
1 (95%)  1.6449 . Por otro lado,  0  0.64  0.80 , n  9 y  0  10 . Finalmente, la regla
de decisin.
0.80 0.80
Rechazar: H 0 :   10 , si x 10
(1.6449)  9.561 x  10  (1.6449)  10.439 .
9 9
Es decir, rechazar H 0 :   10 si x 9.561 o x  10.439 . Grficamente se tiene:
regin de rechazo Rr regin de rechazo Rr
9.561 regin de no rechazo Ra 10.439
Figura 4.2. Regin de no rechazo y rechazo para el ejemplo 4.2
Fuente: Elaboracin propia

124
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de prueba
correspondiente a la realizacin, obteniendo x  10.12 , y con lo cual se concluye que
H 0 :   10 no se rechaza al 1% de significancia.
La potencia en estas condiciones sera:
# 9.561
10.5 10.439
10.5 
PRechazar H 0 |   10  PX 9.561 X  10.439 |   10.5  P! Z Z
! 0.80 9 
" 0.80 9
 PZ
3.52  P Z 
0.23  0.5912
b) Ahora se aumenta informacin y, los clculos sern:
i) H 0 :   10 contra H 1 :   10 .
ii) Nivel de significancia   0.01.
iii) En el ejemplo anterior se encontr $
1 (0.01 2) 
2.5758, y $
1 (99.5%)  2.5758. Por otro
lado,  0  0.64  0.80 , n  25 y  0  10 . Finalmente, la regla de decisin.
0.80 0.80
Rechazar: H 0 :   10 , si x  10
(2.5758)  9.59 x  10  (2.5758)  10.41 .
25 25
Es decir, rechazar H 0 :   10 si x 9.59 o x  10.41. Grficamente se tiene:
regin de rechazo Rr regin de rechazo Rr
9.59 regin de no rechazo Ra 10.41
Figura 4.3. Regin de no rechazo y rechazo para el ejemplo 4.2
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto se calcula el valor de la estadstica de prueba
correspondiente a la realizacin, obteniendo x  10.09 y, con lo cual se concluye que
H 0 :   10 no se rechaza al 1% de significancia.
Para calcular la potencia de la prueba se utiliza la regin de rechazo
# 9.59
10.5 # 10.41
10.5
PRechazar H 0 |   10  PX 9.59 X  10.41 |   10.5  P!! Z   P!! Z  
" 0.80 5  " 0.80 5 
 PZ
5.69  P Z 
0.56  0.7123
As, se ha comprobado que la potencia de la prueba se puede incrementar: aumentando el nivel
de significancia o aumentando la informacin.
EJEMPLO 4.3
Los encargados de un centro de atencin ciudadana en donde se encuentra localizada una mquina de
refrescos ha estado recibiendo constantemente quejas por parte de los usuarios de la mquina indicando
que despacha menos lquido que el estipulado en las instrucciones (2.40 decilitros de refresco en
promedio). Ellos deciden cambiar la mquina si al revisar una muestra aleatoria y llevar a cabo una
prueba de hiptesis al 5% de significancia se decide estadsticamente que es valida la afirmacin de los
usuarios. Suponiendo que la cantidad de lquido despachada por la mquina tiene una distribucin
aproximadamente normal con una desviacin estndar igual a 0.15 decilitros,
a) Plantee un contraste de hiptesis adecuado para el problema y lleve a cabo la prueba si una muestra
aleatoria de 36 refrescos arroja un contenido promedio de 2.25 decilitros.
b) Calcule la potencia de la prueba, suponiendo que   2.3 0 decilitros.

125
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

c) Explique cmo apoya el resultado obtenido estadsticamente a una toma de decisiones sobre el
retiro o no de la mquina.

Solucin
a) Se pide una prueba de hiptesis para la media, en donde los usuarios afirman que la mquina
despacha menos de 2.40 decilitros en promedio, luego el signo de igualdad se encuentra en la
afirmacin del fabricante. As, se tendr lo siguiente.
i) H 0 :   2.40 contra H 1 :  2.40 .
ii) Nivel de significancia   0.05 .
iii)Se est ante una situacin similar a la del inciso a del Teorema 4.1, pero con la hiptesis nula
simple, pero se mencion al inicio que se puede aplicar la misma regla de decisin. Luego, se

requiere calcular la CC:  0  0 $
1 ( ) . As, de las tablas porcentuales para la distribucin
n
normal estndar, $ (0.05)  $
1 (5%) 
1.6449. Por otro lado,  0  0.15 , n  36 y

1

 0  2.40 . Finalmente, la regla de decisin.


0 0.15
Rechazar: H 0 :   2.40 , si x  0  $
1 ( )  2.40
(1.6449)  2.359 .
n 36
Es decir, rechazar H 0 :   2.40 si x 2.359 . Grficamente se tiene:

regin de rechazo Rr

2.359 regin de no rechazo Ra


Figura 4.4. Regin de no rechazo y rechazo para el ejemplo 4.3
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, recordando que x  2.25 Rr . As, se concluye que
H 0 :   2.40 se rechaza al 5% de significancia.
Por lo tanto, al 5% de significancia y la realizacin obtenida no existen evidencias para refutar la
afirmacin de los clientes de que  2.40 .
b) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
 
PRechazar H 0 |  2.40  P X 2.359 |   2.30  P! Z
!
2.359
2.30 

 PZ 2.36  0.991 .
" 0.15 36 
Si la verdadera media fuera 2.30decilitros la prueba tendra una potencia muy elevada.
c) El resultado ayuda estadsticamente a tomar la decisin de retirar la mquina despachadora de
refresco, ya que a un nivel de significancia razonablemente bajo (5%), se rechaza la hiptesis nula, que
concuerda con la afirmacin del fabricante, en apoyo de la hiptesis del consumidor. Adems, la
potencia de la prueba es bastante elevada y de teora se sabe que esta prueba es la UMP(0.05), es decir,
en estas condiciones no existe otra prueba ms potente.
Cmo realizar una prueba de hiptesis cuando se tiene una tabla de frecuencias?

126
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

EJEMPLO 4.4
Una mquina de refrescos est ajustada de tal manera que la cantidad de lquido despachado se
distribuye aproximadamente normal con una desviacin estndar de 15 mililitros. Se elige una muestra
de tamao 60, y un trabajador registra el lquido despachado por clases de frecuencia, resultando

Intervalos de clase Frecuencias ( n i )


[239, 241) 4
[241, 243) 10
[243, 245) 20
[245, 247) 11
[247, 249) 12
[249, 251] 3
Tabla 4.1 Intervalos de clase y frecuencia de una m.a. para el problema 4.4
El fabricante afirma que la mquina despacha en promedio 240 mililitros. A un nivel de
significancia del 5% pruebe si es valida la afirmacin del fabricante.
Solucin
Para la solucin se siguen los mismos pasos que para datos no agrupados, slo cambian las frmulas
para calcular los valores muestrales requeridos, en este caso se est refiriendo al promedio.
1 m m 1 6 m
Calculando la media por clases de frecuencias, x f  8
n i 1
x i ni  8 x i ni .
60 i 1
Las marcas de clase, se obtienen de la tabla anterior: 240, 242, 244, 246, 248 y 250. As,
1
xf  (240 : 4  242 : 10  244 : 20  246 : 11  248 : 12  250 : 3)  244.8667 .
60
Para el planteamiento del contraste de hiptesis se nota que la afirmacin del fabricante se
refiere a una igualdad de media   240, el conjunto paramtrico es cerrado, luego la hiptesis nula
ser   240.
Siguiendo los pasos de la metodologa para pruebas de hiptesis.
i H 0 :   240 contra H 1 :   240 .
ii Nivel de significancia   0.05 .
iii Se est ante una situacin como la del inciso c del Teorema 4.1. Es decir, se requiere calcular la
 
CC:  0  0 $
1 ( 2) y  0  0 $
1 (1
 2) . De las tablas porcentuales para la
n n
distribucin normal estndar, $ (0.025) 
1.96 y $
1 (1
0.02)  1.96 . Por otro lado,

1

 0  15 ,  0  1  240 . Finalmente, la regla de decisin.


0 15
Rechazar: H 0 :   240 , si x f  0  $
1 ( 2)  240
(1.96)  236.20 o
n 60
0 15
x f  0  $
1 ( 2)  240  (1.96)  243.80 .
n 60

127
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Es decir, rechazar H 0 :   240 si x f 236.20 o x f  243.80 . Grficamente se tiene:


regin de rechazo Rr regin de rechazo Rr
236.2 regin de no rechazo Ra 243.8
Figura 4.5. Regin de no rechazo y rechazo para el ejemplo 4.4
Fuente: Elaboracin propia
iv Por ltimo se aplica la regla de decisin, recordando que x f  244.87 . As, se concluye
que al 5% de significancia hay evidencias para rechazar H 0 :   240 .
4.2.2 PRUEBAS DE HIPTESIS PARA LA MEDIA DE POBLACIONES APROXIMADAMENTE
NORMALES CUANDO SE DESCONOCE 
TEOREMA 4.2

Sea X 1 , X 2 , , X n una muestra aleatoria de N ( ,  2 ) entonces se pueden tener alguno de los


siguientes contraste de hiptesis
a) H 0 :    0 contra H 1 :   0 , entonces la prueba UMP(), para   (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x2 , , xn
s n
1 s n
1
Rechazar H 0 :    0 , si x  0  Ftn

11 ( ) x  0
t (n
1) .
n n
# 2 X
0 s
EP: X ~ N !!  ,  T
 ~ t n
1 y CC:  0  n
1 Ftn

11 ( )
" n  S n
1 n n
b) H 0 :    0 contra H 1 :    0 , entonces la prueba UMP(), para   (0, 1) estar dada por la
siguiente regla de decisin para una realizacin x1 , x2 , , xn
s n
1 s n
1
Rechazar H 0 :    0 , si x   0  Ftn

11 (1
 ) x  0  t (n
1) .
n n
# 2 X
0 s
EP: X ~ N !!  ,  T
 ~ t n
1 y CC:  0  n
1 Ftn

11 (1
 )
" n  S n
1 n n
c) H 0 :  0    1 contraH 1 :   0 o   1 entonces la prueba UMPI(), para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn :
s n
1 s n
1
Rechazar H 0 : 0    1 , si x  0  Ftn

11 ( 2)   0
t 2 (n
1) o
n n
s n
1 s n
1
x  1  Ftn

11 (1
 2)  1  t 2 (n
1)
n n
# 2  
 y CC:  0  n
1 Ft
1 #!  y 1  n
1 Ft
1 #!1

s s
EP: X ~ N !!  ,  n
1 n
1
" n  n "2 n " 2

Con  0 , 1  R valores conocidos de antemano. En donde, Ftn

11 (H ) representa el cuantil H de la
distribucin t-student con n
1 grados de libertad para H  (0, 1) , t H representa el valor de la
variable t-student con n
1 grados de libertad cuya rea derecha es H  (0, 1) .

128
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

EJEMPLO 4.5
El gerente de ventas de una empresa productora de focos en su reunin con los representantes de
diferentes centros comerciales, afirma que su producto tiene una duracin mayor a 800 horas. Los
representantes de los centros comerciales antes de realizar la compra deciden comprobar
estadsticamente la afirmacin del fabricante. Ellos eligieron una muestra de tamao 26 y obtuvieron
un tiempo de vida promedio de x  810 horas con una desviacin estndar muestral de 45 horas.
a) Plantee un contraste de hiptesis adecuado para el problema, con un nivel de significancia del 5% y
suponiendo normalidad en el tiempo de vida de los focos justifique si es o no valida la afirmacin
de los fabricantes de focos.
b) Calcule la potencia de la prueba, suponiendo que   820 horas.
c) Explique como apoya el resultado obtenido estadsticamente a una toma de decisiones a los
representantes de los centros comerciales sobre la afirmacin del fabricante de focos.
Solucin
a) Para plantear el contraste de hiptesis se toma en cuenta que la afirmacin del fabricante es
  800 horas y no es un conjunto cerrado. Luego,
i) H 0 :   800 contra H1 :   800 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin como la del inciso b del Teorema 4.2. Es decir, se requiere calcular la
s n
1
CC:  0  Ftn

11 (1
 ) . As, de las tablas porcentuales para la distribucin t-student con
n

1
n
1  26
1  25 grados de libertad, Ft25 (1
0.05)  1.708 . Por otro lado, s n
1  45 y
 0  800 . Finalmente, la regla de decisin.
s n
1 45
Rechazar: H 0 :   800 , si x   0  Ftn

11 (1
 )  800  (1.708)  815.1 .
n 26
Es decir, rechazar H 0 :   800 si x  815.1 . Grficamente se tiene:

regin de rechazo Rr
regin de no rechazo Ra 815.1
Figura 4.6. Regin de no rechazo y rechazo para el ejemplo 4.5
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x  810 815.1 , y con lo
cual se concluye que al 5% de significancia y la realizacin tomada no hay evidencias para
rechazar H 0 :   800 .
As, se concluye que al 5% de significancia y la realizacin obtenida no es valida la afirmacin
del fabricante de que   800 .
b) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#

PRechazar H 0 |   800  P X  815.1 |   820  P! T 
!

815.1
820 
 PT 
0.5552  0.7082.
" 45 26 
c) El resultado ayuda estadsticamente a tomar la decisin sobre las compra de focos, en este caso los
compradores deberan tomar la decisin de no comprar los focos o tomar varias realizaciones ms

129
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

para corroborar su toma de decisiones. Adems, de la teora se sabe que esta prueba es la
UMP(0.05), es decir, en estas condiciones no existe otra prueba ms potente.

NOTA
1.- Para calcular el valor de la probabilidad se puede utilizar cualquier paquete estadstico,
por ejemplo, Excel. En la pestaa de funcin escribir: =1-DISTR.T(0.552,25,1) . 0.5552 es
el valor de la variable con el que se va a calcular la probabilidad a la derecha (slo valores
positivos), 25 son los grados de libertad y 1 se refiere a una cola.
2.- En el paquete R y la simetra de la distribucin T, P(T 
0.5552)  P(T 0.5552) ,
luego la funcin de probabilidad acumulada para la distribucin T, pt(0.5552, 25), da
como resultado 0.7082.
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 0.5552, obteniendo con 25 grados de libertad P(T  0.6844)  0.25 y
P(T  0.5312)  0.30 , se interpola P(T  0.5552) , obteniendo P(T  0.5552) 9 0.2922 .
Finalmente, P(T 
0.5552)  P(T 0.5552) 9 0.7078 valor muy prximo al encontrado
directamente con los paquetes, 0.7082 (4 diez milsimas de diferencia).

EJEMPLO 4.6
Los fabricantes de mquinas despachadoras de bebida afirman que sus mquinas despachan entre
225, 245, mililitros de bebida. Para probar tal afirmacin los consumidores toman una muestra
aleatoria de 30 servicios de la mquina de bebidas obteniendo un contenido promedio de 229 mililitros,
con una desviacin estndar de 25 mililitros. Suponiendo normalidad en la cantidad de lquido
despachada por la mquina y con base en una prueba estadstica al nivel de significancia del 0.04
a) Plantee un contraste adecuado de hiptesis para el problema y justifique si es o no valida la
afirmacin de los fabricantes de mquinas despachadoras de bebida.
b) Explique como apoya el resultado obtenido estadsticamente a una toma de decisiones sobre la
afirmacin del fabricante de estas mquinas.
Solucin
a) Para el planteamiento del contraste de hiptesis se nota que la afirmacin del fabricante es que
  225, 245, , pero por otro lado, en la regla que se dio en la seccin 4.1 para formular los
contrastes de hiptesis se tiene que el conjunto paramtrico 225, 245, es cerrado en ambos
extremos, luego la hiptesis nula ser 225    245 . As, se tendrn los pasos para la prueba:
i H 0 : 225    245 contra H1 :  225 I   245 .
ii Nivel de significancia   0.04 .
iii Se est ante una situacin como la del inciso c del Teorema 4.2. Es decir, se requiere calcular
s n
1 s n
1
la CC:  0  Ftn

11 ( 2) y 1  Ftn

11 (1
 2) . As, de tablas de la distribucin t-student
n n

1
1
con n
1  30
1  29 grados de libertad, Ft29 (0.02) 
2.150 y Ft29 (1
0.02)  2.150 . Por otro
lado, s n
1  25 ,  0  225 y 1  245 . Finalmente, la regla de decisin.

130
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

s n
1 25
Rechazar: H 0 : 225    245 , si x  0  Ftn

11 ( 2)  225
(2.150)  215.2 o
n 30
s n
1 25
x  1  Ftn

11 (1
 2)  245  (2.150)  254.8 .
n 30
Es decir, rechazar H 0 : 225    245 si x 215.2 o x  254.8 . Grficamente se tiene:

regin de rechazo Rr regin de rechazo Rr


215.2 regin de no rechazo Ra 254.8
Figura 4.7. Regin de no rechazo y rechazo para el ejemplo 4.6
Fuente: Elaboracin propia
Por ltimo se aplica la regla de decisin, recordando que x  229 215.2, 254.8, , y con lo cual
se concluye que al 4% de significancia y la realizacin tomada no hay evidencias para rechazar
H 0 : 225    245 .
b) El resultado ayuda estadsticamente a tomar la decisin sobre la validez de la afirmacin del
fabricante, ya que con un nivel de significancia del 4% y la realizacin elegida se puede concluir
que no existe evidencias para refutar la afirmacin del fabricante. Adems, de la teora se sabe que
esta prueba es la UMPI(0.04), es decir, en estas condiciones no existe otra prueba ms potente.
Como se puede apreciar el uso del Teorema 4.2, est limitado a las tablas de la distribucin t-
student. En general dichas tablas estn elaboradas para valores de n  30 , por consiguiente surge la
pregunta
Qu hacer cuando se desconoce  y el tamao de la muestra es mayor a 30 ?
Se puede aproximar la distribucin t-student con la distribucin normal para grados de libertad
grandes si no se cuenta con tablas de la distribucin t- student.
EJEMPLO 4.7
De acuerdo con las normas establecidas para un examen de aptitud mecnica, las personas de 18 aos
deberan promediar al menos 73.2. Si 45 personas de esa edad elegidas aleatoriamente promediaron
66.7 con desviacin estndar de 8.6, pruebe el contraste de hiptesis para la media poblacional
H 0 :   73.2 contra H 1 :  73.2
Encontrando la prueba UMP(0.05). Suponga normalidad en las calificaciones de los exmenes.
a) Usando una aproximacin de la distribucin t-student con la normal (grados de libertad 44).
b) Usando un paquete estadstico para el valor del cuantil de la distribucin t.
c) Usando la interpolacin de los valores de las tablas de la distribucin t.
Solucin
a) Los grados de libertad son 44 mayores a 30 se utilizar una aproximacin de la distribucin t-
student por la normal.
i) H 0 :   73.2 contra H1 :  73.2 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin como la del inciso (a) del Teorema 4.2, pero con grados de libertad
mayores a 30, luego se utilizar una aproximacin con la normal. Es decir, se requiere calcular

131
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

s n
1
la CC:  0  $
1 ( ) . As, de las tablas porcentuales para la distribucin normal
n
$
1 (0.05) 
1.6449 . Por otro lado, s n
1  8.6 y  0  73.2 . Finalmente, la regla de decisin.
s n
1 8.6
Rechazar: H 0 :   73.2 , si x  0  $
1 ( )  73.2
(1.6449)  71.09 .
n 45
Es decir, rechazar H 0 :   73.2 si x 71.09 . Grficamente se tiene:
regin de no rechazo Ra
regin de rechazo Rr 71.09
Figura 4.8. Regin de no rechazo y rechazo para el ejemplo 4.7
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, recordando que x  66.7 71.09 . As se concluye al 5%
de significancia y la realizacin tomada que hay evidencias para rechazar H 0 :   73.2 .
b) Los pasos i) y ii) son iguales al inciso (a), slo cambiar el inciso iii), ya que en lugar de

1
$
1 (0.05) 
1.6449 , se utiliza Ft44 (0.05) 
1.6802 . De tal forma que la regla de decisin es:
s n
1
1 8.6
Rechazar: H 0 :   73.2 , si x  0  Ft44 (0.05)  73.2
(1.6802)  71.05 .
n 45
Es decir, rechazar H 0 :   73.2 si x 71.05 , diferente del inciso a slo en 4 centsimas, la
conclusin no cambiar.

1
c) Aqu en lugar de utilizar $
1 (0.05) 
1.6449 o Ft44 (0.05) 
1.6802 se emplea una interpolacin,

1
1
para Ft44 (0.05) con sus valores ms prximos de tablas; Ft40 (0.05) 
1.684 y

1
1
Ft50 (0.05) 
1.676 . Obteniendo Ft44 (0.05) 9
1.6808, valor que se diferencia del encontrado con
el paquete en slo 6 diez milsimas, y la conclusin no cambiar

NOTA
Con este ejemplo se ha mostrado que cuando se trate de pruebas de hiptesis para la media
en donde no se conozca la varianza muestral, pero el tamao de muestra sea grande se puede
utilizar la aproximacin por la normal.

4.3 PRUEBAS PARA LA DIFERENCIA DE MEDIAS DE POBLACIONES NORMALES


El problema de la prueba de hiptesis para la diferencia de medias tiene las mismas ideas en su
aplicacin que los intervalos de confianza y se pueden utilizar para hacer afirmaciones sobre la
superioridad de algn producto sobre otro, la menor o mayor duracin de un proceso, etc.
El problema se puede plantear de la siguiente forma: Sean dos poblaciones independientes con
distribucin normal, N (1 ,  12 ) y N ( 2 ,  22 ) , que representan el comportamiento de dos fenmenos
de inters que se desea comparar. Por ejemplo, el aprovechamiento de un grupo en dos materias
diferentes, la produccin de leche por vacas de dos establos diferentes, la duracin de refrigeradores
similares de dos marcas diferentes, etctera y se desea conocer si existe igualdad en sus medias.
Originalmente el problema se planteo para la afirmacin de que son iguales
H 0 : 1   2 contra H 1 : 1   2
Luego, se generaliz para afirmaciones en donde una media es mejor que la otra
132
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

H 0 : 1   2 contra H 1 : 1   2 H 0 : 1   2 contra H 1 : 1  2 .
As, fcilmente se puede observar que el problema se puede generalizar an ms
H 0 : 1
 2  d 0 contra H 1 : 1
 2  d 0 ;
H 0 : 1
 2  d 0 contra H 1 : 1
 2  d 0 ;
H 0 : 1
 2  d 0 contra H 1 : 1
 2 d 0 .
De esta forma se pueden enfrentar las situaciones siguientes:
1. Cuando las varianzas  12 y  22 son conocidas.
2. Cuando las varianzas  12 y  22 son desconocidas, pero se sabe que son iguales.
3. Cuando las varianzas  12 y  22 son desconocidas, pero se sabe que son diferentes.
4. Muestras pareadas.
Las cuales se estudian bajo dos distribuciones, el caso 1 por medio de la normal. Mientras que en
los casos 2, 3 y 4 se utiliza la distribucin t-Student. Cabe mencionar que en algunas de ellas hasta la
fecha no se conoce su prueba UMP() ni la UMPI().
Con frecuencia las pruebas estadsticas son utilizadas bajo violacin del supuesto de la
distribucin en las que se sustentan. As, se puede resaltar la importancia de las siguientes preguntas:
Se mantiene casi constante el nivel de significancia de la prueba t cuando las muestras no son normales?
Cul es el nivel de significancia de las pruebas alternativas cuando uno o algunos de los supuestos de
la distribucin en los que se sustentan no se cumplen?
Las respuestas a estas interrogantes son de gran importancia, ya que se puede tener una idea
acerca del grado de variabilidad que sufren las pruebas bajo violacin de los supuestos de la
distribucin, dando cabida a las pruebas ms robustas; entendiendo por pruebas ms robustas
aqullas cuyo nivel de significancia y potencia de la prueba no son modificados sustancialmente
cuando hay incumplimiento de los supuestos de distribucin.
Comnmente estas pruebas son usadas para evaluar los resultados de investigaciones en
agricultura, medicina, educacin, psicologa, sociologa y otros campos.
4.3.1 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS SOBRE POBLACIONES
APROXIMADAMENTE NORMALES CUANDO SE CONOCEN  12 Y  22
Este caso se deduce fcilmente de las distribuciones muestrales, puesto que la diferencia de las medias
muestrales de poblaciones con distribucin normal tiene una distribucin normal con media 1
 2 y
 120  220
varianza  conocida (  120 y  220 conocidas). Luego, la estadstica de prueba estar dada por.
n1 n2
( X
Y )
( 1
 2 )
Z .
 102  202

n1 n2

TEOREMA 4.3

Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de N (1 ,  102 ) y


N ( 2 ,  20
2
) , entonces se pueden tener alguno de los siguientes contraste de hiptesis

133
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

a) H 0 : 1
 2  d 0 contra H 1 : 1
 2 d 0 , entonces la prueba UMP(), para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

 102  202  102  202


Rechazar H 0 : 1
 2  d 0 , si CC: x
y d 0  $
1 ( )   d 0
Z  .
n1 n2 n1 n2

b) H 0 : 1
 2  d 0 contra H 1 : 1
 2  d 0 , entonces la prueba UMP(), para   (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

 102  202  102  202


Rechazar H 0 : 1
 2  d 0 , si CC: x
y  d 0  $
1 (1
 )   d 0  Z  .
n1 n2 n1 n2
c) H 0 : d 0  1
 2  d1 contra H 1 : 1
 2 d 0 o 1
 2  d1 entonces la prueba
UMPI(), para   (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn1 y y1 , y 2 , , y n2 :

#  2  102  202
2
Rechazar H 0 : d 0  1
 2  d1 , CC: x
y d 0  $
1 !  10  20  d 0
Z  
" 2  n1 n2 2
n1 n2
o
#   2  102  202
2
x
y  d1  $
1 !1
 10  20  d1  Z   .
" 2  n1 n2 2
n1 n2

Con d 0 , d1  R ,  102 y  20
2
valores conocidos de antemano. En donde, $
1 (H ) representa el cuantil
H de la distribucin normal estndar para H  (0, 1) , o Z H representa el valor de la variable
normal estndar cuya rea a la derecha es H  (0, 1) .

EJEMPLO 4.8
Los fabricantes de tornillos tipo A y B aseguran que los tornillos tipo A tienen en promedio una mayor
resistencia a la tensin que los tornillos tipo B en ms de 3 kilogramos. Para probar su afirmacin los
fabricantes prueban de forma independiente 100 piezas de cada tipo de cuerda bajo condiciones
similares, obteniendo los siguientes resultados; el tipo A, tuvo una resistencia promedio de 88
kilogramos, mientras que el tipo B una resistencia promedio de 83 Kilogramos. Suponiendo que la
resistencia a la tensin de los tornillos se distribuye normalmente con X A ~ N ( A , 25) y
X B ~ N ( B , 81) realice una prueba estadstica para verificar la afirmacin de los fabricantes.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.05, si es valida la afirmacin de los fabricantes.
c) Calcule la potencia de la prueba para  A
 B  4 kilogramos.
Solucin
a) Se estn comparando medias en donde los fabricantes afirman que la resistencia promedio a la
tensin de la cuerda de los dos tipos de tornillos es  A   B  3 . As,  A
 B  3 ser la
hiptesis alterna y la contrapuesta  A
 B  3 la hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
UMP(0.05), se tendr:

134
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

i) H 0 :  A
 B  3 contra H 1 :  A
 B  3 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin similar a la del inciso b del Teorema 4.3. Luego, se requiere
 A2  B2
calcular la CC: d 0  $
1 (1
 )  . As, de las tablas porcentuales para la
nA nB
distribucin normal estndar, $
1 (1
0.05)  $
1 (95%)  1.6449 . Por otro lado, d 0  3 ,
n A  n B  100 y  A2  25 y  B2  81 . Finalmente, la regla de decisin.

 A2  B2 25 81
Rechazar: H 0 :  A
 B  3 , si x A
x B  d 0  $
1 (1
 )   3  1.6449   4.69 .
nA nB 100 100

Es decir, rechazar H 0 :  A
 B  3 si x A
x B  4.69 . Grficamente se tiene:
regin de no rechazo R a

4.69 regin de rechazo Rr


Figura 4.9. Regin de no rechazo y rechazo para el ejemplo 4.8
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, con x A  88 , x B  83 , y
x A
x B  88
83  5  4.69 . As, se concluye que H 0 :  A
 B  3 se rechaza al 5% de
significancia.
Es decir, al 5% de significancia y la realizacin obtenida no existen evidencias para refutar la
afirmacin de los fabricantes que  A   B  3 , la cuerda de los tornillos tipo A tiene una resistencia
promedio mayor a la del tipo B en ms de 3 Kilogramos.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo

PRechazar H 0 |  A
 B  3  P X A
X B  4.69 |  A
 B  4  
# #
!  ! 
! X
X
( 
 ) 4.69
( 
 )  ! 4.69
4
P !  | A
B  4   P! Z    PZ  0.67  0.2514
A B A B A B

! A B
2 2
A B
2 2  ! 25 81 
!    !  
! n n n n  " 100 100 
" A B A B 
Si la verdadera diferencia de medias fuera 4 kilogramos la prueba tendra una potencia baja.
EJEMPLO 4.9
En un experimento se compararon las economas en combustible de dos tipos de vehculos Disel
equipados de manera similar. Se utilizaron independientemente 12 automviles Toyota y 10
Volkswagen en pruebas de velocidad fija de 90 km. por hora. Si para los Toyota se obtuvo un
promedio de 16 km por litro y para los Volkswagen el promedio fue de 11 km. por litro. Con los
resultados obtenidos la persona que realiza el experimento afirma que los vehculos Toyota en
promedio exceden a los Volkswagen entre 1 y 3 km. por litro inclusive. Suponga que el rendimiento
por litro para cada modelo de vehculo se distribuye aproximadamente en forma Normal con varianzas
de 4.41 para Toyota y 2.25 para Volkswagen.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.04, si es valida la afirmacin.

135
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

c) Calcule la potencia de la prueba para una diferencia promedio de 5 kilmetros.

Solucin
a) Se pide una prueba de hiptesis para la diferencia de medias, en donde se tiene que probar que el
rendimiento promedio por litro de los autos Toyota excede al rendimiento de los autos Volkswagen
entre 1, 3, kilmetros. Representando por 1 al rendimiento promedio por litro de los carros
Toyota y por  2 a los Volkswagen, se tiene que la hiptesis nula ser 1  1
2  3 y la
contrapuesta 1
 2 1 1
 2  3 la hiptesis alterna.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
UMPI(0.04), se tendr:
i) H 0 :1  1
 2  3 contra H1 : 1
 2 1 o 1
 2  3 .
ii) Nivel de significancia   0.04 .
iii)Se est ante una situacin similar a la del inciso c del Teorema 4.3. Luego, se requiere calcular
#  2 #   2
2 2
la CC: d 0  $
1 !  10  20 y d1  $
1 !1
 10  20 . As, de las tablas porcentuales
"2 n1 n2 " 2 n1 n2
para la distribucin normal estndar, $ (0.02) 
2.0537 $
1 (1
0.02)  2.0537. Por otro lado,

1

d 0  1 y d1  3 , n1  12 y n2  10 y  10
2
 4.41 y  20
2
 2.25 . Finalmente, la regla de decisin.
Rechazar: H 0 :1  1
 2  3 , si

#  2
2
4.41 2.25
x1
x 2 d 0  $
1 !  10  20  1
2.0537  
0.58 o
" 2  n1 n2 12 10

#   2
2
4.41 2.25
x1
x 2  d 1  $
1 !1
 10  20  3  2.0537   4.58 .
" 2  n1 n 2 12 10

Es decir, rechazar H 0 :1  1
 2  3 si x1
x2
0.58 o x1
x2  4.58 .
iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1  16 y x 2  11, luego
x1
x2  16
11  5 y se concluye rechazar H 0 :1  1
 2  3 al 4% de significancia.
As, se concluye que al 4% de significancia y la realizacin obtenida no existen evidencias para
aceptar la afirmacin de la persona que realiza el experimento de que 1  1
2  3 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo

PRechazar H 0 |  1
 2 < 1,3,  P ( X 1
X 2
0.58) I ( X 1
X 2  4.58) |  1
 2  5 
  
 P X 1
X 2
0.58 |  1
 2  P X 1
X 2  4.58 |  1
 2  5 
# #
!  ! 
! 1X
X
5
0.58
5  ! X1
X 2
5 4.58
5
 P!   P! 
2

! 4 .41 2. 25 4 .41 2. 25  ! 4 .41 2 .25 4.41 2.25 
!    !   
" 12 10 12 10  " 12 10 12 10 
 P( Z
7.25)  P( Z 
0.55)  0.7088
Si la verdadera diferencia de medias fuera 5 kilmetros la prueba tendra una potencia
considerable.

136
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

4.3.2 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS SOBRE POBLACIONES


APROXIMADAMENTE NORMALES CUANDO SE DESCONOCEN  12 Y  22 PERO
 12   22
El problema de la comparacin de medias para el caso de igualdad de varianzas se le conoce como el
problema de Behrens-Fisher y fue desarrollado entre 1935-1939. En este caso la estadstica de
prueba encontrada tiene una distribucin t-student con n1  n2
2 grados de libertad y est dada por:
X
Y
( 1
 2 ) (n1
1) S12  (n2
1) S 22
T , en donde S p2  .
1 1 n1  n2
2
Sp 
n1 n 2

TEOREMA 4.4

Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de N (1 ,  12 ) y


N ( 2 ,  22 ) , entonces se pueden tener alguno de los siguientes contraste de hiptesis
a) H 0 : 1
 2  d 0 contra H 1 : 1
 2 d 0 , entonces la prueba UMP(), para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

1 1 1 1
Rechazar H 0 : 1
 2  d 0 , si CC: x
y d 0  Ft
( n11  n2
2) ( ) s p   d 0
t s p  .
n1 n 2 n1 n 2
b) H 0 : 1
 2  d 0 contra H 1 : 1
 2  d 0 , entonces la prueba UMP(), para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

1 1 1 1
Rechazar H 0 : 1
 2  d 0 , si CC: x
y  d 0  Ft
( n11  n2
2) (1
 ) s p   d 0  t s p  .
n1 n 2 n1 n 2

c) H 0 : d 0  1
 2  d1 contra H 1 : 1
 2  d 0 o 1
 2  d1 entonces la prueba UMPI(),
para   (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn1 y
y1 , y 2 , , y n2 :

# 1 1 1 1
Rechazar H 0 : d0  1
2  d1 , CC: x
y d 0  Ft
( n11  n2
2) ! s p   d0
t s p  o
"2 n1 n 2 2
n1 n 2

#  1 1 1 1
x
y  d 1  Ft
( n11  n2
2) !1
s p   d1  t  s p 
" 2 n1 n 2 2
n1 n 2

Con d 0 , d1  R valores conocidos de antemano. En donde, Ft


(J1) (H ) representa el cuantil H de la
distribucin t-student con J grados de libertad para H  (0, 1) , o t H representa el valor de la
variable t-student con J  n1  n2
2 grados de libertad cuya rea a la derecha es H  (0, 1) .

EJEMPLO 4.10
Se comparan dos tipos de rosca de tornillo para ver su resistencia a la tensin. Se prueban
independientemente 12 piezas de cada tipo de cuerda bajo condiciones similares, obtenindose los
siguientes resultados, en kilogramos:

137
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
Tabla 4.2 Datos de resistencia en tensin de dos tipos de rosca
Suponiendo que la resistencia a la tensin de los tornillos se distribuye normalmente con
varianzas desconocidas pero iguales. Se desea saber si es posible concluir estadsticamente que la
resistencia promedio a la tensin de los tornillos de tipo I es menor de la de los tornillos tipo II.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.025, si es valida la conclusin.
c) Calcule la potencia de la prueba para 1
 2 
2 kilogramos.
Solucin
a) Se estn comparando medias en donde los fabricantes afirman que la resistencia promedio a la
tensin de la cuerda de los dos tipos de tornillos es 1  2 . As, 1
 2 0 ser la hiptesis
alterna y la contrapuesta 1
 2  0 la hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
UMP(0.05), se tendr:
i) H 0 : 1
 2  0 contra H 1 : 1
 2 0 .
ii) Nivel de significancia   0.025.
iii) Se est ante una situacin similar a la del inciso a del Teorema 4.4. Luego, se requiere
1 1
calcular la CC: d 0  Ft
( n11  n2
2) ( ) s p  . As, de las tablas porcentuales para la
n1 n2
distribucin t-student con n1  n2
2  12  12
2  22 grados de libertad,

1
Ft ( 22) (0.025) 
2.074 . Por otro lado, d 0  0 , n1  n2  12 , para obtener la regla de
decisin se requiere calcular de la realizacin sus promedios y varianzas insesgadas:
x1  79.8333, s12  3.9697 ; x2  80.6667 , s22  2.6061, ahora

(n1
1) s12  (n 2
1) s 22 (12
1)3.9697  (12
1)2.6061
sp    1.8133
n1  n 2
2 12  12
2
Finalmente, la regla de decisin.

Rechazar: H 0 : 1
 2  0 , si x1
x2 d0  Ft
( n11  n2
2) ( )s p 1  1  0
2.074(1.8133) 1  1 
1.54 .
n1 n2 12 12

Es decir, rechazar H 0 : 1
 2  0 si x1
x2
1.54 . Grficamente se tiene:
regin de rechazo Rr


1.54 regin de no rechazo Ra
Figura 4.10. Regin de no rechazo y rechazo para el ejemplo 4.10
Fuente: Elaboracin propia

138
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1  79.8333 y x2  80.6667 ,
luego x1
x2  79.83
80.67 
0.84 con lo cual se concluye que H 0 : 1
 2  0 no se
rechaza al 2.5% de significancia.
Dicho valor se encuentra en la regin de no rechazo, por tal razn a partir de la realizacin dada
no hay evidencias para rechazar H 0 : 1
 2  0 a un nivel de significancia del 2.5%. Luego, la
resistencia promedio a la tensin de los tornillos tipo I no es menor a la de los tornillos tipo II.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo

PRechazar H 0 | 1
 2 0   P X 1
X 2
1.54 | 1
 2 
2 
# #
!  ! 
! X
Y
( 1
 2 )
1.54
( 1
 2 )  !
1.54
(
2) 
 P! | 1
 2 
2   P! T2 2 
! 1 1 1 1  ! 1 1 
! Sp n  n Sp 
n1 n 2  !
"
1.8133 
12 12


" 1 2 
 PT2 2 0.621 9 0.7295

Si la verdadera diferencia de medias fuera


2 kilogramos la prueba tendra una potencia
considerable.
EJEMPLO 4.11
Un fabricante de soldadura ha creado un recubrimiento y afirma que ste incrementa la resistencia a la
traccin en ms de 5 libras. Para probar estadsticamente su afirmacin l lleva a cabo pruebas de
traccin en 10 puntos de soldadura en un dispositivo semiconductor (sin el recubrimiento), y
produjeron los siguientes resultados en libras requeridas para romper la soldadura:
15.8, 12.7, 13.2, 16.9, 10.6, 18.8, 11.1, 14.3, 17.0, 12.5
Posteriormente, tom otro conjunto independiente del primero, de 8 puntos que fueron probados,
despus de recibir el recubrimiento para la resistencia a la traccin y se obtuvieron los siguientes
resultados.
24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8, 22.5
Suponiendo normalidad con varianzas iguales en las pruebas de traccin, pruebe
estadsticamente si es valida la afirmacin del fabricante.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.05, si es valida la afirmacin.
c) Calcule la potencia de la prueba para  2
1  8 lb., donde 1 representa la media en libras
requeridas para romper la soldadura sin el recubrimiento, similarmente  2 , pero con recubrimiento.
Solucin
a) Se estn comparando medias en donde el fabricante afirma que la resistencia promedio a la ruptura
de la soldadura es  2  1  5 . As,  2
1  5 ser la hiptesis alterna y la contrapuesta
 2
1  5 la hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
UMP(0.05), se tendr:
i) H 0 :  2
1  5 contra H1 :  2
1  5 .
ii) Nivel de significancia   0.05 .

139
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iii)Se est ante una situacin similar a la del inciso b del Teorema 4.4. Se requiere calcular la CC:
1 1
d 0  Ft
( n11  n2
2 ) (1
 ) s p  . As, de las tablas porcentuales para la distribucin t-
n1 n 2
student con n1  n2
2  10  8
2  16 grados de libertad, Ft
(16
1
) (0.95)  1.746 . Por otro lado,

d 0  5 . Para obtener la regla de decisin se deben calcular de la realizacin sus promedios y


varianzas insesgadas: x1  14.29 y s12  7.50 , n1  10 y x2  22.09 y s 22  2.68 , n2  8 .
Ahora,
(n1
1) s12  (n 2
1) s 22 (10
1)7.50  (8
1)2.68
sp    2.32
n1  n 2
2 10  8
2
Finalmente, la regla de decisin.

Rechazar: H 0 :  2
1  5 , si x2
x1  d0  Ft
(161 ) (1
 ) s p 1  1  5  1.746(2.32) 1  1  6.92 .
n1 n2 10 8

Es decir, rechazar H 0 :  2
1  5 si x2
x1  6.92 . Grficamente se tiene:

regin de no rechazo R a

6.92 regin de rechazo R r


Figura 4.11. Regin de no rechazo y rechazo para el ejemplo 4.11
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto recuerde que x1  14.29 y x2  22.09 , luego
x2
x1  22.09
14.29  7.8 . As, se concluye que H 0 :  2
1  5 se rechaza al 5% de
significancia. Es decir, el recubrimiento si aumenta la resistencia a la ruptura de la soldadura en
ms de 5 libras.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
! 
 ! X
X1
8
PRechazar H 0 |  2
1  5  P X 2
X 1  6.92 |  2
1  8  P! 2 

6.92
8 

! 2.32 1  1 2.32 1  1 
! 
" 10 8 10 8 
 PT1 6 
0.9814   0.8295
Si la verdadera diferencia de medias fuera 8 libras la prueba tendra una potencia elevada.
4.3.3 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS SOBRE POBLACIONES
APROXIMADAMENTE NORMALES CUANDO SE DESCONOCEN  1 Y  2 PERO  1   2
2 2 2 2

Cuando las distribuciones de la poblacin son normales con varianzas desconocidas y diferentes,
Esther Welch (1937) o Satterthwaite (1946) encontraron pruebas ms potentes que la del Teorema 4.4,
pero en general la prueba de Welch es ms recomendable y ser la que se explicar en esta subseccin,
aunque se aclara que en esta situacin no se tiene la prueba UMP (). La prueba de Welch no es
robusta en ausencia de la condicin de normalidad (hecho demostrado por Yuen en 1974 y Cressie
& Whitford, en 1986).
Formulacin de la prueba de Welch-Aspin (Aspin, 1948).

140
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Sea X 1 , X 2 , X 3 , , X n1 una muestra aleatoria de la poblacin 1 que tiene una distribucin


normal con media 1 y varianza  12 desconocida y Y1 , Y2 , , Yn2 una muestra aleatoria de la poblacin
2 que tiene distribucin normal con media  2 y varianza  22 tambin desconocida, adems supngase
que las dos muestras son independientes y  12   22 . Se desea contrastar alguno de los juegos de
hiptesis dados en el Teorema 4.4. En ests condiciones Welch-Aspin obtuvieron la estadstica de
prueba, en una distribucin t-student con J grados de libertad, dados por:
2
# S12 S 22
! 
X
Y
( 1
2 )
!n  n 
" 1 2 
T , con grados de libertad: J  2 2
.
S12 S 22 # S12 1 # S 22 1
 !   ! 
n1 n2 ! n  n
1 ! n  n
1
" 1  1 " 2 2
Los grados de libertad, J, son redondeados al entero ms prximo. Es decir, si J  17.3 9 17 ,
J  17.8 9 18 o J  17.5 9 18 . Adems, ( X , S12 ) y (Y , S 22 ) son la media y varianza insesgada de las
muestras 1 y 2, respectivamente.
TEOREMA 4.5
Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de N (1 ,  12 ) y
N ( 2 ,  22 ) , entonces se pueden tener alguno de los siguientes contraste de hiptesis
a) H 0 : 1
 2  d 0 contra H 1 : 1
 2 d 0 , entonces la prueba de tamao , para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

s12 s 22 s12 s 22
Rechazar H 0 : 1
 2  d 0 , si CC: x
y d 0  Ft
(J1) ( )   d 0
t  .
n1 n2 n1 n2
b) H 0 : 1
 2  d 0 contra H 1 : 1
 2  d 0 , entonces la prueba de tamao , para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

s12 s 22 s12 s 22
Rechazar H 0 : 1
 2  d 0 , si CC: x
y  d 0  Ft
(J1) (1
 )   d 0  t  .
n1 n2 n1 n2

c) H 0 : d 0  1
 2  d1 contra H 1 : 1
 2  d 0 1
 2  d1 entonces la prueba de
tamao , para   (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn1 y y1 , y 2 , , y n2 :

# s
2
s2 s12 s 22
Rechazar H0 : d0  1
2  d1 , CC: x
y d 0  Ft
(J1) !  1  2  d 0
t   o
" 2  n1 n 2 2
n1 n2

#  s
2
s2 s12 s 22
x
y  d 1  Ft
(J1) !1
 1  2  d 1  t  
" 2  n1 n 2 2
n1 n2

Con d 0 , d1  R valores conocidos de antemano. En donde, Ft


(J1) (H ) representa el cuantil H de la
distribucin t-student con J grados de libertad para H  (0, 1) , t H representa el valor de la
variable t-student con J grados de libertad cuya rea a la derecha es H  (0, 1) .

141
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

EJEMPLO 4.12
En un experimento se compararon las economas en combustible de dos tipos de vehculos Disel
equipados de manera similar. Se utilizaron 12 automviles Toyota y 10 Volkswagen en pruebas de
velocidad fija de 90 km. por hora. Si para los Toyota se obtuvo un promedio de 16 km por litro con
una desviacin estndar de 1.0 km por litro y para los Volkswagen aqul fue de 11 km. por litro, con
una desviacin estndar de 1.8 km por litro. Con los resultados obtenidos la persona que realiza el
experimento afirma que los vehculos Toyota en promedio exceden a los Volkswagen en 4 km. por
litro. Suponga que el rendimiento por litro para cada modelo de vehculo se distribuye
aproximadamente en forma Normal con varianzas diferentes.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.10, si es valida la afirmacin.
c) Calcule la potencia de la prueba para una diferencia promedio de 5 kilmetros.
Solucin
a) Se pide una prueba de hiptesis para la diferencia de medias, en donde se tiene que probar que el
rendimiento promedio por litro de los autos Toyota excede al rendimiento de los autos Volkswagen
en 4 kilmetros. Representando por 1 al rendimiento promedio por litro de los carros Toyota y
por  2 a los Volkswagen, H 0 : 1
 2  4 contra H 1 : 1
 2  4 .
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba de
tamao 0.10. Se utilizar la prueba de Welch-Aspin.
i) H 0 : 1
 2  4 contra H 1 : 1
 2  4 .
ii) Nivel de significancia   0.10 .
iii) Se est ante una situacin similar a la del inciso c del Teorema 4.5. Luego, se requiere
calcular la CC dada por: d 0  Ft
(J1) #!   o d 1  Ft
(J1) #!1
  s1  s 2 .
s12 s 22 2 2

" 2  n1 n2 " 2  n1 n2

En este caso se tienen que calcular los grados de libertad


2
6 s12 s22 3 6 1 3.24 3
2

4  1 412  10 1
J 5 n1 n2 2  5 2  13.49469 13
2 2 2 2
# s12 # 1 # s22 # 1 #1 # 1 # 3.24 # 1
!  !  !  !  !  ! !  ! 
! n  ! n
1   ! n  ! n
1  " 12  " 12
1  " 10  " 10
1 
" 1 " 1  " 2 " 2 

As, de las tablas porcentuales para la distribucin t-student con J  13 grados de libertad, y
 2  0.05 , se tendr Ft
(13
1
1
) (0.05) 
1.771 y Ft (13) (0.95)  1.771 . Por otro lado, d 0  d1  4 , n1  12

y n2  10 . Para obtener la regla de decisin se requieren calcular de la realizacin sus promedios y


varianzas insesgadas: x1  16 , s12  1 ; x 2  11, s 22  3.24 . Finalmente, la regla de decisin.

# s
2
s2 1 3.24
Rechazar: H 0 : 1
 2  4 , si x1
x 2 d 0  Ft
(J1) !  1  2  4
1.771   2.87 o
" 2  n1 n2 12 10

#  s
2
s2 1 3.24
x1
x 2  d 0  Ft
(J1) !1
 1  2  4  1.771   5.13
" 2  1
n n 2 12 10

Es decir, rechazar H 0 : 1
 2  4 si x1
x2 2.87 o x1
x2  5.13 . Grficamente se tiene:

142
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

regin de rechazo R r regin de rechazo R r


2.87 regin de no rechazo R a 5.13
Figura 4.12. Regin de no rechazo y rechazo para el ejemplo 4.12
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x1  16 y x 2  11, luego
x1
x2  16
11  5 con lo cual se concluye que H 0 : 1
 2  4 no se rechaza al 10%
de significancia.
Dicho valor se encuentra en la regin de no rechazo, se dice que a partir de la realizacin dada
no hay evidencias para rechazar H 0 : 1
 2  4 a un nivel de significancia del 10%. Luego, el
rendimiento promedio de los autos Toyota es superior al rendimiento promedio de los autos
Volkswagen en 4 kilmetros.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo

P Rechazar H 0 |  1
 2  4   P ( X 1
X 2 2.87) I ( X 1
X 2  5.13) |  1
 2  5 
  
 P X 1
X 2 2.87 |  1
 2  5  P X 1
X 2  5.13 |  1
 2  5
# #
!  ! 
! ( X
X )
(
 ) 2 . 87
5  ! ( X
X )
(
 ) 5.13
5 
 P! 1 2 1 2
  P! 1 2 1 2
 
! 2
S1 S 2 2
1 3.24  ! S 2
S 2
1 3.24 
!    ! 1
 2  
! n n 12 10  ! n n2 12 10 
" 1 2  " 1 
 P T1 3
3.34  P T1 3  0.20 9 0.0026  0.4223  0.4249
Si la verdadera diferencia de medias fuera 5 kilmetros la prueba tendra una potencia media.
EJEMPLO 4.13
Resuelva el ejemplo del fabricante de soldadura que ha creado un recubrimiento y afirma que ste
incrementa la resistencia a la traccin en ms de 5 libras. Pero ahora suponga que las varianzas
poblacionales son diferentes y compare la respuesta con la obtenida en el ejemplo 4.11. En estas
condiciones el inciso (a) no se altera, es decir,  2
1  5 ser la hiptesis alterna y la contrapuesta
 2
1  5 la hiptesis nula.
Solucin
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba de
tamao 0.05, se tendr:
i) H 0 :  2
1  5 contra H1 :  2
1  5 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin similar a la del inciso b del Teorema 4.5. Luego, la CC:
s12 s 22
d 0  Ft
(J1) (1
 )  . Para los grados de libertad, s12  7.50 , n1  10 , s 22  2.68 y n2  8
n1 n2
2
6 s12 s22 3 6 7.50 2.68 3
2

4  1 4 10 
5 n1 n2 2 5 8 12
J 2 2
 2 2
 14.99 9 15
# s1 # 1
2
# s2 # 1
2
# 7.50 # 1 # 2.68 # 1
!  !  !  !  !  !   !  ! 
! n  ! n
1   ! n  ! n
1  " 10  " 10
1  " 8  " 8
1 
" 1 " 1  " 2 " 2 

143
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

De las tablas porcentuales para la distribucin t-student con J  15 grados de libertad,



1
F t (15) (0.95)  1.753. Por otro lado, d 0  5 . Para obtener la regla de decisin no olvide que x1  14.29
y x2  22.09 . Finalmente, la regla de decisin.
2 2
Rechazar: H 0 :  2
1  5 , si x2
x1  d0  Ft
(151 ) (1
 ) s1  s2  5  1.753 7.5  2.68  6.83 .
n1 n2 10 8

Es decir, rechazar H 0 :  2
1  5 si x2
x1  6.83 . Grficamente se tiene:
regin de no rechazo R a

6.83 regin de rechazo R r


Figura 4.13. Regin de no rechazo y rechazo para el ejemplo 4.13
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que x1  14.29 y
x2  22.09 , luego x2
x1  22.09
14.29  7.8 . As, se concluye que H 0 :  2
1  5
se rechaza al 5% de significancia. Es decir, el recubrimiento si aumenta la resistencia a la
ruptura de la soldadura en ms de 5 libras.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
! 
 
! X
X1
8
PRechazar H 0 |  2
1  5  P X 2
X 1  6.83 |  2
1  8  P! 2 
6.83
8

! 7.5  2.68 7.5 2.68 

! 
" 10 8 10 8 
 PT1 5 
1.123   0.8605
Si la verdadera diferencia de medias fuera 8 libras la prueba tendra una potencia elevada.
Al comparar con la respuesta del ejemplo 4.11 se observa que la potencia aument ligeramente,
luego, es lgico pensar que la mejor suposicin entre varianzas iguales y varianzas diferentes, es ms
fuerte esta ltima, hecho que se confirmar en la subseccin de razn entre varianzas.
4.3.4 PRUEBAS DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS DE OBSERVACIONES
PAREADAS CON DIFERENCIAS NORMALES
En Inferencia Estadstica tambin se estudia detenidamente a los intervalos de confianza para la
diferencia de medias de muestras dependientes, con observaciones pareadas, las mismas que se
explicaron con detalle. Ahora sean ( X 1 , Y1 ), ( X 2 , Y2 ), , ( X n , Yn ) las parejas de las variables
aleatorias X y Y con  X ,  Y y  X2 ,  Y2 , respectivamente.
Por otro lado, sea D a la variable aleatoria de la diferencia entre las variables X y Y, de tal forma
que Di  X i
Yi , i  1, 2, , n , representan la variable aleatoria resultante de la diferencia entre las
variables X i y Yi . Suponiendo que las Di tienen distribucin normal con media  D y varianza  D2 ,
desconocida y que son independientes (es decir, las variables aleatorias entre parejas diferentes son
independientes, pero las variables dentro del mismo par son dependientes), se obtuvo que
 D  E X
Y    X
Y y  D2  V  X
Y    X2   Y2
cov(X , Y ) y se estiman con una realizacin
( x1 , y1 ), , ( xn , y n ) de las parejas ( X 1 , Y1 ),  , ( X n , Yn ) , de donde se obtiene d i  xi
yi , luego
n n

8d 8 (d
1 1
xd  i estimar a  D y s 
2
d i
x d ) 2 estimar a  D2 .
n i 1 n
1 i 1

144
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

X d
d
As, la estadstica de prueba tiene distribucin t-Student con J  n
1 grados de
Sd n
libertad.
TEOREMA 4.6
Si x d y s d son la media y la desviacin estndar muestrales de la diferencia de n pares
independientes de realizaciones de muestras aleatorias pareadas, tomadas de mediciones de las
cuales se desconoce  X2 y  Y2 , entonces se pueden tener alguno de los siguientes contraste de
hiptesis
a) H 0 :  d   0 contraH1 :  d  0 , entonces la prueba UMP(), para   (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y y1 , y 2 , , y n
s s
Rechazar H 0 :  d   0 , si CC: x d  0  d Ftn

11 ( ) x d  0
d t (n
1) .
n n
b) H 0 :  d   0 contra H 1 :  d   0 , entonces la prueba UMP(), para   (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y y1 , y 2 , , y n :
sd sd
Rechazar H 0 :  d   0 , si CC: x d   0  Ftn

11 (1
 ) x d   0  t (n
1) .
n n
c) H 0 :  0   d  1 contra H 1 :  d  0  d  1 , entonces la prueba UMPI(),para
  (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y
y1 , y 2 , , y n :
sd sd
Rechazar H 0 :  0   d  1 , si CC: x d  0  Ft n

11 ( 2)   0
t  2 (n
1) o
n n
sd sd
xd  1  Ftn

11 (1
 2)  1 
t 2 (n
1)
n n
Con  0 , 1  R valores conocidos de antemano. En donde, Ftn

11 (H ) representa el cuantil H de la
distribucin t-student con n
1 grados de libertad para H  (0, 1) , t H representa el valor de la
variable t-student con n
1 grados de libertad cuya rea derecha es H  (0, 1) .

EJEMPLO 4.14
Un veterinario realiz un experimento con diez animales que fueron sometidos a condiciones que
simulaban una enfermedad. l registr el nmero de latidos del corazn, antes y despus del
experimento, obteniendo los siguientes datos:
Antes 70 120 98 110 105 100 110 96 69 86
Despus 105 130 112 120 158 118 124 118 92 104
Tabla 4.3 Nmero de latidos del corazn antes y despus de un experimento en
animales
Con los datos el veterinario afirma que la condicin experimental aumenta el nmero de latidos
del corazn en ms de 15 latidos. Suponiendo normalidad en la diferencia del nmero de latidos del
corazn antes y despus del experimento, se pretende dar una respuesta estadstica a la afirmacin del
veterinario.
a) Plantee el contraste de hiptesis apropiado para este problema.

145
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

b) Justifique a un nivel de significancia de 0.05, si es valida la afirmacin del veterinario.


c) Calcule la potencia de la prueba para una diferencia promedio 20 latidos.

Solucin
a) Note que entre las unidades experimentales tiene que haber cierta dependencia debido a que cada
pareja de observaciones fueron tomadas al mismo animal. Luego, se est en una situacin de
muestras pareadas y, se quiere probar si el nmero de latidos del corazn aumenta despus del
experimento, se considerarn las diferencias de los latidos despus menos antes del experimento,
con lo que se debe probar si, la media de las diferencias es mayor a 15. Esto ltimo se formular
como la hiptesis alterna,  d  15 , donde  d representa la verdadera media de las diferencias.
As, H 1 :  d  15 y H 0 :  d  15 .
b) Para justificar si es valida la afirmacin del veterinario, se emplear la metodologa del Teorema
4.6, para muestras pareadas.
i) H 0 :  d  15 contra H 1 :  d  15 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin como la del inciso (b) del Teorema 4.6. Es decir, se tiene que calcular la
sd
CC:  0  Ftn

11 (1
 ) . As, de las tablas para la distribucin t-student con n
1  10
1  9
n
grados de libertad, Ft9
1 (1
0.05)  1.833 . Por otro lado, para calcular la media y varianza muestral
se tienen que realizar las diferencias

Despus 105 130 112 110 138 118 124 118 92 104
Antes 70 120 98 110 105 100 110 96 69 86
Diferencia 35 10 14
10 33 18 14 22 23 18
Tabla 4.4 Diferencia del nmero de latidos del corazn antes y despus de un
experimento en animales
Ahora se calcularn su promedio y desviacin estndar de las diferencias, obteniendo:
xd  17.7 y s d  12.62
Finalmente, la regla de decisin
sd 12.62
Rechazar: H 0 :  d  15 , si x d   0  Ftn

11 (1
 )  15  (1.833)  22.32 .
n 10
Es decir, rechazar H 0 :  d  15 si xd  22.32 . Grficamente se tiene:
regin de rechazo R r
regin de no rechazo R a 22.32
Figura 4.14. Regin de no rechazo y rechazo para el ejemplo 4.14
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que xd  17.7 22.32 . Luego, al 5%
de significancia y la realizacin tomada no hay evidencias para rechazar H 0 :  d  15 .

146
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

As, se concluye al 5% de significancia y la realizacin obtenida que no es valida la afirmacin


del veterinario de que  d  15 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#

PRechazar H 0 |  d  15  P X d  22.32 |  d  20  P! T9 
!

22.32
20 
 PT9  0.5813 9 0.2877.
" 12.62 10 
Aunque la prueba encontrada es la UMP(0.05), la potencia de la prueba es pequea para el caso
en que la verdadera media en los incrementos de los latidos del corazn sea 20.
EJEMPLO 4.15
Recuerde el ejemplo 4.10 en donde se comparan dos tipos de rosca de tornillo para ver su resistencia a
la tensin, pero ahora se agregar la siguiente informacin; los dos tipos de tornillos son fabricados
bajo condiciones muy similares. Se prueban 12 piezas de cada tipo de cuerda bajo condiciones
similares, obtenindose los siguientes resultados, en kilogramos:
Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
Tabla 4.5 Datos de resistencia en tensin de dos tipos de rosca
Suponiendo que la resistencia a la tensin de los tornillos se distribuye normalmente. Se desea
saber si es posible concluir estadsticamente que la resistencia promedio a la tensin de los tornillos de
tipo I es menor a la de los tornillos tipo II.
a) Plantee el contraste de hiptesis apropiado para este problema.
b) Justifique a un nivel de significancia de 0.025, si es valida la conclusin.
c) Calcule la potencia de la prueba para 1
 2 
2 kilogramos.
Solucin
a) Note que entre las unidades experimentales tiene que haber cierta dependencia debido a que los
tornillos fueron fabricados bajo condiciones muy similares y se puede tratar el problema como un
caso de muestras pareadas. Se quiere probar si la resistencia a la tensin de los tornillos tipo I es
menor que la resistencia promedio de los tornillos tipo II. Es decir, se debe probar si, la media de
las diferencias entre los tornillos tipo I menos los del tipo II es menor a cero. Esto ltimo se
formular como la hiptesis alterna,  d 0 , donde  d representa la verdadera media de las
diferencias. As, H 1 :  d 0 y H 0 :  d  0 .
b) Para justificar si es valida la afirmacin, se emplear la metodologa del Teorema 4.6, para muestras
pareadas.
i) H 0 :  d  0 contra H 1 :  d 0 .
ii) Nivel de significancia   0.025.
iii) Se est ante una situacin como la del inciso (a) del Teorema 4.6. Es decir, se requiere
sd
calcular la CC:  0  Ftn

11 ( ) . As, de las tablas para la distribucin t-student con


n
n
1  12
1  11 grados de libertad, Ft9
1 (0.025) 
2.201 . Por otro lado, para calcular la
media y varianza muestral se tienen que realizar las diferencias
Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12

147
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
Diferencias
5
4
2
4
3 0 3 1
3 5 1 1
Tabla 4.6 Diferencia de la resistencia en tensin de los dos tipos de rosca
Ahora se calcularn su promedio y desviacin estndar de las diferencias, obteniendo:
xd 
0.833 y s d  3.13
Finalmente, la regla de decisin.
sd 3.13
Rechazar: H 0 :  d  0 , si x d  0  Ftn

11 ( )  0
(2.201) 
1.99 .
n 12
Es decir, rechazar H 0 :  d  15 si xd
1.99 . Grficamente se tiene:
regin de no rechazo R a
regin de rechazo Rr

1.99
Figura 4.15. Regin de no rechazo y rechazo para el ejemplo 4.15
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que xd 
0.833 
1.99.
Luego, al 2.5% de significancia y la realizacin tomada no hay evidencias para rechazar
H 0 : d  0 .
As, se concluye al 2.5% de significancia y la realizacin obtenida que no es valida la afirmacin
de que la resistencia promedio de los tornillos tipo I sea menor a la resistencia promedio tipo II.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
 
PRechazar H 0 |  d 0  P X d
1.99 |  d 
2  P! T11
!

1.99
(
2) 
 PT11 0.011 9 0.5043.
" 3.13 12 
La potencia de la prueba es baja si la verdadera diferencia de la resistencia promedio de los
tornillos fuese
2 kilogramos.
4.4 PRUEBAS PARA LAS VARIANZAS DE POBLACIONES NORMALES
Despus de haber revisado el parmetro media de una poblacin normal, hace falta revisar el otro
parmetro referente a la varianza, as, tener un estudio ms detallado de la poblacin. En el captulo
anterior en la razn de verosimilitud generalizada se vio que en el caso de una distribucin normal, la
estadstica que relaciona a la varianza tiene como estadstica de prueba a una distribucin ji cuadrada
con n
1 grados de libertad dada por:
(n
1) S n2
1
n2
1  .
2
TEOREMA 4.7

Sea X 1 , X 2 , , X n una muestra aleatoria de N ( ,  2 ) entonces se pueden tener alguno de los


siguientes contraste de hiptesis
a) H 0 :  2   02 contra H 1 :  2  02 , entonces la prueba de tamao , para   (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn

148
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

 02  02
Rechazar H 0 :  2   02 , si CC: s n2
1 F
21 ( ) s n2
1 n2
1 (1
 ) .
n
1 n
1 n
1
b) H 0 :  2   02 contra H 1 :  2   02 , entonces la prueba de tamao , para   (0, 1) estar
dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn
 02  02
Rechazar H 0 :  2   02 , si CC: s n2
1  F
21 (1
 ) s n2
1  n2
1 ( ) .
n
1 n
1 n
1

c) H 0 :  02   2   12 contra H 1 :  2  02  2   12 , entonces la prueba de tamao , para


  (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn
 02  12
Rechazar H 0 :  02   2   12 , si CC: s n2
1 F
21 ( 2) s n2
1  F
21 (1
 2) .
n
1 n
1 n
1 n
1

Con  02 ,  12 R  valores conocidos de antemano. En donde, F


21 (H ) representa el cuantil H de la
n

distribucin ji-cuadrada con n grados de libertad para H  (0, 1) , n2 (H ) representa el valor de


la variable ji-cuadrada con n grados de libertad para H  (0, 1) .

EJEMPLO 4.16
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de 9 piezas cuyos
dimetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 milmetros. Suponga que los dimetros de
las piezas tienen una distribucin aproximadamente normal. Si el fabricante de dichas piezas afirma
que el dimetro promedio de stas tiene una varianza menor a 1 milmetro2.
a) Plantee el contraste de hiptesis adecuado al problema para probar la afirmacin del fabricante.
b) Aplique la metodologa indicada arriba y determine la prueba de tamao   0.01.
c) Qu puede usted indicar con respecto a la afirmacin del fabricante con un nivel de significancia
de 0.01?
d) Si el valor de  2  0.5 milmetros2, calcule la potencia de la prueba.
Solucin
a) Se pide una prueba de hiptesis para la varianza, en donde se desea probar que la varianza de las
piezas metlicas es menor a 1 milmetro2 (espacio paramtrico abierto), H 1 :  2 1 . Luego, la
hiptesis nula ser el opuesto, es decir mayor o igual a 1 milmetro2, H 0 :  2  1 .
b) Siguiendo los pasos para una prueba de hiptesis.
i) H 0 :  2  1 contra H 1 :  2 1 .
ii) Nivel de significancia   0.01.
iii) Se est ante una situacin como la del inciso a del Teorema 4.7. Luego, se requiere calcular la
 02
1
CC: F 2 ( ) . As, de las tablas porcentuales para la distribucin ji-cuadrada con
n
1 n
1
n
1  9
1  8 grados de libertad, F
21 (0.01)  1.6465 . Por otro lado,  02  1 . Finalmente,
n
1

la regla de decisin.

149
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

 02 1
Rechazar: H 0 :  2  1 , si CC: s n2
1 F
21 ( )  (1.6465)  0.206.
n
1 n
1 9
1
Es decir, rechazar H 0 :  2  1 , si s n2
1 0.206 . Grficamente se tiene:

regin de rechazo R r

0 0.206 regin de no rechazo R a


Figura 4.16. Regin de no rechazo y rechazo para el ejemplo 4.16
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin y para esto se calcula el valor de la estadstica de
prueba segn la realizacin, obteniendo s n2
1  0.637 y, con lo cual se concluye que
H 0 :  2  1 no se rechaza al 1% de significancia.
c) Al 1% de significancia se puede concluir: Con la realizacin obtenida no existen evidencias para
rechazar la hiptesis nula.
d) Para calcular la potencia de la prueba se utiliza la regin de rechazo
# (n
1) S n2
1 (9
1)0.206
   
P Rechazar H 0 |  2 1  P S n2
1 0.206 |  2  0.5  P!
!


 
  P 82 3.296
"  2
0.5 
 0.0856
Si la verdadera varianza es 0.5 milmetros2 la potencia de la prueba es muy baja.
NOTA
1.- Para las probabilidades se puede utilizar cualquier paquete estadstico, por ejemplo,
Excel. En la pestaa de funcin escribir: =1 - DISTR.CHI( 3.296, 8) . 3.296 es el valor
del cuantil con el que se va a calcular la probabilidad a la derecha, 8 son los grados de
libertad y se toma el complemento (Excel calcula probabilidades a la derecha).
2.- En el paquete R, la funcin de probabilidad acumulada para la distribucin ji cuadrada
es, pchisq(3.296, 8), da como resultado 0.085567
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 3.296 con 8 grados de libertad: P( 82 3.2881)  0.085 y
P( 82 3.3570)  0.090 , interpolando P( 82 3.296) , se obtiene P( 82 3.296) 9 0.08557 ,
valor muy prximo al encontrado directamente con los paquetes, 0.085567.

EJEMPLO 4.17
Los fabricantes de mquinas despachadoras de caf afirman que sus mquinas despachan la bebida con
una desviacin estndar igual a 20 mililitros. Para probar tal afirmacin los consumidores toman una
muestra aleatoria de 30 servicios de la mquina de caf obteniendo un contenido promedio de 229
mililitros, con una desviacin estndar de 25 mililitros. Suponga normalidad en la cantidad de caf
despachada por la mquina.
a) Plantee un contraste de hiptesis adecuado para el problema y justifique si es o no valida la
afirmacin de los fabricantes de mquinas despachadoras a un nivel de significancia de 0.04.

150
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

b) Calcule la potencia de la prueba si   28 .


Solucin
a) Para el planteamiento del contraste de hiptesis note que la afirmacin del fabricante es que
  20 , luego la hiptesis nula ser H 0 :   20 contra H 1 :   20 . Para seguir los pasos que
lleven a la prueba, primeramente se observa que en este caso se habla de la desviacin estndar,
para la cual no se ha revisado un estadstico de prueba. Por tal razn, se eleva al cuadrado para
trabajar con la varianza, sobre la que si se conoce una metodologa.
i H 0 :  2  202 contra H 1 :  2  202 .
ii Nivel de significancia   0.04 .
iii Se est ante una situacin como la del inciso c del Teorema 4.7. Es decir, se requiere
 02
1  12
1
calcular la CC: F 2 ( 2) y F 2 (1
 2) , con  12   02 . As, de tablas
n
1 n
1 n
1 n
1
porcentuales para la distribucin ji-cuadrada con n
1  30
1  29 grados de libertad,
F
21 (0.02)  15.5745 y F
21 (1
0.02)  46.6926 . Por otro lado, s n2
1  252  625 .
n
1 n
1

Finalmente, la regla de decisin.


 02 400
Rechazar: H 0 :  2  400 , si CC: s n2
1 F
21 ( 2)  (15.5745)  214.82 o
n
1 n
1 30
1
 12 400
s n2
1  F
21 (1
 2)  (46.6926)  644.04 .
n
1 n
1 30
1
Es decir, rechazar H 0 :  2  400 si s n2
1 214.82 o s n2
1  644.04 . Grficamente se tiene:

regin de rechazo R r regin de rechazo R r

0 214.82 regin de no rechazo R a 644.04


Figura 4.17. Regin de no rechazo y rechazo para el ejemplo 4.17
Fuente: Elaboracin propia
iv Por ltimo se aplica la regla de decisin, para esto no olvide que s n2
1  625 y pertenece a
la regin de no rechazo. Se concluye, al 4% de significancia y la realizacin tomada que
no hay evidencias para rechazar H 0 :  2  400 o H 0 :   20 .
b) Para calcular la potencia de la prueba se utiliza la regin de rechazo
  
P Rechazar H 0 |  2  400  P S n2
1 214.82 I S n2
1  644.04 |  2  282 
# (n
1) S n2
1 (30
1)214.82 # (n
1) S n2
1 (30
1)644.04
 P!   P!  
!  2
784  !  2
784 
"  " 
   
 P 229 7.946  1
P 229  23.823  0.00004 0.73761 0.73765
Si la verdadera varianza es 625 mililitros2 la potencia de la prueba es alta.
Cmo comparar dos varianzas?
Se revisar una metodologa que ayude a comparar varianzas. Para esto recuerde del captulo
anterior que en el caso de dos muestras independientes tomadas de poblaciones normales, se demostr
que la estadstica f es la que relaciona a dos varianza, luego la estadstica de prueba estar dada por:

151
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

n21
1 # S n21
1 1
f  ! 2  2 2 ,
n22
1 ! S n
1   1  2
" 2 
distribucin f de Snedecor con n1
1 y n2
1 grados de libertad en el numerador y denominador,
respectivamente.

TEOREMA 4.8

Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 muestras aleatorias independientes de N (1 ,  12 ) y


N ( 2 ,  22 ) , respectivamente, entonces se pueden tener alguno de los siguientes contraste de
hiptesis
 12  12
a) H 0 :  r0 contra H 1 : r0 , entonces la prueba de tamao , para   (0, 1) estar dada
 22  22
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

 12 s n21
1
1
s n21
1
Rechazar H 0 : 2  r0 , si CC: 2 r0 F f ( n1
1, n2
1) ( ) 2 r0 f 1
 (n1
1, n 2
1) .
2 s n2
1 s n2
1

 12  12
b) H 0 :  r0 contra H 1 :  r0 , entonces la prueba de tamao , para   (0, 1) estar dada
 22  22
por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

 12 s n21
1
1
s n21
1
Rechazar H 0 :  r0 , si CC:  r F
0 f ( n1
1, n2
1) (1
 )  r0 f  (n1
1, n 2
1) .
 22 s n22
1 s n22
1

 12  12  12
c) H 0 : r0   r contra H : r  r1 , entonces la prueba de tamao , para
 22  22  22
1 1 0

  (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y
y1 , y 2 , , y n2

 12 s n21
1
1
s n21
1
Rechazar H 0 : r0   r1 , si CC: r0 F f ( n1
1, n2
1) ( 2)  r1 F f
(1n1
1, n2
1) (1
 2) .
 22 s n22
1 s n22
1

Con r0 , r1  R  valores conocidos de antemano. Donde, F f


(1n,m) (H ) representa el cuantil H de la
distribucin f con n y m grados de libertad en el numerador y denominador, respectivamente, para
H  (0, 1) , f H (n, m) representa el valor de la variable f con n y m grados de libertad en el
numerador y denominador, respectivamente, para H  (0, 1) .

Ntese que con esta metodologa se respuesta a preguntas ms generales sobre la relacin entre
dos varianzas, ya que se utilizar la razn r0 que puede ser igual, mayor o menor a 1.
EJEMPLO 4.18
Se comparan dos tipos de rosca de tornillo para ver su resistencia a la tensin. Se prueban 12 piezas de
cada tipo de cuerda bajo condiciones similares, obtenindose los siguientes resultados, en kilogramos:

152
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
Tabla 4.7 Resistencia en tensin de dos tipos de tornillos.
Se desea probar si es la valida la suposicin que se hizo en el ejemplo 4.10, sobre las varianzas
   22 .
2
1

a) Plantee el contraste de hiptesis apropiado para este problema.


b) Justifique a un nivel de significancia de 0.05, si es valida la suposicin.
c) Calcule la potencia de la prueba para  12  22  2 .
Solucin
a) Se estn comparando varianzas por medio de la igualdad  12   22 , pero no se tiene una
metodologa para la igualdad de varianzas. Por tal razn, se pasa a una razn entre varianzas,
obteniendo las hiptesis H 0 :  12  22  1 contra H 1 :  12  22  1 .
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba.
 12  12
i) H0 :  1 contra H 1 : 1.
 22  22
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin similar a la del inciso c del Teorema 4.8. Luego, se requiere
calcular la CC: r0 F f
(1n1
1,n2
1) ( 2) y r1 F f
(1n1
1,n2
1) (1
 2) . As, de las tablas porcentuales
para la distribucin f de Snedecor con n1
1  n2
1  12
1  11 grados de libertad, del
numerador y denominador; F f
(111,11) (0.975)  3.474 , para encontrar F f
(111,11) (0.025) se
recurre a la relacin f 1
 (m, n)  1 f  (n, m) . Luego,
1 1
F f
(111,11) (0.025) 
1
 .
F f (11,11) (1
0.025) 3.474

Finalmente, la regla de decisin con r0  1 .

 12 s n21
1 1
Rechazar: H 0 :  1 , si la CC: r0 F f
(1n1
1,n2
1) ( 2)  1 :  0.2879 o
2 2 2
s n2
1 3.474

s n21
1
2
 r0 F f
(1n1
1, n2
1) ( )  1 : 3.474  3.474 .
s n2
1

 12 s n21
1 s n21
1
Es decir, rechazar H 0 :  1 si CC: 0.2879 o  3.474 . Grficamente se tiene:
 22 s n22
1 s n22
1

Regin de rechazo R r regin de rechazo R r


0 Regin de no rechazo R a 3.474
0.2879
Figura 4.18. Regin de no rechazo y rechazo para el ejemplo 4.18

153
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Fuente: Elaboracin propia.


iv) Por ltimo se aplica la regla de decisin, para esto no olvide que s12  3.97 y s 22  2.61 .
s n21
1 3.97
De donde 2
  1.52  0.2879, 3.474, , luego se concluye que no se rechaza
s n2
1 2.61
 12
H0 :  1 al 5% de significancia. Es decir, al 5% de significancia se considera valida
 22
la afirmacin.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
# 2 # s n2
1 s n2
1 2
P! Rechazar H 0 | 12  1  P! 21 0.2879I 21  3.474 | 12  2 
! 2  ! s n
1 s n2
1 2 
"  " 2 
# s n21
1 # 1 # 1  2 # s 2
# 1 # 1 2
 P! 2 ! 2  0.2879!  | 1  2   P! n1
1 !   3.474!  | 1  2
! s n
1 !  1  22  ! 2  2   2  ! ! 2  ! 2  2  2 
" s n2
1 "  1  2
2 2
" 2 "  " 1 2  2   " 1 2  2 
# #
#1 #1
   
 P!! 121,1 1 0.2879!    P!! 121,1 1  3.474!    P 121,1 1 0.144  P 121,1 1  1.737
" " 2  " " 2 
 0.0016  0.1868  0.1884
Si la verdadera razn entre varianzas fuera 2, la prueba tendra una potencia baja.

NOTA
Para calcular el valor de la probabilidad con la distribucin f, se procede de forma similar
que con las anteriores distribuciones.
1.- En el paquete Excel, en la pestaa de funcin escribir: =1-DISTR.F( 0.144, 11, 11 ) +
DISTR.F( 1.737, 11, 11 ). 0.144 y 1.737 son los valores de los cuantiles con el que se van a
calcular las probabilidades a la derecha (slo valores positivos), 11, 11 son los grados de
libertad del numerador y denominador, respectivamente. Se toma el complemento, porque
Excel calcula las probabilidades a la derecha.
2.- En el paquete R, la funcin de probabilidad acumulada para la distribucin f es,
pf(0.144, 11, 11) + 1- pf(1.737, 11, 11), da como resultado 0.1884.
3.- En caso de no tener un paquete estadstico se usan las tablas con los valores ms
prximos a 0.144 y 1.737 con 11 y 11 grados de libertad, pero en este caso se complica la
bsqueda, porque las tablas estadsticas para la distribucin f slo tienen una pequea gama
de valores. Para P( f11,11  1.737) sus valores ms prximos son: P( f11,11  1.685)  0.20 y
P( f11,11  2.227)  0.10 , interpolando P( f11,11  1.737) (ver tablas al final del presente
trabajo), se obtiene P( f11,11  1.737) 9 0.1904 prximo a 0.1868 de paquete.

EJEMPLO 4.19
En los ejemplos 4.11 y 4.13 se trabaj un problema de un fabricante de soldadura que creo un
recubrimiento. Se hicieron las suposiciones de que las varianzas eran iguales (ejemplo 4.11) y
diferentes (ejemplo 4.13). Se llevar a cabo una prueba de hiptesis para las varianzas, en donde se
afirmar que la varianza de la poblacin 1 es mayor que la varianza de la poblacin 2. Para esto no
olvide que s12  7.50 n1  10 , s 22  2.68 , n2  8 y las poblaciones de soldaduras tienen distribucin
normal.

154
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

a) Plantee el contraste de hiptesis apropiado para este problema.


b) Justifique a un nivel de significancia de 0.10, si es valida la afirmacin.

Solucin
a) Se afirm que  12   22 . As,  12   22 ser la hiptesis alterna y la contrapuesta  12   22 la
hiptesis nula.
b) Siguiendo los pasos de la metodologa para realizar la comprobacin y determinar la prueba
i) H 0 :  12   22 contra H 1 :  12   22 H 0 :  12  22  1 contra H 1 :  12  22  1 .
ii) Nivel de significancia   0.10 .
iii) Se est ante una situacin similar a la del inciso b del Teorema 4.8. Luego, se requiere
calcular la CC: r0 F f
(1n1
1,n2
1) (1
 ) . As, de las tablas porcentuales para la distribucin f
de Snedecor con n1
1  10
1  9 y n2
1  8
1  7 grados de libertad, del numerador y
denominador; F f
(19,7 ) (1
0.10)  F f
(19,7 ) (0.90)  2.725. Finalmente, la regla de decisin
con r0  1 .
s n21
1
Rechazar: H 0 :  2
1   1 , si CC:
2
2 2
 r0 F f
(1n1
1,n2
1) (1
 )  1 : 2.725  2.725 .
s n2
1

s n21
1
Es decir, rechazar H 0 :  2
1   1 , si
2
2  2.725 . Grficamente se tiene:
s n22
1

Regin de no rechazo
0 2.725 regin de rechazo
Figura 4.19. Regin de no rechazo y rechazo para el ejemplo 4.19
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que s12  7.50 y s22  2.68 ,
luego s n21
1 s n22
1  7.50 2.68  2.799 . As, se concluye que H 0 :  12  22  1 se rechaza al
10% de significancia.
4.5 PRUEBAS PARA POBLACIONES TIPO BERNOULLI, PROPORCIONES
En la presente seccin se cambiar de distribucin y se trabajar con poblaciones que tienen una
distribucin tipo Bernoulli. Es decir, se revisarn problemas donde las variables aleatorias aparecen en
situaciones en las que el decisor slo tiene dos opciones.
 Al entrevistar a una persona para ver si apoya o no la poltica de un gobernante.
 Si una ama de casa compra o no un producto determinado.
 Si una persona consume o no una pasta de dientes marca A.
 Si un estudiante ha consumido droga alguna ocasin.
Por ejemplo, en la situacin poltica muy controvertida del ao 2006 sobre el plantn en la plaza
del Zcalo se pudo entrevistar a un grupo de capitalinos y preguntarles si estn a favor o en contra del

155
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

plantn, de tal forma que si X representa a la variable aleatoria, la persona est a favor del plantn, el
xito sera que la persona conteste que s est a favor del plantn y el valor de la variable sera 1, en
caso contrario 0. Este tipo de variables aleatorias llamadas dicotmicas son muy comunes en las
investigaciones, puesto que son variables aleatorias muy propicias para realizar estudios sobre
preferencias, y de hecho en una muestra aleatoria lo que de ellas nos interesa son: su suma o su
promedio que lleva el nombre particular de proporcin.
4.5.1 PRUEBAS PARA PROPORCIONES MUESTRAS GRANDES
En Inferencia Estadstica se revisa que si se tiene una muestra aleatoria X 1 , X 2 , , X n de variables
n
tipo Bernoulli con parmetro p, entonces su suma T  8X
i 1
i tiene una distribucin tipo binomial con

parmetros n y p; tambin se vio que la estadstica de prueba para el caso de la distribucin Bernoulli
es la suma o su promedio. Por otro lado, cuando se trabaja con proporciones las muestras estudiadas
son grandes, as para llevar a efecto las pruebas en el caso de una distribucin tipo Bernoulli y muestras
grandes, se acostumbra utilizar una aproximacin con el Teorema de Lmite Central. Luego, se necesita
el valor esperado y la varianza de la suma, E (T )  np y V (T )  npq, o en el caso de proporciones
1
P  X  T , E ( P )  p y V ( P )  pq n . Finalmente, el estadstico de prueba que aproxima tendr una
n
distribucin normal estndar y est dado por:
T
np P
p
Z (sumas) o Z  (proporciones).
npq pq n

TEOREMA 4.9
Sea X 1 , X 2 , , X n una muestra aleatoria de distribuciones tipo Bernullis( p) , entonces se pueden
tener alguno de los siguientes contraste de hiptesis condicionados para n grande.
a) H 0 : p  p0 contra H 1 : p p0 , entonces la prueba de tamao , para   (0, 1) estar dada
por la siguiente regla de decisin para una realizacin x1 , x 2 , , xn
Rechazar H 0 : p  p0 , con la suma CC: t np0  $
1 ( ) np0 q0 t np0
Z  np0 q0 .

p0 q0 p0 q0
Con la proporcin muestral, CC: p p 0  $
1 ( ) p p 0
Z  .
n n
b) H 0 : p  p0 contraH1 : p  p0 , entonces la prueba de tamao , para   (0, 1) estar dada por
la siguiente regla de decisin para una realizacin x1 , x2 , , xn
Rechazar H 0 : p  p0 , con la suma CC: t  np0  $
1 (1
 ) np0 q0 t  np0  Z  np0 q0 .

p0 q0 p0 q0
Con la proporcin muestral, CC: p  p 0  $
1 (1
 ) p  p 0  Z  .
n n
c) H 0 : p 0  p  p1 contra H 1 : p p0 p  p1 entonces la prueba de tamao , para
  (0, 1) estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn :
Rechazar H 0 : p0  p  p1 ,con la suma CC: t np0  $
1 ( 2 ) np0 q0
t  np1  $
1 (1
2 ) np0 q0

p0 q0 p0 q0
Con la proporcin muestral, CC: p p 0  $
1 ( 2) p  p1  $
1 (1
 2)
n n

156
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

8x
1
Con p0 , p1  0, 1, y q0  1
p0 valores conocidos de antemano; t  i y p  x  t , $
1 (H )
i 1 n
representa el cuantil H de la distribucin normal estndar para H  (0, 1) , Z H representa el valor
de la variable normal estndar cuya rea a la derecha es H  (0, 1) .

EJEMPLO 4.20
El director general de un canal televisivo asegura que la proporcin de audiencia que ve cierto
programa el sbado por la noche es mayor al 40%. Se eligi una muestra de 100 televidentes a quienes
se entrevisto, resultando que 45 de ellos vean el programa.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 2.5% pruebe si la afirmacin es valida, realice la comprobacin con la
suma y con la proporcin y verifique que se obtiene el mismo resultado.
c) Calcule la potencia de la prueba, suponiendo que p  0.60 .
Solucin
a) Se pide una prueba de hiptesis para la proporcin de televidentes que ven un programa el sbado
por la noche, en donde el directo del canal afirma que la proporcin de audiencia para el programa
es mayor a 0.40, luego el signo de igualdad se encuentra en la opuesta. As, la suposicin del
director ser la hiptesis alterna H 1 : p  0.40 y su opuesta H 0 : p  0.40 .
b) Siguiendo los pasos de la metodologa
i) H 0 : p  0.40 contra H 1 : p  0.40 .
ii) Nivel de significancia   0.025 .
iii) Se est ante una situacin similar a la del inciso (b) del Teorema 4.9. Luego, se requiere
p0 q0
calcular la CC: Para la suma np0  $
1 (1
 ) np0 q0 y la proporcin p 0  $
1 (1
 ) .
n
As, de las tablas porcentuales para la distribucin normal estndar, $
1 (0.025) 
1.96 y
$
1 (0.975)  1.96 . Por otro lado, p 0  0.40 , n  100. Finalmente, la regla de decisin.
Rechazar: H 0 : p  0.40 , si:

Suma: t  np0  $
1 (1
 ) np0 q0  100(0.4)  1.96 100(0.4)(0.6)  49.60 .
p0 q0 0.4(0.6)
Proporciones: p  p 0  $
1 (1
 )  0.40  1.96  0.4960 ( 49.6 100).
n 100
Es decir, rechazar H 0 : p  0.40 si t  49.6 o para las proporciones p  0.496 . Grficamente se
tiene la misma situacin en el caso de sumas y en las proporciones, como era de esperarse slo cambia
su escala (49.6 o 0.469):
regin de no rechazo R a 0.496

49.6 regin de rechazo R r


Figura 4.20. Regin de no rechazo y rechazo para el ejemplo 4.20
Fuente: Elaboracin propia

157
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iv) Por ltimo se aplica la regla de decisin, para esto no olvide que t  45 ( p  45 100  0.45 ) y,
con lo cual se concluye que con la realizacin tomada no hay evidencias para rechazar
H 0 : p  0.40 al 2.5% de significancia.
As, se concluye que al 2.5% de significancia y la realizacin obtenida no existen evidencias
para validar la afirmacin del director de la televisora de que p  0.40 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
# 49.6
100(0.6) 
PRechazar H 0 | p  0.40  PT  49.6 | p  0.60  P! Z   PZ 
2.12  0.983.
! 100 ( 0.6)(0.4) 
" 
Si la verdadera proporcin fuera 0.6 la prueba tendra una potencia muy elevada.
EJEMPLO 4.21
Una persona quiere probar estadsticamente si una moneda est cargada haca un lado, para esto lanza
la moneda 200 veces, ocurriendo 80 guilas. Se puede concluir que la moneda est cargada?.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si la moneda est cargada.
c) Calcule la potencia de la prueba, suponiendo que p  0.40 .
Solucin
a) Se pide una prueba de hiptesis para la proporcin de resultados de la moneda, por ejemplo de
guilas, para esto supngase que la moneda no est cargada. Luego, la proporcin es 0.5, contra la
alternativa de que la proporcin sea diferente de 0.5. As, la hiptesis nula ser H 0 : p  0.5 y la
alterna H 1 : p  0.5 .
b) Siguiendo los pasos de la metodologa
i) H 0 : p  0.5 contra H 1 : p  0.5 .
ii) Nivel de significancia   0.05 .
iii)Se est ante una situacin similar a la del inciso (c) del Teorema 4.9, con p0  p1  0.5 .
Luego, se requiere calcular la CC: Para la suma np0  $
1 ( 2) np0 q0 y
np0  $
1 (1
 2) np0 q0 .

As, de las tablas porcentuales para la distribucin normal estndar, $


1 (0.025) 
1.96 y

1
$ (0.975)  1.96 . Por otro lado, p0  0.5 , n  200 . Finalmente, la regla de decisin.
Rechazar: H 0 : p  0.5 , si

t np0  $
1 ( 2) np0 q0  200(0.5)
1.96 200(0.5)(0.5)  86.14
t  np0  $
1 (1
 2) np0 q0  200(0.5)  1.96 200(0.5)(0.5)  113.86 .
Es decir, rechazar H 0 : p  0.5 si t 86.14 o t  113.86 . Grficamente se tiene:

regin de rechazo R r regin de rechazo R r


86.14 regin de no rechazo R a 113.86
Figura 4.21. Regin de no rechazo y rechazo para el ejemplo 4.21

158
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Fuente: Elaboracin propia


iv) Por ltimo se aplica la regla de decisin, para esto no olvide que t  80 , con lo cual se
concluye que, con la realizacin tomada se rechaza H 0 : p  0.5 al 5% de significancia.
As, se concluye que al 5% de significancia y la realizacin obtenida existen evidencias para
concluir que la moneda est cargada.
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo
PRechazar H 0 | p  0.40  PT 86.14 I T  113.86 | p  0.40
# 86.14
200(0.4)  # 113.86
200(0.4) 
 P! Z  P! Z 
! 200(0.4)(0.6)  ! 200(0.4)(0.6) 
" "
 PZ 0.89  P( Z  4.89)  0.8133
Si la verdadera proporcin de guilas fuera 0.4 la prueba tendra una potencia elevada.
Cmo comparar proporciones de dos poblaciones?
Con frecuencia se tienen problemas en los que se desean comparar qu producto es ms
aceptado por lo consumidores, el producto A o el B, por tal razn, los investigadores o gerentes de
negocios requieren de resultados estadsticos que justifiquen sus aseveraciones.
Sean dos muestras aleatorias X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 independientes de distribuciones
tipo Bernoulli con parmetros p1 y p 2 , respectivamente. Se desea llevar a cabo una prueba de
hiptesis para la diferencia p1
p 2 , en el caso de muestras grandes. Para esto se necesita su estimador,
dado por P1
P2  X
Y y en la aproximacin con el Teorema de Limite Central note que
pq p q ( P
P2 )
( p1
p 2 )
E ( P1
P2 )  p1
p 2 y V ( P1
P2 )  1 1  2 2 . Finalmente, Z  1 .
n1 n2 p1 q1 p 2 q 2

n1 n2
Resultando los dos parmetros en el denominador y al buscar la mejor prueba no se pueden
eliminar. Por tal razn, se usa una estimacin puntual para p1 y p 2 en el denominador, sustituyndolos
por p1 y p 2 , valores de P1 y P2 , respectivamente, obtenidos de una realizacin previa de la muestra.
Quedando la estadstica de prueba que aproximar,
( P1
P2 )
( p1
p 2 )
Z .
p 1 q1 p 2 q 2

n1 n2
Ntese que en esta situacin slo se consideran las proporciones, ya con que las sumas su
T
T2
(n1 p1
n2 p 2 )
estadstica de prueba ser Z  1 y slo se puede utilizar cuando n1  n2 .
n1 p 1 q1  n2 p 2 q 2

TEOREMA 4.10
Sean X 1 , X 2 , , X n1 y Y1 , Y2 , , Yn2 dos muestras aleatorias independientes de Ber( p1 ) y
Ber( p 2 ) , respectivamente, entonces se pueden tener alguno de los siguientes contraste de hiptesis
con tamaos de muestras grandes.
a) H 0 : p1
p 2  p0 contra H 1 : p1
p 2 p0 , entonces la prueba de tamao , para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn1 y y1 , y 2 , , y n2

159
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

p 1 q1 p 2 q 2
Rechazar H 0 : p1
p 2  p0 , si CC: p 1
p 2 p 0  $
1 ( ) 
n1 n2
b) H 0 : p1
p 2  p0 contra H 1 : p1
p 2  p0 , entonces la prueba de tamao , para   (0, 1)
estar dada por la siguiente regla de decisin para una realizacin x1 , x2 , , xn y y1 , y 2 , , y n2

p 1 q1 p 2 q 2
Rechazar H 0 : p1
p 2  p0 , si CC: p 1
p 2  p 0  $
1 (1
 ) 
n1 n2
c) H 0 : p0  p1
p 2  p01 contra H 1 : p1
p 2 p0 p1
p2  p01 entonces la prueba de
tamao , para   (0, 1) estar dada por la siguiente regla de decisin para una realizacin
x1 , x2 , , xn y y1 , y 2 , , y n2 :

p 1 q1 p 2 q 2
Rechazar H 0 : p0  p1
p 2  p01 , si CC: p 1
p 2 p 0  $
1 ( 2) 
n1 n2

p 1 q1 p 2 q 2
p 1
p 2  p 01  $
1 (1
 2) 
n1 n2

Con p0 , p01  0, 1, valores conocidos de antemano, q k  1


p k y p k  x k , $
1 (H ) representa el
cuantil H de la distribucin normal estndar para H  (0, 1) , Z H representa el valor de la
variable normal estndar cuya rea a la derecha es H  (0, 1) .

Se pueden usar otras formas para obtener una estimacin puntual de la varianza:
pq p q
V ( P1
P2 )  1 1  2 2 .
n1 n2
p 1  p 2
 Sustituyendo p1 y p 2 por un promedio de sus estimadores, es decir p  , se tendra
2
( P1
P2 )
( p1
p 2 )
Z .
#1 1
pq !!  
" n1 n 2 
 Sustituyendo p1 y p2 por un promedio ponderado de sus estimadores, es decir
~ n p  n 2 p 2 t t
p 1 1  1 2 , se tendra
n1  n 2 n1  n 2

( P1
P2 )
( p1
p 2 )
Z .
~ #1 1
pq~!!  
n
" 1 n 2 

p 1q1 p 2 q 2
Aproximaciones de  que son mucho muy buenas an cuando existen diferencias
n1 n2
extremas entre p1 y p 2 . Por ejemplo, si n1  400, t1  40 & p 1  0.1 y n2  200, t 2  160& p 2  0.8
p 1 q1 p 2 q 2 0.1(0.9) (0.8)(0.2)
a)     0.001025 0.03202.
n1 n2 400 200

160
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

p 1  p 2 0.1  0.8 #1 1 # 1 1
b) p    0.45 , luego pq !!    0.45(0.55)!
    0.04308.
2 2 " n1 n 2  " 400 200

t t 40  160 1 ~ #1 1 1#2 # 1 1
c) ~p  1 2   , luego pq~!!  
 ! !    0.04082
n1  n 2 400  200 3 " n1 n 2  3 " 3 " 400 200

Situaciones que mejoran cuando no hay diferencias extremas entre p1 y p 2 o cuando el tamao
de las muestras aumenta. Por ejemplo, n1  400, t1  200& p 1  0.5 y n2  200, t 2  80 & p 2  0.4
p 1 q1 p 2 q 2 0.5(0.5) (0.4)(0.6)
a)     0.04272
n1 n2 400 200

p 1  p 2 0.5  0.4 #1 1 # 1 1
b) p    0.45 , luego pq !!    0.45(0.55)!
    0.04308.
2 2 " n1 n 2  " 400 200

t t 200  80 #1 1 # 1 1
c) ~p  1 2   0.467 , luego ~
pq~!!    0.4670.533!    0.04321.
n1  n 2 400  200 
" n1 n 2  " 400 200
Es decir, si se quieren utilizar alguna de las otras dos estimaciones para la varianza no se tendrn
diferencias significativas en las pruebas. Para finalizar note que en muchos textos prefieren utilizar el
promedio ponderado de p1 y p 2 . Si algn lector quiere utilizar este promedio slo necesita cambiar
en el Teorema anterior

p 1q1 p 2 q 2 ~ #1 1 #1 1
 por pq~!!   o en su caso por pq !!  .

n1 n2 " n1 n2  " n1 n 2 
EJEMPLO 4.22
Una firma manufacturera de cigarros distribuye dos marcas 1 y 2. El gerente de ventas desea saber si
alguna de las marcas aventaja a la otra, para esto realiza dos encuestas independientes, resultando que
56 de 200 fumadores prefieren la marca 1 y que 29 de 150 fumadores prefieren la marca 2. Puede el
gerente concluir que la marca 1 aventaja en ventas a la marca 2?
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 6% pruebe si es valida la conclusin.
c) Realice la prueba anterior utilizando la media ponderada de las proporciones y verifique que no
existen diferencias significativas con el inciso (b).
d) Calcule la potencia de la prueba, suponiendo que p1
p 2  0.08 .
Solucin
a) Se pide una prueba de hiptesis para una diferencia de proporciones de consumidores de cigarros
de las marcas 1 y 2. La suposicin que se hace es p1  p 2 , as la opuesta ser p1  p 2 (el signo de
igualdad se encuentra en la opuesta). Por tal razn, H 0 : p1  p 2 y H 1 : p1  p 2 .
b) Siguiendo los pasos de la metodologa, pasando las hiptesis a una diferencia de proporciones
i) H 0 : p1
p2  0 contra H1 : p1
p2  0 .
ii) Nivel de significancia   0.06 .

161
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

iii)Se est ante una situacin similar a la del inciso (b) del Teorema 4.10. Luego, se requiere
p 1 q1 p 2 q 2
calcular la CC: p 0  $
1 (1
 )  . As, de tablas porcentuales para la distribucin
n1 n2
normal estndar, $
1 (0.94)  1.5548 . Por otro lado, n1  200, t1  56 & p 1  56 200  0.280 y
n2  150, t 2  29 & p 2  29 150  0.193 . Finalmente, la regla de decisin.
Rechazar: H 0 : p1
p 2  0 , si

p 1 q1 p 2 q 2 0.28(0.72) 0.193(0.807)
p 1
p 2  p 0  $
1 (1
 )   0  1.5548   0.070 .
n1 n2 200 150

Es decir, rechazar H 0 : p1
p 2  0 si p 1
p 2  0.070 . Grficamente se tiene:

regin de no rechazo R a

0.070 regin de rechazo R r


Figura 4.22. Regin de no rechazo y rechazo para el ejemplo 4.22
Fuente: Elaboracin propia.
iv) Por ltimo se aplica la regla de decisin, para esto no olvide que p 1  0.280 y p 2  0.193, de
tal forma que p 1
p 2  0.280
0.193  0.087  0.070 , con lo cual se concluye que con la
realizacin tomada se rechaza H 0 : p1
p 2  0 al 6% de significancia.
As, se concluye que, al 6% de significancia y la realizacin obtenida existen evidencias para
validar la afirmacin de la suposicin del gerente que p1  p 2 .
t t 56  29
c) Se realizan nicamente los clculos necesarios con ~
p 1 2   0.2429.
n1  n 2 200  150
Rechazar: H 0 : p1
p 2  0 , si

#1 1 # 1 1
p 1
p 2  p 0  $
1 (1
 ) ~
pq~!!    0  1.5548 0.2429(0.7571)!    0.072 .
" n1 n 2  " 200 150 

Es decir, rechazar H 0 : p1
p 2  0 si p 1
p 2  0.070 . Grficamente se tiene:

regin de no rechazo R a

0.072 regin de rechazo R r


Figura 4.23. Regin de no rechazo y rechazo para el ejemplo 4.22
Fuente: Elaboracin propia
As, se ha obtenido la misma conclusin que en el inciso (b).
d) Para calcular la potencia de la prueba se utiliza la regin de rechazo
#
! 
 !
PRechazar H 0 | p1
p 2  0  P P1
P2  0.070 | p1
p 2  0.08  P! Z 
 0.070
0.080 

! 0.28(0.72) 0.193(0.807) 
!  
" 200 150 
 PZ 
0.22  0.5871

162
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

Calculando la potencia con el promedio ponderado, resulta:


#
! 
! 

PRechazar H 0 | p1
p 2  0   P P1
P2  0.072 | p1
p 2  0.08  P! Z   0.072
0.080

! # 1 1 
! 0.2429(0.7571)!   
" " 200 150  
 PZ 
0.173  0.5687
Valor muy prximo al obtenido de 0.5871 con la estimacin previa, con esto se ha verificado
que se puede usar una u otra frmula.
EJEMPLO 4.23
Dos empresas televisivas compiten por la audiencia a una determinada hora, el director de la empresa 1
afirma que la proporcin de televidentes que ve su programa a esa hora excede la proporcin de
televidentes de la empresa 2 exactamente en 0.20. Para probar la afirmacin se realizan dos encuestas
independientes, resultando que 650 de 1000 televidentes prefieren la programacin de la televisora 1 y
que 380 de 800 prefieren la programacin de la televisora 2.
a) Plantee un contraste de hiptesis adecuado para el problema.
b) Al nivel de significancia del 5% pruebe si es valida la afirmacin.
c) Calcule la potencia de la prueba, suponiendo que p1
p 2  0.15 .
Solucin
a) Se pide una prueba de hiptesis para una diferencia de proporciones de audiencia televisiva de las
televisoras 1 y 2. La afirmacin que se hace es p1
p 2  0.20 , as la opuesta ser p1
p 2  0.20 .
Luego, las hiptesis H 0 : p1
p2  0.20 y H 1 : p1
p2  0.20 .
b) Siguiendo los pasos de la metodologa
i) H 0 : p1
p2  0.20 contra H1 : p1
p2  0.20 .
ii) Nivel de significancia   0.05 .
iii) Se est ante una situacin similar a la del inciso (c) del Teorema 4.10, con p01  p0  0.20 , y
p 1 q1 p 2 q 2 p 1 q1 p 2 q 2
se requiere calcular la CC: p 0  $
1 ( 2)  y p 01  $
1 (1
 2)  .
n1 n2 n1 n2
As, de las tablas porcentuales para la distribucin normal estndar, $
1 (0.025) 
1.96 y
$
1 (0.975)  1.96 . Por otro lado, n1  1000, t1  650 & p 1  1000
650
 0.650 y n2  800, t 2  380 &
p 2  800
380
 0.475 . Finalmente, la regla de decisin.
Rechazar: H 0 : p1
p2  0.20 , si
p 1 q1 p 2 q 2 0.65(0.35) 0.475(0.525)
p 1
p 2 p 0  $
1 ( 2)   0.20
1.96   0.1545 o
n1 n2 1000 800
p 1 q1 p 2 q 2 0.65(0.35) 0.475(0.525)
p 1
p 2  p 01  $
1 (1
 2)   0.20  1.96   0.2455 .
n1 n2 1000 800
Es decir, rechazar H 0 : p1
p2  0.20 si p 1
p 2 0.1545 o p 1
p 2  0.2455 . Grficamente
se tiene:

163
Metodologa de Pruebas de Hiptesis para los parmetros de una distribucin normal

regin de rechazo R r regin de rechazo R r


0.1545 regin de no rechazo R a 0.2455
Figura 4.24. Regin de no rechazo y rechazo para el ejemplo 4.23
Fuente: Elaboracin propia
iv) Por ltimo se aplica la regla de decisin, con p 1  0.650 y p 2  0.475, de tal forma que
p 1
p 2  0.650
0.475  0.175 0.1545, 0.2455,. Luego, se concluye que con la realizacin
tomada no hay evidencias para rechazar H 0 : p1
p2  0.20 al 5% de significancia.
Se concluye: Al 5% de significancia y la realizacin obtenida que no existen evidencias para
rechazar la afirmacin del director del programa televisivo 1 de que p1
p 2  0.20 .
c) Para calcular la potencia de la prueba se utiliza la regin de rechazo

 
P Rechazar H 0 | p1
p 2  0  P ( P1
P2 0.1545) I ( P1
P2  0.2455) | p1
p 2  0.15
# #
!  ! 
! 0.1545
0.15  ! 0.2455
0.15 .
 P! Z   P! Z  
! 0.65(0.35) 0.475(0.525)  ! 0.65(0.35) 0.475(0.525) 
!   !  
" 1000 800  " 1000 800 
 P Z 0.19  PZ  4.11  0.5754

164
Captulo 5
Pruebas de bondad de ajuste
Introduccin

E
l problema general para la determinacin de la distribucin de procedencia de los datos es tan
antiguo como complejo y, en la Estadstica se le suele llamar Prueba de bondad de ajuste
o ajuste de curvas. Su planteamiento general est relacionado con las pruebas de hiptesis.
En qu consiste una prueba de bondad de ajuste?
El problema de ensayar la bondad de ajuste de las distribuciones tericas a las distribuciones
muestrales es esencialmente el mismo que el de decidir si hay diferencias importantes entre los valores
de la poblacin y la muestra.
Generalmente, las pruebas estn basadas en la hiptesis nula de que no hay diferencias
significativas entre la distribucin muestral y la terica. Es decir:
H 0 : FX ( x, )  F0 ( x, )
H 1 : FX ( x, )  F0 ( x, )
donde F0 ( x, ) es la distribucin que se supone sigue la muestra aleatoria. La hiptesis alternativa
siempre se enuncia que los datos no siguen la distribucin supuesta. Si se desea examinar otra
distribucin especfica, deber realizarse de nuevo otra prueba suponiendo que la hiptesis nula tiene
esta nueva distribucin. Al especificar la hiptesis nula, el conjunto de parmetros definidos por
puede ser conocido o desconocido. En caso de que los parmetros sean desconocidos, es necesario
estimarlos mediante alguno de los mtodos de estimacin.
En este captulo se revisarn dos de las principales pruebas de bondad de ajuste; a saber, la
prueba ji-cuadrada (paramtrica), la prueba de Kolmogorov-Smirnov(no paramtrica); para el caso de
la normal se revisar la prueba de Shapiro-Wilk.
Definicin 5.1
Una prueba de bondad de ajuste es un procedimiento estadstico para probar la hiptesis de
que una funcin de distribucin particular ajusta un conjunto de datos observados sin especificar
una hiptesis alternativa39.
Sea X 1 , X 2 ,, X n una muestra aleatoria de una funcin de densidad FX (x) . Cuando se enfrenta
el problema de construir una prueba de bondad de ajuste para la hiptesis nula
H 0 : FX ( x, )  F0 ( x, )
H 1 : FX ( x, )  F0 ( x, )

39
Murray R. Spiegel. 1976. Probabilidad y Estadstica.pp. 217

165
Pruebas de bondad y ajuste

Donde F0 ( x, ) es una familia de distribuciones, no se cuenta con un criterio general para


construirla. Sin embrago al revisar la literatura se observa que muchas pruebas se han obtenido con
base en alguno de los siguientes criterios.
PRUEBAS BASADAS EN LA FUNCIN DE DISTRIBUCIN EMPRICA
Estas pruebas estn basadas en una comparacin de la funcin de distribucin emprica (f.d.e.) con la
funcin de distribucin terica. La estadstica de prueba es de la forma
T1  d1 F0 ( x, ), Fn ( x, )
Donde d1 F0 ( x, ), Fn ( x, ) es una funcin de distancia y Fn ( x, ) denota la funcin de
distribucin emprica la cual se define como
# de xis x
Fn ( x, ) 
n
Donde las xis son una realizacin de la muestra aleatoria. Como ejemplo de este criterio
empleado est la prueba de ji-cuadrada paramtrica y la de Kolmogorov-Smirnov
PRUEBAS DE CORRELACIN Y REGRESIN
Sea F0 ( x, ) una funcin de distribucin que depende nicamente de parmetros de localidad y escala,
  R y  2  0 . Sea X 0  X (1) , X ( 2) ,, X ( n)  el vector de estadsticas de orden correspondientes a
la muestra aleatoria X 1 , X 2 ,, X n . Sea Z 0  Z (1) , Z ( 2) ,, Z ( n)  una muestra aleatoria ordenada de la
funcin de distribucin F0 ( x, ) con parmetros   0 y   1 y sean m  m1 , m2 ,, mn  y V  vij 
el vector de medias y la matriz de varianzas y covarianzas de Z 0 , respectivamente. Entonces
d
X (i )    Z (i ) , i  1,, n

Una prueba de correlacin compara dos estimadores de  2 . Un ejemplo de este tipo es la prueba
de Shapiro-Wilk(1965) para probar normalidad.
Se pueden mencionar otros algoritmos con los cuales se disean otras pruebas de bondad de
ajuste como las pruebas basadas en la funcin caracterstica emprica, pruebas basadas en momentos,
pruebas basadas en caracterizaciones, etctera. Pero slo es de inters para el estudio las pruebas
mencionadas inicialmente.
5.1 PRUEBA JI-CUADRADA (PARAMTRICA)
Sea X 1 , X 2 ,, X n una muestra aleatoria de tamao n, de alguna funcin de densidad; la prueba ji-
cuadrada (paramtrica) para el juego de hiptesis
H 0 : la distribucin es f ( x; )
H1 : la distribucin no es f ( x; )
Se basa en la comparacin de las frecuencias observadas por clase, contra las frecuencias
esperadas o tericas, suponiendo que H 0 es cierta, es decir, que la distribucin poblacional es f ( x; ) .
Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en intervalos
de clase, preferentemente del mismo tamao,
El estadstico de prueba est definido por:
k
(ni
npi ) 2
c2  8 .
i 1 npi
166
Pruebas de bondad y ajuste

En donde
ni es el nmero de datos en la clase i.
n es tamao de la muestra.
p i es la probabilidad de que la variable aleatoria X (poblacional) tome valores en el intervalo i
En ocasiones se simboliza
ni  Foi frecuencia observada
npi  Fei frecuencia esperada
Para ver qu distribucin sigue el estadstico c2 se considera la siguiente situacin:
Suponga que las observaciones de la muestra pueden clasificarse en dos intervalos o categoras
Y1 y Y2 . Sea Y1 el nmero de observaciones que caen en la categora uno y sea p1 su respectiva
probabilidad.
Si el tamao de muestra es lo suficientemente grande, Y1 (sigue una distribucin binomial)
puede aproximarse por una distribucin normal con valor esperado np1 y varianza np1 (1
p1 ) . Por lo
tanto, la variable Z definida a continuacin sigue una distribucin normal estndar, y Z 2 una
distribucin ji cuadrada con un grado de libertad.
2

  Y1
np1  ~ 2 .
Y1
np1 # Y
np 2
Z ~ N (0,1) y Z  !
2 1 1

np1 (1
p1 ) ! np (1
p )  np1 (1
p1 )
1
" 1 1 

Si se define Y2 como Y2  n
Y1 y p2  1
p1 se tiene que Z 2 se puede representar de la
siguiente manera
2

  Y2
np2   Y1
np1   Y2
np2  ~ 2 .
# Y
np 2 2 2
Z !
2 2 2
! np (1
p )  np2 (1
p 2 ) np1 np2
1
" 2 2 

Ahora supngase que las observaciones pueden clasificarse no en dos sino en k clasificaciones
mutuamente excluyentes, y sean Yi y p i el nmero de variables que caen en la categora i y la
probabilidad respectiva. La distribucin conjunta de Y1 , Y2 ,, Yk tiene una distribucin multinomial
con parmetros n, p1 , p2 ,, pn ; donde pk  1
p1
p2

pk
1 . Se puede demostrar que la
variable aleatoria Z 2 , definida a continuacin, sigue una distribucin ji-cuadrada con k-m-1 grados de
libertad.
Y1
np1 2  Y2
np2 2 Yk
npk 2 k
Yi
npi 2
Z2   8 ~ k2
m
1
np1 np2 npk i 1 npi
Comparando la expresin anterior con el estadstico c2 definido previamente, se observa que
este estadstico sigue tambin la distribucin ji-cuadrada con k-m-1 grados de libertad, siendo k el
nmero de clases en la tabla de distribucin de frecuencias y m el nmero de parmetros estimados
para definir completamente la funcin f ( x; ) .
Regla de decisin:
Rechazar H 0 : la distribucin es f ( x; ) , al nivel de significancia  , si: c2  t2 (k
m
1,  ) .

167
Pruebas de bondad y ajuste

NOTA:
Se debe cuidar que la frecuencia en cada una de las clases construidas en la tabla de
frecuencias sean mayores o iguales a 5, en caso contrario se agrupan las clases contiguas,
para que su frecuencia sea mayor o igual a 5.

La ventaja de esta prueba es que se aplica tanto para variables aleatorias continuas como
discretas

Zona de

Punto crtico
Figura 5.1. Zona de rechazo y punto crtico de la prueba ji-cuadrada
Fuente: Elaboracin propia.

Algunas consideraciones que hay que tener en cuenta con respecto a la aplicacin de esta prueba
son las siguientes:
a) El nmero de intervalos de clase debe ser por lo menos cinco. Para facilidad de los clculos y la
identificacin de la posible distribucin se recomienda que k  20 .
b) El nmero esperado de observaciones en cada intervalo debe ser mayor o igual a cinco, en caso
contrario, deberan agruparse varios intervalos para lograr esto.
c) Al realizar los clculos para p i hay que tener en cuenta los intervalos extremos como casos
especiales, a saber:
Calculo de p1
Aunque el primer intervalo incluye aquellos valores observados que estn entre X 0 y X 1 , slo
corresponde a los resultados de una muestra. El hecho de que no se hayan observado en la muestra
valores  X 0 no implica que en la poblacin de donde se toma la muestra no se puedan presentar
valores  X 0 . Por lo tanto, el clculo de p1 corresponde a la probabilidad de que la variable aleatoria
sea menor o igual que X 1 , y no nicamente entre X 0 y X 1 . Es decir
x1

p1  P( X x1 )  P(
 X x1 )  ; f ( x)dx  F ( x ) para el caso continuo.


1

x1
p1  P( X x1 )  P(
 X x1 )  8 f ( x)dx  F ( x1 ) para el caso discreto.



168
Pruebas de bondad y ajuste

Calculo de p n
De manera similar, el ltimo intervalo corresponde no slo a los valores que estn entre X k
1 y
X k , sino que comprende tambin los valores de la poblacin que sean mayores que X k , as stos no
se hayan presentado en la muestra. Por lo tanto, p k se calcula como
 xk
1

p k  P( X  xk
1 )  P( xk
1  X )  ;
xk
1
f ( x)dx  1
; f ( x)dx  1
F ( x


k
1 ) para el caso continuo.

 xk
1
p k  P( X  xk
1 )  P( xk
1  X )  8 f ( x)dx  1
8 f ( x)dx  1
F ( xk
1 ) para el caso discreto.
xk
1


EJEMPLO 5.1
Sean 180 datos de un proceso de produccin

26.20 29.40 30.30 31.10 31.70 32.60


26.30 29.40 30.30 31.20 31.80 32.60
26.40 29.50 30.30 31.20 31.80 32.60
26.60 29.50 30.40 31.30 31.80 32.70
27.50 29.50 30.50 31.30 31.80 32.70
27.60 29.50 30.50 31.30 31.80 32.70
27.80 29.50 30.50 31.30 31.90 32.70
28.00 29.60 30.50 31.30 31.90 32.70
28.00 29.60 30.50 31.30 31.90 32.70
28.10 29.60 30.50 31.40 31.90 32.70
28.20 29.70 30.50 31.40 31.90 32.80
28.30 29.80 30.50 31.40 31.90 32.80
28.40 29.90 30.60 31.40 32.00 32.80
28.40 29.90 30.60 31.50 32.00 33.00
28.60 29.90 30.70 31.50 32.00 33.00
28.60 29.90 30.70 31.50 32.00 33.10
28.80 29.90 30.70 31.50 32.10 33.10
28.80 30.00 30.70 31.50 32.10 33.20
29.00 30.00 30.70 31.50 32.20 33.30
29.00 30.00 30.70 31.50 32.20 33.40
29.00 30.00 30.80 31.50 32.30 33.50
29.00 30.00 30.80 31.50 32.30 33.50
29.00 30.00 30.90 31.50 32.30 33.50
29.10 30.00 31.00 31.60 32.40 33.60
29.10 30.10 31.00 31.60 32.40 33.60
29.10 30.10 31.00 31.60 32.40 33.60

169
Pruebas de bondad y ajuste

29.20 30.20 31.10 31.60 32.50 33.90


29.20 30.20 31.10 31.60 32.60 34.10
29.40 30.30 31.10 31.70 32.60 35.30
29.40 30.30 31.10 31.70 32.60 35.30
Tabla 5.1 Datos de la muestra para probar normalidad del ejemplo 5.1.
Fuente: Produccin de una boquilla en la fabricacin de pay de nuez empresa
BIMBO.
a) Pruebe si los datos provienen de una distribucin normal e indique sus parmetros, con un nivel de
significancia del 5%.
b) Pruebe si los datos provienen de una distribucin exponencial e indique su parmetro, con un nivel
de significancia del 5%.
Solucin
a) Calculando la media y desviacin estndar, se tiene que   30.9;   1.7 .
El nmero de intervalos de clase es k  n  180  13.41 9 13 .
X max
X min 35.3
26.2
La amplitud del intervalo est dada por: KX    0.7 .
k 13
Las hiptesis formuladas son:
H 0 : la distribucin es f ( x)  N  , 2  
H1 : la distribucin es f ( x)  N  ,  2

En este caso el nmero de intervalos es reducido a 10 debido a que la frecuencia en cada una de
las clases construidas es menor a 5.

Histogram a por clases de frecuencia


Clases Frecuencia 40

26.2 26.9 4 35
26.9 27.6 2
28.3 6 30
27.6
28.3 29.0 11 25
Frecuencia

29.0 29.7 18
20
29.7 30.4 23
30.4 31.1 27 15
31.1 31.8 35
10
31.8 32.5 21
32.5 33.2 21 5
33.2 33.9 9
0
33.9 34.6 1
26.9

28.3

29.7

31.1

32.5

33.9

35.3

34.6 35.3 2
Tabla 5.2 Clases de frecuencia para los datos Figura 5.2. Histograma de las clases de frecuencia
de la muestra del ejemplo 5.1. para los datos de la muestra del ejemplo 5.1.

170
Pruebas de bondad y ajuste

En la tabla 5.2 se puede observar que algunas clases son menores a 5, por lo tanto se procede a
juntarlas, quedando de las 13 clases, slo 10 clases, que se muestran en la tabla 5.3. Por otro lado, de
la figura 5.2 se puede suponer que los datos tienen una distribucin normal con

  x  30.9 y  2  s n2
1  2.763 .
Luego,
 
H 0 : la distribucin es f ( x; )  N  ,  2  N 30.9, 2.763
En la tabla 5.3 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.

Clase Intervalos para (ni


npi ) 2
i calcular pi ni pi npi (ni
npi ) 2 npi

1 (
, 27.6, 6 0.0236 4.24 3.097 0.7304
2 (27.6,28.3] 6 0.0353 6.36 0.130 0.0204
3 (28.3, 29.0] 11 0.0676 12.17 1.373 0.1128
4 (29.0, 29.7] 18 0.1087 19.56 2.430 0.1243
5 (29.7, 30.4] 23 0.1466 26.39 11.493 0.4355
6 (30.4, 31.1] 27 0.1661 29.90 8.401 0.2810
7 (31.1, 31.8] 35 0.1580 28.44 43.002 1.5119
8 (31.8, 32.5] 21 0.1262 22.72 2.956 0.1301
9 (32.5, 33.2] 21 0.0847 15.24 33.200 2.1788
10 (33.2, ) 12 0.0832 14.98 8.886 0.5932
Suma= 1 Suma= 6.1183
Tabla 5.3. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.1.
El valor crtico con un nivel de significancia del 5% y 7 grados de libertad es de 2 ,7   14.067 ,
mientras que el valor calculado es c2  6.18 . Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos se considera normal al 5% de
significancia.

b) Suponiendo que los datos fuesen de una distribucin exponencial (aunque grficamente se puede
notar que no es cierto) con parmetro   x  30.9 , se tendran los clculos en la tabla siguiente.

Clase Intervalos para (ni


npi ) 2
i calcular pi ni pi npi (ni
npi ) 2 npi

1 (0, 27.6, 6 0.5907 106.32 10063.78 94.66


2 (27.6,28.3] 6 0.0092 1.65 18.92 11.46
3 (28.3, 29.0] 11 0.0090 1.61 88.11 54.61
4 (29.0, 29.7] 18 0.0088 1.58 269.71 170.99
171
Pruebas de bondad y ajuste

5 (29.7, 30.4] 23 0.0086 1.54 460.45 298.61


6 (30.4, 31.1] 27 0.0084 1.51 649.87 431.11
7 (31.1, 31.8] 35 0.0082 1.47 1124.02 762.74
8 (31.8, 32.5] 21 0.0080 1.44 382.57 265.55
9 (32.5, 33.2] 21 0.0078 1.41 383.83 272.53
10 (33.2, ) 12 0.3415 61.47 2447.12 39.81
Suma= 1 Suma= 2362.27
Tabla 5.4. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.1.
El valor crtico con un nivel de significancia del 5% y 8 grados de libertad es de 2 ,8   15.507 ,
mientras que el valor calculado es c2  2362.27 . Se concluye que se rechaza la hiptesis nula al 5%
de significancia. Es decir, la distribucin de los datos no es exponencial.
EJEMPLO 5.2
Se tiene un registro de 216 tiempos entre arribos
3.1933 0.9142 2.7091 3.9281 1.1101 9.1785 1.4162 1.3039 1.0144
0.3186 0.4052 3.3162 0.7962 0.4778 4.9481 15.2004 0.1735 2.1878
0.2348 1.8896 3.1902 1.9685 0.5281 4.6458 1.8998 4.6516 0.1636
5.7121 3.5129 7.6548 4.9391 2.5997 0.4404 2.8290 4.4030 0.8712
2.9397 0.2703 0.4082 3.5320 0.6529 0.7684 1.2494 2.8566 0.3726
6.3768 1.1121 0.4341 0.7187 1.9107 5.1640 1.6052 0.7313 1.3185
2.0582 0.9842 3.3089 1.4928 2.3992 1.6215 1.8091 3.3751 2.1955
11.3710 2.4456 1.7738 3.0997 1.1489 3.3592 1.6194 3.3981 0.0970
2.4698 6.3627 0.9812 2.4668 4.3419 1.8849 0.0011 5.0624 2.3348
1.7021 0.4020 1.7935 0.9104 0.6406 1.8252 2.6237 0.8437 15.5092
0.8592 1.0659 0.7223 0.6239 5.4144 1.0110 1.0128 10.9106 0.2196
0.1189 2.1342 2.4349 2.1701 0.6652 0.7266 0.5550 0.1591 0.5087
0.5822 2.6087 5.7818 2.4864 1.7495 0.8407 0.9036 1.5221 0.2055
0.8273 1.8993 12.6327 0.7407 21.7329 2.5855 0.3953 3.1247 0.2754
0.1582 1.1361 0.8085 0.2136 1.3256 0.6398 1.5186 1.9061 1.9262
3.7217 0.5528 6.0427 2.1682 2.4996 3.5699 6.1171 0.6276 2.2079
3.1454 10.0600 1.6509 3.5661 2.9409 0.8942 2.4918 0.0821 1.0167
2.9468 0.9608 2.4018 1.3764 4.9092 4.8111 1.1412 1.7820 0.6547
1.7322 1.9183 1.8730 1.4078 0.4248 0.8235 0.5157 0.9726 1.3358
0.9965 2.5227 1.4850 1.5430 107146 0.6154 1.8379 0.6012 2.3768
1.8164 2.4739 6.3317 3.1607 12.0092 8.9375 2.1157 0.7986 0.6039
0.6377 0.1263 0.5425 1.3429 0.6981 0.4402 2.0588 4.4003 0.1992
3.7545 0.8246 0.1868 2.6892 0.7079 1.2457 1.0063 4.3017 4.2455
1.4366 0.0439 2.9099 0.2979 1.7472 1.9802 1.3339 0.4536 0.8065
Tabla 5.5 Datos de la muestra para probar exponencialidad del ejemplo 5.2.

172
Pruebas de bondad y ajuste

Pruebe si los datos provienen de una distribucin exponencial, con un nivel de significancia del 5% e
indique su parmetro.
Solucin
Calculando la media se tiene que   2.39 y por tanto 1   0.418 .
El nmero de intervalos de clase es k  n  216  14.69 9 14 .
X max
X min 21.73
0.0011
La amplitud del intervalo est dada por: KX    1.55 .
k 14
Las hiptesis formuladas son:
H 0 : la distribucin es f ( x)  exp1  
H1 : la distribucin es f ( x)  exp1  
En este caso el nmero de intervalos es reducido a 8 debido a que la frecuencia en cada una de
las clases construidas es menor a 5.

clases Frecuencia
0.001 0.720 52
0.720 1.438 48
1.438 2.157 36
2.157 2.875 26
2.875 3.594 19
3.594 5.031 14
5.031 7.904 11
7.904 11.497 10

Tabla 5.6 Clases de frecuencia para los datos Figura 5.3. Histograma de las clases de frecuencia
de la muestra del ejemplo 5.2. para los datos de la muestra del ejemplo 5.2.

En la tabla 5.7 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.

Clase Intervalos para (ni


npi ) 2
i calcular pi ni pi npi (ni
npi ) 2 npi

1 (
, 0.72, 52 0.259 55.94 15.56 0.28
2 (0.72, 1.43] 48 0.195 41.04 48.44 1.18
3 (1.43, 2.15] 36 0.142 30.67 28.39 0.93
4 (2.15, 2.87] 26 0.105 22.68 11.02 0.49

173
Pruebas de bondad y ajuste

5 (2.87, 3.59] 19 0.078 16.85 4.63 0.27


6 (3.59, 5.03] 14 0.100 21.60 57.76 2.67
7 (5.03, 7.90] 11 0.085 18.36 54.17 2.95
8 (7.90, ) 10 0.036 7.78 4.95 0.64
Suma= 1 Suma= 9.41
Tabla 5.7. Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.3.
El valor crtico con un nivel de significancia del 5% y 6 grados de libertad es de 2 ,6   12.59 ,
mientras que el valor calculado es c2  9.41. Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos es exponencial con 1   0.418 .

EJEMPLO 5.3
Se tienen 176 registros de las cantidades de demanda de un producto

1 4 4 1 0 3 2 1 3 0 1 1 1 1 0 3 0 1 0 0 1 2
2 0 1 1 4 0 1 0 0 0 0 7 4 5 0 1 0 1 1 8 3 0
1 3 12 1 0 1 1 0 0 0 3 3 0 0 4 0 0 2 2 0 0 0
0 1 2 3 1 5 0 0 2 8 0 2 3 3 2 1 0 0 4 3 1 2
2 1 1 0 8 1 0 5 0 0 0 0 2 0 6 1 2 8 6 0 0 0
0 1 1 2 0 0 1 0 4 3 0 0 2 4 2 3 0 1 1 1 1 2
2 0 2 4 5 0 1 2 2 0 0 2 1 1 2 0 5 10 3 1 2 4
2 1 2 0 1 4 10 0 4 4 5 4 9 1 10 0 6 1 2 9 5 0
Tabla 5.8 Datos de la muestra para probar si tienen distribucin geomtrica del ejemplo 5.3.

Pruebe si los datos provienen de una distribucin geomtrica, con un nivel de significancia del 5% e
indique su parmetro.

Solucin
Calculando la media se tiene que   1.96 y por tanto p  1   0.5
Se han construido 8 intervalos.
Como la distribucin es discreta, los intervalos son esencialmente subconjuntos de valores de la
variable, en este caso se han elegido:
I1  {0}, I 2  {1}, I 3  {2}, I 4  {3}, I 5  {4}, I 6  {5}, I 7  {6,7,8}, I 8  {9}
Las hiptesis formuladas son:
H 0 : la distribucin es f ( x)  geo( p)
H1 : la distribucin es f ( x)  geo( p)

174
Pruebas de bondad y ajuste

Intervalo Frecuencia
{0} 58
{1} 42
{2} 27
{3} 14
{4} 14
{5} 7
{6,7,8} 8
{9} 6
Tabla 5.9 Clases de frecuencia para los datos Figura 5.4. Histograma de las clases de frecuencia
de la muestra del ejemplo 5.3. para los datos de la muestra del ejemplo 5.3.

En la tabla 5.10 se presentan los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondientes al nmero de observaciones que caen en l. Igualmente se
presentan los clculos necesarios para realizar la prueba ji cuadrada.

Clase Intervalos para (ni


npi ) 2
i calcular pi ni pi npi (ni
npi ) 2 npi

1 {0} 58 0.35 60.90 8.39 0.14


2 {1} 42 0.23 39.81 4.79 0.12
3 {2} 27 0.15 26.05 0.91 0.03
4 {3} 14 0.10 17.04 9.22 0.54
5 {4} 14 0.06 11.14 8.18 0.73
6 {5} 7 0.04 7.29 0.08 0.01
7 {6,7,8} 8 0.06 9.93 3.71 0.37
8 {9} 6 0.02 3.13 8.22 2.62
Suma= 1 Suma= 4.58
Tabla 5.10 Valores tericos y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.3.

175
Pruebas de bondad y ajuste

El valor crtico con un nivel de significancia del 5% y 6 grados de libertad es de 2 ,6   12.59 ,
mientras que el valor calculado es c2  4.58 . Se concluye que no hay evidencias suficientes para
rechazar la hiptesis nula. Es decir, la distribucin de los datos es geomtrica con p  0.50

5.2 PRUEBA DE KOLMOGOROV-SMIRNOV DE BONDAD DE AJUSTE (NO


PARAMTRICA)
La prueba de Kolmogorov-Smirnov es otra prueba de bondad de ajuste pero del tipo no
paramtrico, es decir en la prueba no se estiman inicialmente los parmetros como en la prueba
anterior.
En la prueba de Kolmogorov-Smirnov es de inters conocer el grado de relacin entre la
distribucin de un conjunto de valores de la muestra (puntajes observados) y alguna distribucin
terica especfica. Determina si razonablemente puede pensarse que los puntajes en la muestra
provengan de una poblacin que tenga esa distribucin terica.
Brevemente, la prueba lleva consigo la especificacin de la distribucin de frecuencia
acumulativa que ocurrira bajo la distribucin terica y su comparacin con la distribucin de
frecuencia observada acumulada. La distribucin terica representa lo esperado conforme a H 0 .
Se determina el punto en el que estas dos distribuciones, la terica y la observada, muestran la
mayor divergencia. La referencia a la distribucin muestral indica si hay probabilidad de
divergencia tan grande con base en el azar. Esto es, la distribucin muestral indica que una
divergencia de la magnitud observada probablemente ocurrira si las observaciones fueran
realmente una muestra aleatoria de la distribucin terica.
Metodologa para aplicar la prueba de Kolomogorov-Smirnov
Paso 1. Ordenar los datos en forma no-decreciente y obtener sus frecuencias observadas (en
caso de repetirse un dato se pone en esta frecuencia).
Paso 2. Calcular las frecuencias acumuladas relativas para cada dato observado, FROi .
Paso 3. Calcular las frecuencias acumuladas relativas esperadas para cada dato, segn sea la
distribucin propuesta en la hiptesis nula, los parmetros de la distribucin se calculan de
la muestra, FREi .
Paso 4. Se calculan los valores absolutos de la diferencia entre las frecuencias acumuladas
observada y terica, | FROi
FREi | .

Paso 5. Evaluar el estadstico de prueba Dcal  max | FROi


FREi | .
i

Al igual que en la prueba ji-cuadrada, las hiptesis a contrastar son


H 0 : la distribucin es f ( x; )
H1 : la distribucin no es f ( x; )
La distribucin de Dcal es conocida y depende del nmero de observaciones n.
Regla de decisin
Se acepta la hiptesis nula de que no existe diferencia significativa entre las distribuciones
tericas y empricas si el valor de Dcal (x) es menor o igual que el valor crtico Dcal ( , x) .
(Ver tabla adjunta para valores crticos).
176
Pruebas de bondad y ajuste

Grficamente quedara explicado de la siguiente manera

Distribucin
Distribucin terica
observada

1 1
2n

1n
1n

Figura 5.5 Distribucin terica y emprica para la prueba de Kolmogorov-Smirnov.


Fuente: Elaboracin propia.
PROPIEDADES DE LA PRUEBA DE KOLMOGOROV-SMIRNOV
a) Esta prueba se puede realizar para valores agrupados en intervalos de clase y tambin para
valores sin agrupar.
b) La prueba de Kolmogorov-Smirnov puede aplicarse para tamaos de muestra pequeos, lo que
no sucede con la ji-cuadrada.
c) La prueba de Kolmogorov-Smirnov es ms poderosa que la Ji-cuadrada, es decir, cuando se
rechaza la hiptesis nula, se tiene una mayor confiabilidad en dicho resultado.
d) La prueba de Kolmogorov-Smirnov debe usarse cuando la variable de anlisis es continua. Sin
embargo, si la prueba se usa cuando la distribucin de la poblacin no es continua, el error que
ocurre en la probabilidad resultante est en la direccin segura. Es decir, cuando se rechaza la
hiptesis nula, se tiene verdadera confianza en la decisin.
EJEMPLO 5.4
Realizar la prueba de bondad de ajuste de Kolmogorov-Smirnov, con un nivel de confianza del
1%, para probar normalidad en los siguientes datos:

59.01 60.01 60.51 61.46 62.46 63.19 63.69 65.41 65.77 66.54

66.86 67.27 67.9 68.06 68.31 68.54 68.99 69.26 69.63 69.9

Tabla 5.11 Datos de la muestra para probar si tienen distribucin normal del ejemplo 5.4.
Solucin
Los datos no sern agrupados, por tanto su frecuencia ser 1.

Frecuencia relativa Frecuencia Valor absoluto


n Datos frecuencia
acumulada observada esperada de diferencia
1 59.01 1 0.05 0.02819 0.02181
2 60.01 1 0.10 0.05259 0.04741
3 60.51 1 0.15 0.06993 0.08007
4 61.46 1 0.20 0.11452 0.08548
5 62.46 1 0.25 0.18010 0.06990

177
Pruebas de bondad y ajuste

6 63.19 1 0.30 0.24045 0.05955


7 63.69 1 0.35 0.28743 0.06257
8 65.41 1 0.40 0.47378 0.07378
9 65.77 1 0.45 0.51510 0.06510
10 66.54 1 0.50 0.60238 0.10238
11 66.86 1 0.55 0.63744 0.08744
12 67.27 1 0.60 0.68070 0.08070
13 67.9 1 0.65 0.74248 0.09248
14 68.06 1 0.70 0.75712 0.05712
15 68.31 1 0.75 0.77906 0.02906
16 68.54 1 0.80 0.79821 0.00179
17 68.99 1 0.85 0.83267 0.01733
18 69.26 1 0.90 0.85141 0.04859
19 69.63 1 0.95 0.87473 0.07527
20 69.9 1 1.00 0.89004 0.10996
media 65.6385 D= 0.10996
var 12.0675292
Tabla 5.12 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.4.

En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt  0.356 . Por lo tanto,
Regin de no rechazo: 0, 0.356, y regin de rechazo (0.356, )
Por lo tanto, no existe evidencia para rechazar que los datos si provienen de una distribucin
normal con media 65.64 y varianza 12.07
EJEMPLO 5.5
Se desea corroborar con la prueba de Kolmogorov-Smirnov si la generacin de nmeros aleatorios en
el programa estadstico R, tiene una distribucin uniforme sobre en intervalo [0,1], con un nivel de
confianza del 1%.
0.01380712 0.01930208 0.02416705 0.03334250 0.04345559 0.05879803 0.06442955
0.07765923 0.08600934 0.10822774 0.10959265 0.10983339 0.15240478 0.16979416
0.17317292 0.19802962 0.20449405 0.20750527 0.20974691 0.21435878 0.22751982
0.23170290 0.23479128 0.24315668 0.24834214 0.25188956 0.25350340 0.28079697
0.28891199 0.29327375 0.29350371 0.29629280 0.31222037 0.31687409 0.32209677
0.34138817 0.35045805 0.35479223 0.36493820 0.36744197 0.37056231 0.38840453
0.40550314 0.43035167 0.43340646 0.45559472 0.46117537 0.47075696 0.47581660
0.48017378 0.48374712 0.49453759 0.50673384 0.51121106 0.52362452 0.52519641
0.53656851 0.54372672 0.54927056 0.55120616 0.55547863 0.57449230 0.57614826
0.57917861 0.58981639 0.59471369 0.62810857 0.64963608 0.65142342 0.66204871
0.68566790 0.69773444 0.70016491 0.70315699 0.73646659 0.74148888 0.74606807

178
Pruebas de bondad y ajuste

0.74702262 0.76108793 0.77312248 0.78544249 0.79937620 0.80856901 0.83212724


0.83954884 0.84760715 0.86192507 0.86496178 0.88581105 0.89467445 0.89676235
0.90706542 0.91006137 0.91934849 0.92015583 0.92849640 0.93128253 0.94217073
0.94875365 0.99949998
Tabla 5.13 Datos de la muestra para probar si tienen distribucin uniforme del ejemplo 5.5.
Solucin
De la tabla los datos se agrupan en 10 clases quedando de la siguiente forma:
Frecuencia relativa acumulada Frecuencia Valor absoluto
clase Datos frecuencia
observada esperada de diferencia
1 [0.0,0.1) 9 0.09 0.1 0.01
2 [0.1,0.2) 7 0.16 0.2 0.04
3 [0.2,0.3) 16 0.32 0.3 0.02
4 [0.3,0.4) 10 0.42 0.4 0.02
5 [0.4,0.5) 10 0.52 0.5 0.02
6 [0.5,0.6) 14 0.66 0.6 0.06
7 [0.6,0.7) 6 0.72 0.7 0.02
8 [0.7,0.8) 10 0.82 0.8 0.02
9 [0.8,0.9) 9 0.91 0.9 0.01
10 [0.9,1.0] 9 1 1 0
D= 0.06
Tabla 5.14 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.5.
En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt  0.163. Por lo tanto,
Regin de no rechazo: 0, 0.163, y regin de rechazo (0.163, ) .
Se concluye que no existe evidencia para rechazar que los datos si provienen de una distribucin
uniforme (0,1) con un nivel de confianza del 5%.
EJEMPLO 5.6
En un periodo de 30 das se registraron 6 das sin accidentes, 2 con un accidente, 1 con dos accidentes,
9 con tres accidentes, 7 con cuatro accidentes, 4 con cinco accidentes y 1 con ocho accidentes.
Realizar la prueba de bondad de ajuste de Kolmogorov-Smirnov, con un nivel de confianza del
1%, para probar si el nmero de accidentes sigue una distribucin Poisson y determine su parmetro.

Solucin
Calculando la media se tiene que
6 % 0  2 %1  1 % 2  9 % 3  7 % 4  4 % 5  1 % 8  87
y por tanto   87 30  2.9
Las hiptesis formuladas son:
H 0 : la distribucin es f ( x)  pois( )

179
Pruebas de bondad y ajuste

H1 : la distribucin es f ( x)  pois( )

Frecuencia relativa Frecuencia Valor absoluto


n Datos frecuencia
acumulada observada esperada de diferencia
1 0 6 0.200 0.055 0.145
2 1 2 0.267 0.215 0.052
3 2 1 0.300 0.446 0.146
4 3 9 0.600 0.670 0.070
5 4 7 0.833 0.832 0.002
6 5 4 0.967 0.926 0.041
7 8 1 1.000 0.997 0.003
D= 0.146
Tabla 5.15 Frecuencias tericas y muestrales para la prueba de bondad de ajuste de los datos muestrales del
ejemplo 5.6.
En este caso, de las tablas de Kolmogorov-Smirnov se tiene que Dt  0.29 . Luego,
Regin de no rechazo: 0, 0.29, y regin de rechazo (0.29, )
Por lo tanto, no existe evidencia para rechazar que los datos si provienen de una distribucin
Poisson(2.9) con un nivel de confianza del 1%.
5.3 PRUEBA DE NORMALIDAD DE SHAPIRO-WILK
Sea x1 , x2 ,, xn una realizacin de X 1 , X 2 ,, X n y se desea probar la hiptesis de que los datos
provienen de una distribucin normal. Es decir, probar las hiptesis
H 0 : X ~ Normal
H1 : X ~= Normal
Para probar normalidad se tienen varias decenas de pruebas, una de ellas es muy propicia cuando
el tamao de la muestra es pequeo, n 50 , corresponde a los autores Samuel S. Shapiro y Martin B.
Wilk y fue publicada en 1965, actualmente se le conoce como prueba de Shapiro-Wilk.
La prueba de Shapiro-Wilk consiste en calcular la estadstica de prueba W suponiendo que la
muestra aleatoria proveniente de una distribucin normal. La estadstica W est dada por:
2 2
# n # k
!! 8 ai x( i )  !! 8 a n
i 1 x( n
i 1)
x(i ) 
"
Wc  n i 1   " i 1  .
(n
1) S n2
1
8 ( xi
x )
i 1
2

Donde
Las x(i ) son los valores de la i-sima estadstica de orden,

a i es el i-simo elemento del vector


mV
1
a  (a1 , a 2 ,, a n )  .
(mV
1 V
1m)1 2

180
Pruebas de bondad y ajuste

Con m  (m1 , m2 ,, mn ) y las m1 , m2 ,, mn son los valores esperados de las estadsticas de
orden de las variables aleatorias independientes e idnticamente distribuidas tomadas de una
distribucin normal estndar de tamao n, y V es la matriz de varianzas y covarianzas de esas
estadsticas de orden y k  n 2, .
Para calcular a, es necesario conocer m y V. sin embargo, ya que V slo se conoce para tamaos
de muestra n  20 , Royston (1995) desarroll un algoritmo para calcular una aproximacin de a para
muestras de tamao 3  n  5000 .
Regla de decisin:
 Rechazar H 0 : X ~ Normal, al nivel de significancia  , si: Wc Wt , ,n
Donde Wt , ,n es un valor de la tabla de Shapiro-Wilk correspondiente a un tamao muestral n y
a un nivel de significacin  .
 Rechazar H 0 : X ~ Normal, al nivel de significancia  , si: Wc es pequeo.
ALGUNAS PROPIEDADES DE W
a) W tiene una distribucin la cual slo depende del tamao de muestra n, para muestras de una
distribucin normal.
b) W es estadsticamente independiente de S 2 y de x , para muestras de una distribucin normal.
c) El mnimo valor de W es na12 (n
1)
d) El mximo valor de W es1.
Para calcular el valor de W dado una muestra aleatoria completa de tamao n, x1 , x2 ,, xn se
procede de la siguiente manera:
Paso 1. Ordenar las observaciones obtenidas en a muestra aleatoria de manera creciente
y1  y2    yn .
n n
Paso 2. Calcular S 2  8 ( yi
y ) 2  8 ( xi
x ) 2
i 1 i 1

Paso 3.
k
a) Si n es par, n  2k , calcular b  8 a n
i 1 ( y n
i 1
yi ) .
i 1

Donde los valores de an


i 1 estn dados en la tabla del anexo.
b) Si n es impar, n  2k  1 y el clculo es similar que en el paso 3 a), donde ak 1  0
cuando n  2k  1 . Entonces se encuentra que
b  an ( yn
y1 )    ak 2 ( yk 2
yk )
Donde el valor de y k 1 , la media muestral, no entra para el clculo de b.
Paso 4. Se calcula W  b 2 S 2
Paso 5. 1,2,5,10,50,90,95,98 y 99% puntos de la distribucin de W, son dados en la tabla
del anexo. Valores ms pequeos de W son significantes, es decir, no indican normalidad.

EJEMPLO 5.7
Se contrastar la normalidad de los siguientes datos muestrales ( n  10 )

181
Pruebas de bondad y ajuste

0.93, 1.20, 1.10, 1.26, 1.38, 1.24, 1.32, 1.14, 1.24, 1.18

Solucin
Paso 1. Se ordenan las observaciones
0.93 1.1 1.14 1.18 1.2 1.24 1.24 1.26 1.32 1.38
n
Paso 2. Calcular S 2  8 ( yi
y ) 2  0.14
i 1

5
Paso 3. Como n es par, entonces b  8 a11
i ( y11
i
yi ) ; de la tabla del anexo se tiene que
i 1

a1 0  0.5739
a9  .3291
a8  .2141
a7  .1224
a6  .0399
5
As, b  8 a11
i ( y11
i
yi )  0.36
i 1

Paso 4. Por lo tanto W  b 2 S 2  0.13 0.14  0.94


La regin crtica es Wt , ,10 , as para diferentes valores de alfa se tiene:
Wt ,0.1 0,1 0  0.869
Wt ,0.0 5,1 0  0.842
Wt ,0.0 1,1 0  0.781
En todos los casos no se rechaza la hiptesis nula, es decir, los datos muestrales siguen una
distribucin normal.

EJEMPLO 5.8
Pruebe la normalidad de la siguiente muestra de pesos en libras de 11 hombres
148, 154, 158, 160, 161, 162, 166, 170, 182, 195, 236

Solucin
n
Paso 2. Dado que los datos ya se tienen ordenados, se procede a calcular S 2  8 ( yi
y ) 2  6226.
i 1

Paso 3. Como n es impar, entonces b  an ( yn


y1 )    ak 2 ( yk 2
yk ) ; de la tabla del anexo se
tiene que

182
Pruebas de bondad y ajuste

a1 1  0.5601
a1 0  0.3315
a9  0.2260
a8  0.1429
a 7  0.0695
As, b  a11( y11
y1 )    a7 ( y7
y5 )  70.08 .
Paso 4. Por lo tanto W  b 2 S 2  4911.31 6226  0.79 .
La regin crtica es Wt , ,11 , as para diferentes valores de alfa se tiene:
Wt , 0.1 0,1 1  0.876
Wt , 0.0 5,1 1  0.850
Wt , 0.0 1,1 1  0.792
En todos los casos no se rechaza la hiptesis nula, es decir, los datos muestrales siguen una
distribucin normal.
5.4 EVALUACIN DE UNA PRUEBA DE BONDAD DE AJUSTE
La forma ms comn de evaluar una prueba de bondad de ajuste consiste en obtener su potencia contra
una distribucin alternativa completamente especificada. Sin embargo, debido a que en muchos casos
es difcil (o no es posible) calcular la potencia de una prueba analtica, tpicamente se recurre al uso de
simulacin de Monte Carlo.

183
Conclusiones

Conclusiones
La Inferencia Estadstica es, realmente, la parte ms interesante y con mayor cantidad de
aplicaciones en problemas concretos; en sta, las pruebas de hiptesis juegan un papel
trascendental como herramienta en mbitos donde se pueden contrastar la teora frente a la
observacin.
De la poca bibliografa en espaol que se tiene a cerca de las pruebas de hiptesis,
aunado a la manera en la que se aborda el contenido de estas pruebas, se puede decir que
existe un problema serio para quienes intentan adentrarse en el estudio de estos mtodos.
En este trabajo se aterrizaron las bases que sostienen la teora de las pruebas de
hiptesis, mediante una descripcin de metodologas, que simplifican las bsquedas de las
mejores pruebas, tamaos y potencia de la prueba. Se menciona lo anterior ya que ello es lo
que diferencia el presente trabajo de los dems escritos con respecto a este tema.
Al abordar los mtodos de pruebas de hiptesis de esta manera, no slo se presenta de
una forma sencilla y prctica este mtodo sino que tambin tiene la ventaja de comprender
muchos de los conceptos fundamentales de esta teora y que causan tantos problemas a los
estudiantes al momento de afrontar esta disciplina, aunque esto no quiera decir que no sea
necesaria cierta madurez intelectual y dedicacin a la materia.
No hay que olvidar mencionar que en los cinco captulos que se abordaron tienen un
nmero considerable de ejercicios resueltos en donde se pretendi mostrar la aplicabilidad de
todos y cada uno de los casos en los que se pueden utilizar las prueba de hiptesis, adems de
que: los ejemplos sirven para ensear el clculo de las pruebas; los ejemplos permiten ver la
aplicacin de las pruebas en diferentes reas del conocimiento y el uso de las metodologas
empleadas en ellos demuestran la lgica que se sigue para la solucin de estas pruebas.
Por ltimo, es necesario hacer una consideracin importante con respecto a las pruebas
de hiptesis y sta es que nunca se sabe con absoluta certeza la verdad o falsedad de una
hiptesis, a no ser que se examine la poblacin entera. Debe quedar claro que el diseo de un
procedimiento de decisin debe llevarse a cabo con la idea de la probabilidad de una
conclusin equivocada.

184
Bibliografa

Bibliografa
[1] Alexander M. Mood, Franklin A. Graybill y Duane C. Boes
Introduction to the Theory of Statistics, Singapore 1986. ISBN 0-07-042864-6
Editorial Mc Graw-Hill
[2] Canavos C. G. 1984. Applied Probability and Statistical Methods. Ed. McGraw-Hill. New
York.
[3] Casella George and Berger L. Roger. 2001. Statistical Inference, Duxbury Press; 2 edition,.
ISBN 978-0534-243-12-8
[4] DeGroot H. Morris, Schervish J. Mark. 2001. Probability and Statistics, 3rd Edition, Addison
Wesley; 3rd edition. ISBN-13: 978-0201524888
[5] Gutirrez Gonzlez Eduardo. 2006. Fundamentos de Estadstica Descriptiva e inferencial para
ingenieria y ciencias. Primera edicin. Ed Nauka-Educacin. ISBN 970-92239-6-8
[6] Hoel G. 1984. Introduction to Mathematical Statistics, Wiley; 5 edition, 448 p. ISBN-13: 978-
0471890454.
[7] Kreyzig E. 1985: Introductory Mathematical Statistics. Ed John Wiley and Sons. New York,
USA
[8] Lehmann L.E. , Romano P. Joseph. 2008. Testing Statistical Hypotheses, Springer; 3rd edition,
986p. ISBN 978-0387-988-64-1
[9] Mood A. M., Graybill F. A. and Boes D. C. 1975. Introduction to the Theory of Statistics. Ed.
McGraw Hill, New York, USA
[10] Murray R. Spiegel. 1976. Probabilidad y Estadstica. Ed. Schaum-McGraw-Hill. ISBN 968-
451-102-7
[11] Pliego Lpez F. Javier Martn, Maya Prez Luis Ruiz; Montero Lorenzo Jos Mara. 2005.
Problemas de Inferencia Estadstica, 324p. ISBN 84-973-2355-6
[12] Pliego Lpez F. Javier Martn, Maya Prez Luis Ruiz; Montero Lorenzo Jos Mara. 2007.
Fundamentos de Inferencia Estadstica, 368p. ISBN 84-973-2354-8

185
Bibliografa

[13] Ross M. Sheldon. 2006. Introduction to Probability Models, Academic Press; 9 edition, 800
p. ISBN-13: 978-0125980623
[14] Sidney Siegel. 1978. Estadstica no paramtrica aplicada a las ciencias de la conducta. Ed.
Trillas
[15] Wackerly Dennis, Mendenhall William, Scheaffer L. Richard. 2007. Mathematical Statistics
with Applications, Duxbury Press; 7 edition, 944p. ISBN 978-0495-110-81-1
[16] Zylberberg, Alejandro D. 2005. Probabilidad y Estadstica. 1a ed. Editorial Nueva Librera,
835 p. ISBN 987-1104-33-2
ARTCULOS

[17] S. S. Shapiro and M. B. Wilk. 1965. An Analysis of Variance Test for Normality. Biometrika
Trust
[18] S. S. Shapiro and R. S. Francia. 1972 An Approximate Analysis of Variance Test for
Normality. Journal of the American Statistical Association

186
Anexo

Anexo
TABLA 1. VALORES DE LA DISTRIBUCIN JI-CUADRADA PARA REAS
DERECHAS.
P( 2   )

Grados de
libertad 0.3 0.2 0.15 0.1 0.05 0.02 0.01 0.001
3 3.665 4.642 5.317 6.251 7.815 9.837 11.345 16.266
4 4.878 5.989 6.745 7.779 9.488 11.668 13.277 18.467
5 6.064 7.289 8.115 9.236 11.070 13.388 15.086 20.515
6 7.231 8.558 9.446 10.645 12.592 15.033 16.812 22.458
7 8.383 9.803 10.748 12.017 14.067 16.622 18.475 24.322
8 9.524 11.030 12.027 13.362 15.507 18.168 20.090 26.124
9 10.656 12.242 13.288 14.684 16.919 19.679 21.666 27.877
10 11.781 13.442 14.534 15.987 18.307 21.161 23.209 29.588
11 12.899 14.631 15.767 17.275 19.675 22.618 24.725 31.264
12 14.011 15.812 16.989 18.549 21.026 24.054 26.217 32.909
13 15.119 16.985 18.202 19.812 22.362 25.472 27.688 34.528
14 16.222 18.151 19.406 21.064 23.685 26.873 29.141 36.123
15 17.322 19.311 20.603 22.307 24.996 28.259 30.578 37.697
16 18.418 20.465 21.793 23.542 26.296 29.633 32.000 39.252
17 19.511 21.615 22.977 24.769 27.587 30.995 33.409 40.790
18 20.601 22.760 24.155 25.989 28.869 32.346 34.805 42.312
19 21.689 23.900 25.329 27.204 30.144 33.687 36.191 43.820
20 22.775 25.038 26.498 28.412 31.410 35.020 37.566 45.315
21 23.858 26.171 27.662 29.615 32.671 36.343 38.932 46.797
22 24.939 27.301 28.822 30.813 33.924 37.659 40.289 48.268
23 26.018 28.429 29.979 32.007 35.172 38.968 41.638 49.728
24 27.096 29.553 31.132 33.196 36.415 40.270 42.980 51.179
25 28.172 30.675 32.282 34.382 37.652 41.566 44.314 52.620
26 29.246 31.795 33.429 35.563 38.885 42.856 45.642 54.052
27 30.319 32.912 34.574 36.741 40.113 44.140 46.963 55.476
28 31.391 34.027 35.715 37.916 41.337 45.419 48.278 56.892
29 32.461 35.139 36.854 39.087 42.557 46.693 49.588 58.301
30 33.530 36.250 37.990 40.256 43.773 47.962 50.892 59.703
Para valores de n (grados de libertad) mayores que 30 puede obtenerse la probabilidad a
travs de la transformacin 2 2 (n)
2n
1 que es aproximadamente N (0,1) .

187
Anexo

TABLA 2. VALORES CRTICOS DE D PARA LA PRUEBA DE KOLMOGOROV-


SMIRNOV DE UNA MUESTRA.

Nivel de significancia 
Tamao de la
muestra (n) 0.2 0.15 0.1 0.05 0.01
1 0.900 0.925 0.950 0.875 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490
11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.200 0.220 0.240 0.290
35 0.180 0.190 0.201 0.230 0.270
1.07 1.14 1.22 1.36 1.63
 35 n n n n n

188
Anexo

TABLA 3. COEFICIENTES a n
i 1  PARA LA PRUEBA DE NORMALIDAD DE SHAPIRO-
WILK.

i
n 2 3 4 5 6 7 8 9 10
1 0.7071 0.7071 0.6872 0.6646 0.6431 0.6233 0.6052 0.5888 0.5739
2 - 0.0000 0.1677 0.2413 0.2806 0.3031 0.3164 0.3244 0.3291
3 - - - 0.0000 0.0875 0.1401 0.1743 0.1976 0.2141
4 - - - - - 0.0000 0.0561 0.9470 0.1224
5 - - - - - - - 0.0000 0.0399

i
n 11 12 13 14 15 16 17 18 19 20
1 0.5601 0.5475 0.5359 0.5251 0.5120 0.5056 0.4968 0.4886 0.4808 0.4734
2 0.3315 0.3325 0.3325 0.3318 0.3306 0.3290 0.3273 0.3253 0.3232 0.3211
3 0.2260 0.2347 0.2412 0.2460 0.2495 0.2521 0.2540 0.2553 0.2561 0.2565
4 0.1429 0.1586 0.1707 0.1802 0.1878 0.1939 0.1988 0.2027 0.2059 0.2085
5 0.0695 0.0922 0.1099 0.1240 0.1353 0.1447 0.1524 0.1587 0.1641 0.1686
6 0.0000 0.0303 0.0539 0.0727 0.0880 0.1005 0.1109 0.1197 0.1271 0.1334
7 - - 0.0000 0.0240 0.0433 0.0593 0.0725 0.0837 0.0932 0.1013
8 - - - - 0.0000 0.0196 0.0359 0.0496 0.0612 0.0711
9 - - - - - - 0.0000 0.0163 0.0303 0.0422
10 - - - - - - - - 0.0000 0.0140

i
n 21 22 23 24 25 26 27 28 29 30
1 0.4643 0.4590 0.4542 0.4493 0.4450 0.4407 0.4366 0.4328 0.4291 0.4254
2 0.3185 0.3156 0.3126 0.3098 0.3069 0.3043 0.3018 0.2992 0.2968 0.2944
3 0.2578 0.2571 0.2563 0.2554 0.2543 0.2533 0.2522 0.2510 0.2499 0.2484
4 0.2119 0.2131 0.2139 0.2145 0.2148 0.2151 0.2152 0.2151 0.2150 0.2148
5 0.1736 0.1764 0.1787 0.1807 0.1822 0.1836 0.1848 0.1857 0.1864 0.1870
6 0.1399 0.1443 0.1480 0.1512 0.1539 0.1563 0.1584 0.1601 0.1616 0.1630
7 0.1092 0.1150 0.1201 0.1245 0.1283 0.1316 0.1346 0.1372 0.1395 0.1415
8 0.0804 0.0878 0.0941 0.0997 0.1046 0.1089 0.1128 0.1162 0.1192 0.1219
9 0.0530 0.0618 0.0696 0.0764 0.0823 0.0876 0.0923 0.0650 0.1002 0.1036
10 0.0263 0.0368 0.0459 0.0539 0.0610 0.0672 0.0728 0.0778 0.0822 0.0862
11 0.0000 0.0122 0.0228 0.0321 0.0403 0.0476 0.0540 0.0598 0.0650 0.0697
12 - - 0.0000 0.0107 0.0200 0.0284 0.0358 0.0424 0.0483 0.0537
13 - - - - 0.0000 0.0094 0.1780 0.0253 0.3200 0.0381
14 - - - - - - 0.0000 0.0084 0.0159 0.0227
15 - - - - - - - - 0.0000 0.0076

189
Anexo

TABLA 3. COEFICIENTES a n
i 1  PARA LA PRUEBA DE NORMALIDAD DE SHAPIRO-
WILK. (Continuacin)

i
n 31 32 33 34 35 36 37 38 39 40
1 0.4220 0.4188 0.4156 0.4127 0.4096 0.4068 0.4040 0.4015 0.3989 0.3964
2 0.2921 0.2898 0.2876 0.2854 0.2831 0.2813 0.2794 0.2774 0.2455 0.2737
3 0.2475 0.2463 0.2451 0.2439 0.2427 0.2415 0.2403 0.2391 0.2380 0.2368
4 0.2145 0.2141 0.2137 0.2132 0.2127 0.2121 0.2116 0.2110 0.2101 0.2098
5 0.1874 0.1878 0.1880 0.1882 0.1883 0.1883 0.1883 0.1881 0.1880 0.1878
6 0.1641 0.1651 0.1660 0.1667 0.1673 0.1678 0.1683 0.1686 0.1689 0.1691
7 0.1433 0.1449 0.1463 0.1475 0.1487 0.1496 0.1505 0.1513 0.1520 0.1526
8 0.1243 0.1265 0.1284 0.1301 0.1317 0.1331 0.1344 0.1356 0.1366 0.1376
9 0.1066 0.1093 0.1118 0.1140 0.1160 0.1179 0.1196 0.1211 0.1225 0.1237
10 0.0899 0.0931 0.0961 0.0988 0.1013 0.1036 0.1056 0.1075 0.1092 0.1108
11 0.0739 0.0777 0.0812 0.0844 0.0873 0.0900 0.0924 0.0947 0.0967 0.0986
12 0.0585 0.0629 0.0669 0.0706 0.0739 0.0770 0.0798 0.0824 0.0848 0.0870
13 0.0435 0.0485 0.0530 0.0572 0.0610 0.0645 0.0677 0.0706 0.0733 0.0759
14 0.2890 0.0344 0.0395 0.0441 0.0484 0.0523 0.0559 0.0582 0.0622 0.0651
15 0.1440 0.0206 0.0262 0.0314 0.0361 0.0404 0.0444 0.0481 0.0515 0.0546
16 0.0000 0.0068 0.0131 0.0187 0.0239 0.0287 0.0331 0.0372 0.0409 0.0444
17 - - 0.0000 0.0062 0.0119 0.0172 0.0220 0.0264 0.0305 0.0343
18 - - - - 0.0000 0.0057 0.0110 0.0158 0.0203 0.0244
19 - - - - - - 0.0000 0.0053 0.0101 0.0146
20 - - - - - - - - 0.0000 0.0049

i
n 41 42 43 44 45 46 47 48 49 50
1 0.3940 0.3917 0.3894 0.3872 0.3850 0.3830 0.3808 0.3789 0.3770 0.3751
2 0.2719 0.2701 0.2684 0.2667 0.2651 0.2635 0.2620 0.2604 0.2589 0.2574
3 0.2357 0.2345 0.2334 0.2323 0.2313 0.2302 0.2291 0.2281 0.2271 0.2260
4 0.2091 0.2085 0.2078 0.2072 0.2065 0.2058 0.2052 0.2045 0.2038 0.2032
5 0.1876 0.1874 0.1871 0.1868 0.1865 0.1862 0.1859 0.1855 0.1851 0.1847
6 0.1693 0.1694 0.1695 0.1695 0.1695 0.1695 0.1695 0.1693 0.1692 0.1691
7 0.1531 0.1535 0.1539 0.1542 0.1545 0.1548 0.1550 0.1551 0.1553 0.1554
8 0.1384 0.1392 0.1398 0.1405 0.1410 0.1415 0.1420 0.1423 0.1427 0.1430
9 0.1249 0.1259 0.1269 0.1278 0.1286 0.1293 0.1200 0.1306 0.1312 0.1317
10 0.1123 0.1136 0.1149 0.1160 0.1170 0.1180 0.1189 0.1197 0.1205 0.1212
11 0.1004 0.1020 0.1035 0.1049 0.1062 0.1073 0.1085 0.1095 0.1105 0.1113
12 0.0891 0.0909 0.0927 0.0943 0.0959 0.0972 0.0986 0.0998 0.1010 0.1020
13 0.0782 0.0804 0.0824 0.0842 0.0860 0.0876 0.0892 0.0906 0.0919 0.0932
14 0.0677 0.0701 0.0724 0.0745 0.0765 0.0783 0.0801 0.0817 0.0832 0.0846

190
Anexo

i
n 41 42 43 44 45 46 47 48 49 50
15 0.0575 0.0602 0.0628 0.0651 0.0673 0.0694 0.0713 0.0731 0.0748 0.0764
16 0.0476 0.0506 0.0534 0.0560 0.0584 0.0607 0.0628 0.0648 0.0667 0.0685
17 0.0379 0.0411 0.0442 0.0471 0.0497 0.0522 0.0546 0.0568 0.0588 0.0608
18 0.0283 0.0318 0.0352 0.0383 0.0412 0.0439 0.0465 0.0489 0.0511 0.0532
19 0.0188 0.0227 0.0263 0.0296 0.0328 0.0357 0.0385 0.0411 0.0436 0.0459
20 0.0094 0.0136 0.0175 0.0211 0.0245 0.0277 0.0307 0.0335 0.0361 0.0386
21 0.0000 0.0045 0.0087 0.0126 0.0163 0.0197 0.0229 0.0259 0.0288 0.0314
22 - - 0.0000 0.0042 0.0081 0.0118 0.0153 0.0185 0.0215 0.0244
23 - - - - 0.0000 0.0039 0.0076 0.1110 0.0143 0.0174
24 - - - - - - 0.0000 0.0037 0.0071 0.0104
25 - - - - - - - - 0.0000 0.0035

191

Potrebbero piacerti anche