Sei sulla pagina 1di 234

INFERENCIA ESTADSTICA PARA ECONOMA Y EMPRESA

This page intentionally left blank

Jos Agull Candela Vicente Carratal Pastor Joaqun Gimeno Aranda

INFERENCIA ESTADSTICA PARA ECONOMA Y EMPRESA


(Teora y ejercicios resueltos)

UNIVERSIDAD DE ALICANTE

Jos Agull Candela, Vicente Carratal Pastor y Joaqun Gimeno Aranda de la presente edicin Publicaciones de la Universidad de Alicante Campus de San Vicente s/n 03690 San Vicente del Raspeig Publicaciones @ ua.es http://publicaciones.ua.es Diseo de portada: Alfredo Candela Impresin: Compobell, S.L. Saln de Ruiz Hidalgo, bajo 9. Murcia I.S.B.N.: 84-7908-458-8 Depsito Legal: MU-2239-1999

Reservados todos los derechos. No se permite reproducir, almacenar en sistemas de recuperacin de la informacin ni o transmitir alguna parte de esta publicacin, cualquiera que sea el medio empleado -electrnico, mecnico, fotocopia, grabacin, etc.-, sin el permiso previo de los titulares de los derechos de la propiedad intelectual.

NDICE GENERAL

PRLOGO CAPTULO 1. INTRODUCCIN A LA INFERENCIA ESTADSTICA 1. 2. 3. 4. 5. Introduccin Muestreo aleatorio simple Generacin de una m.a.s. de una distribucin conocida Definicin de estadstico Distribucin muestral de un estadstico 5.1. Distribucin muestral de la media muestral 5.2. Correccin por poblacin finita 5.3. Esperanza de la varianza muestral 6. Muestreo de una poblacin normal 7. Teorema central del lmite 8. Distribucin de la proporcin muestral Ejercicios CAPTULO 2. ESTIMACIN PUNTUAL 1. 2. 3. 4. 5. Introduccin Insesgadez Criterio del error cuadrtico medio Consistencia Mtodo de los momentos 5.1. Introduccin 5.2. Ejemplos de estimadores obtenidos por el mtodo de los momentos. 5.3. Propiedades de los estimadores obtenidos por el mtodo de los momentos

11

13 14 15 18 19 19 21 21 22 25 27 29

39 39 41 43 45 45 45 46

ndice

6. Mtodo de la mxima verosimilitud 6.1. Introduccin 6.2. Ejemplos de estimadores maximoverosmiles 6.3. Propiedades de los estimadores maximoverosmiles Ejercicios CAPTULO 3. ESTIMACIN POR INTERVALOS DE CONFIANZA 1. Introduccin 2. Intervalos de confianza bajo normalidad 2.1. Problema de una muestra 2.1.1.Intervalo para la media poblacional, varianza conocida 2.1.2. Intervalo para la media poblacional, varianza desconocida 2.1.3.Intervalos para la varianza poblacional 2.2. El problema de dos muestras 2.2.1.Intervalo para la diferencia de dos medias, varianzas conocidas. 2.2.2.Intervalo para la diferencia de dos medias, varianzas desconocidas 2.2.3.Intervalo para la diferencia de dos medias, muestras apareadas 2.2.4.Intervalo para el cociente de varianzas 3. Intervalos de confianza para muestras grandes Ejercicios CAPTULO 4. CONTRASTES DE HIPTESIS 1. Introduccin 2. Contrastes de hiptesis bajo normalidad 2.1. Problema de una muestra 2.1.1. Contrastes para la media poblacional, varianza conocida 2.1.2.Contrastes para la media poblacional, varianza desconocida.... 2.1.3.Contrastes para la desviacin tpica poblacional 2.2. El problema de dos muestras 2.2.1.Contraste para la igualdad de dos medias, varianzas conocidas 2.2.2.Contraste para la igualdad de dos medias, varianzas desconocidas 2.2.3.Contraste para la igualdad de dos medias, muestras apareadas 2.2.4. Contraste para el cociente de varianzas 2.3. Problema de k muestras 3. Contrastes de hiptesis para muestras grandes Ejercicios CAPTULO 5. MTODOS ROBUSTOS Y NO PARAMTRICOS 1. Introduccin 2. Mtodos basados en la media recortada 2.1. Intervalos de confianza y contrastes para una muestra

46 46 47 49 50

63 66 66 66 67 67 68 68 68 69 69 70 72

83 90 91 91 94 97 100 100 102 103 103 106 109 111

135 137 137

ndice

2.2. Contrastes e intervalos de confianza para dos muestras 2.3. Correccin de Satterthwaite para dispersiones desiguales 2.4. El problema de k muestras y el procedimiento FSD aplicado a medias recortadas 2.5. Una aplicacin a diferencias apareadas 3. Uso de las transformaciones potencia para homogeneizar dispersiones .... 4. Mtodos basados en la transformacin rango 4.1. Rangos y un mtodo para calcularlos 4.2. Una aplicacin de la transformacin rango para un problema de dos muestras 4.3. Un ejemplo de k muestras 4.4. Una aplicacin a diferencias apareadas 4.5. Un mtodo de diferencias apareadas basado en los rangos con signo Ejercicios CAPTULO 6. BONDAD DE AJUSTE 1. Introduccin 2. Test Ji-cuadrado 3. Test de Kolmogorov-Smirnov 4. Comparacin de los contrastes Ejercicios

139 142 143 145 147 151 152 152 156 157 159 161

185 186 189 192 194

CAPTULO 7. CONTROL DE CALIDAD


1. Introduccin 2. Control de calidad de fabricacin por variables 2.1. Introduccin 2.2. Parmetros conocidos 2.2.1.Lmites de control para la media 2.2.2.Lmites de control para la desviacin tpica 2.2.3.Lmites de control para el rango 2.3. Parmetros desconocidos 2.4. Resumen 3. Control de calidad de fabricacin por atributos 3.1. Cartas de control para la fraccin de defectuosos 3.2. Cartas de control para el nmero de defectuosos 4. Control de calidad de fabricacin por nmero de defectos Ejercicios 213 217 217 218 218 219 219 220 221 223 223 224 224 225

This page intentionally left blank

PRLOGO
El presente libro proporciona material de apoyo para un curso cuatrimestral de Inferencia Estadstica. Su nivel est adaptado al de los alumnos de los nuevos planes de estudio de las licenciaturas y diplomaturas en Economa y en Administracin y Direccin de Empresas de las Facultades y Escuelas Universitarias de Ciencias Econmicas y Empresariales. El libro presupone que el lector tiene conocimientos de Estadstica descriptiva (incluyendo conceptos bsicos de Estadstica exploratoria tales como el grfico tallo y hoja, el grfico caja y el diagrama esquemtico) y de teora de la probabilidad. Cada captulo del libro consta de dos partes. En la primera parte se presentan los resultados tericos necesarios para la resolucin de los ejercicios. Despus de los resultados tericos se presenta una coleccin de ejercicios resueltos. El libro comienza con una introduccin a la Inferencia Estadstica en la que se presentan los conceptos de muestreo aleatorio y distribuciones mustrales de los estadsticos asociados al muestreo de poblaciones normales (captulo 1). En el captulo 2 se presentan los mtodos de estimacin puntual y en el captulo 3 los mtodos de estimacin por intervalos de confianza. En el captulo 4 se estudian los procedimientos clsicos de contraste de hiptesis basados en el supuesto de normalidad. En el captulo 5 se recogen bajo el ttulo de "mtodos robustos y no paramtricos" un conjunto de tcnicas inferenciales aplicables cuando el anlisis exploratorio de la informacin muestral sugiere que los supuestos clsicos no son adecuados. El captulo 6 describe los contrastes de bondad de ajuste basados en la distribucin Ji-cuadrado y en el estadstico de Kolmogorov-Smirnov. Por ltimo, el captulo 7 introduce los conceptos bsicos del control estadstico de la calidad. Los autores son profesores del Departamento de Fundamentos del Anlisis Econmico de la Universidad de Alicante y han acumulado una larga experiencia en la docencia de la Inferencia Estadstica en la Facultad de Econmicas y Empresariales de la citada universidad. Finalmente, los autores agradecen al profesor Jos Rodrguez Alejandre su paciencia y esmerada colaboracin en las tareas tcnicas.

This page intentionally left blank

CAPITULO 1 INTRODUCCIN A LA INFERENCIA ESTADSTICA


1. INTRODUCCIN Si alguien est interesado, pongamos por caso, en evaluar las preferencias polticas de la poblacin formada por todos los votantes espaoles, entrevistar lgicamente a una muestra formada por algunos de tales votantes. Despus usar la informacin muestral para sacar conclusiones relativas a la poblacin, por ejemplo, estimar la fraccin real de todos los votantes que son favorables a una determinada formacin poltica. Dos preguntas importantes que surgen son cmo seleccionar los elementos de la muestra y cmo aproximar los valores de los parmetros de la distribucin poblacional usando la informacin muestral. Y, si podemos contestar tales preguntas, cmo calcular o hacernos una idea del grado de fiabilidad o precisin de tales estimaciones? Cualquier conclusin basada en una muestra est sujeta a incertidumbre, pues a partir de un subconjunto de la poblacin no podemos sacar conclusiones verdaderas sobre la poblacin sino conclusiones probables. Intuitivamente, podemos afirmar que cuanto mayor sea el nmero de votantes incluidos en la muestra, tanto mayor ser la probabilidad de obtener una buena estimacin de la fraccin de todos los votantes que son favorables a una determinada formacin poltica. Pero, para tener una estimacin que est cerca del parmetro, la muestra debe ser representativa de la poblacin de la que procede. La muestra representativa ideal sera una en la que la distribucin de frecuencias muestral coincidiese con la distribucin de frecuencias poblacional, pero para seleccionarla necesitamos justamente la informacin que buscamos. Para garantizar la representatividad de las muestras, el muestreo ha de ser aleatorio, es decir, generado por algn mecanismo de azar. Si las muestras se extraen aleatoriamente, las observaciones mustrales son variables aleatorias en el proceso de muestreo repetido. Los estadsticos son funciones de estas observaciones, as que son variables aleatorias tambin. Los estimadores son estadsticos y tienen, por tanto, distribuciones de probabilidad. Estas distribucio-

14

Introduccin a la Inferencia Estadstica

nes de probabilidad, llamadas distribuciones mustrales de los estimadores, hacen posible la inferencia estadstica. 2. MUESTREO ALEATORIO SIMPLE Existen diferentes mtodos de muestreo aleatorio pero en este libro slo estudiaremos el prototipo fundamental llamado muestreo aleatorio simple. A menudo se omite el adjetivo simple, siempre que se haga referencia nicamente a este mtodo de muestreo. El muestreo aleatorio simple es el proceso de seleccionar observaciones a partir de una poblacin, de modo que toda observacin de la poblacin tiene la misma probabilidad de ser incluida en la muestra que cualquier otra (la observacin tiene la distribucin de probabilidad de la poblacin) y adems toda observacin es independiente de cualquier otra (es decir, no afecta a otra seleccin ni se ve afectada por otra observacin). Formalizando estas condiciones, vamos a caracterizar el muestreo aleatorio simple de una distribucin de probabilidad. Denotemos por X la variable aleatoria (v. a.) objeto de estudio y supongamos que X tiene funcin de distribucin F(x) y funcin de densidad f ( x } si es continua o funcin de masa de probabilidad P( X = x) si es discreta. Supongamos que se ha extrado una muestra de n observaciones de X y representemos los elementos de la muestra por X\,...,Xn. Decimos que X^,...,Xn es una muestra aleatoria simple (m.a.s.) de la distribucin F si y solo si X{,...,Xn son v.a. independientes e idnticamente distribuidas con funcin de distribucin comn F. As pues, s i X { , . . . , X n es una m.a.s. de F, la funcin de distribucin de cada X es igual a F y, adems, las X son independientes. En consecuencia, la funcin de distribucin conjunta de *...,* es

Si F es continua, entonces la funcin de densidad conjunta deX,...,Xn es

mientras que si F es discreta, la funcin de masa de probabilidad conjunta de^,,...,^, 7 es

Ejemplo 2.1. Fiabilidad de componentes electrnicos. Para estudiar la fiabilidad de unos componentes electrnicos, el tiempo de vida X (en horas) de un componente dado puede suponerse que es una variable aleatoria con distribucin exponencial de media 9. Entonces la funcin de densidad de X es , y cero en otro caso. Una muestra aleatoria de n

15

componentes se somete a un test. Entonces, la distribucin conjunta de la muestra X},...,Xn tiene funcin de densidad conjunta

si Xj > O,..., jcw > O , y cero en otro caso. En la prctica, el mejor mtodo de conseguir una muestra aleatoria simple es emplear nmeros aleatorios, como veremos en la siguiente seccin. 3. GENERACIN DE UNA M.A.S. DE UNA DISTRIBUCIN CONOCIDA En ocasiones ocurre que las distribuciones de probabilidad de variables aleatorias de determinadas poblaciones son conocidas en su forma y parmetros. Vamos a ver cmo el conocimiento deductivo de lo que ocurrir al tomar muestras aleatorias de distribuciones conocidas va a ser fundamental en el proceso de inferencia porque, aunque se conozcan las distribuciones de estas variables aleatorias, en ocasiones es difcil obtener las distribuciones de ciertas funciones de ellas. Estas distribuciones de probabilidad representan modelos para el comportamiento de las frecuencias relativas de las funciones en un muestreo repetitivo. Por ejemplo, la distribucin de la diferencia de las variables aleatorias Xc = radio del cilindro y Xp= radio del pistn en el ejercicio 8 es difcil de obtener. Sin embargo podemos obtener m.a.s. simuladas de la distribucin conjunta de Xc y Xp, y a partir de ellas aproximar la distribucin de la diferencia Xc Xp. Cuanto mayor sea el nmero de muestras simuladas que obtengamos, ms se aproximarn la distribucin de frecuencias muestral y la distribucin de probabilidad real. Veamos cmo simular observaciones de una distribucin conocida. Las tablas de dgitos aleatorios (o una simple calculadora cientfica) nos permiten obtener simulaciones de m.a.s. de una distribucin uniforme en el intervalo [0,1]. Para obtener una m.a.s. de una distribucin poblacional conocida, partimos de una m.a.s. de una distribucin 7(0,1) y utilizamos un procedimiento basado en la llamada transformacin integral de probabilidad. Si la distribucin corresponde a una variable aleatoria continua, la transformacin integral considera los valores simulados de una distribucin 7(0,1) como si fueran valores de la funcin de distribucin de la variable que queremos simular. Teorema 1.1. Teorema de la transformacin integral de probabilidad Sea X una variable aleatoria continua con funcin de distribucin F(x). Sea Y=F(X). Entonces Y ~ 7(0,1). Demostracin Como F es montona creciente por ser la funcin de distribucin de una v.a. continua, la existencia de F"1 est garantizada. La funcin de distribucin de Y, que denotamos por G(y), cumple

16

Introduccin a la Inferencia Estadstica

As, G(y) es la funcin de distribucin de una variable 7(0,1) y, por tanto, Y ~ 7(0,1). Adems, el recproco del teorema 1.1 tambin es cierto: Si F ~ 7(0,1) yF~l(Y) = X, entonces X tiene funcin de distribucin F. En efecto, sea// la funcin de distribucin de X. Entonces,

ya que Y ~ 7(0,1). Luego H=F. En este resultado se basa la simulacin de variables aleatorias continuas. Si tenemos una m.a.s. yl,...,yn de una distribucin 7(0,1), entonces el conjunto de valores xl = F~l(y}),...,xn =F~\yn) constituyen una m.a.s. de X. Por tanto, la transformacin integral nos permite generar una m.a.s. de una variable continua cuya distribucin es conocida. En resumen, el procedimiento para simular una m.a.s de tamao n de una v.a. continua consiste en repetir n veces las siguientes etapas: a) Obtener un nmero aleatorio y entre O y 1. b) Considerar y como un valor de F(x) y tomar * = F~l(y) como observacin de^T. Ejemplo 3.1. Sea X una v.a. continua con funcin de densidad , y cero en otro caso. Vamos a generar utilizando la transformacin integral una m.a.s. de tamao 3 de la variable aleatoria X usando la siguiente m.a.s de una distribucin uniforme en el intervalo [0,1]: 0.408, 0.225, 0.063. La funcin de distribucin de X Tomando y = F(x), obtenemos

As, los valores simulados de X para y respectivamente. La figura 4.1 proporciona la relacin unvoca entre cada y y su correspondiente x a travs de la representacin grfica de la funcin de distribucin de X. Para simular una m.a.s. de tamao n de una v.a. discreta se repiten n veces las siguientes etapas: a) Obtener un nmero aleatorio _y entre O y 1. b) Considerar y como un valor de la funcin de distribucin F de la variable X que simulamos, y tomar como observacin simulada el valor x ms pequeo tal que F(x) > y , es decir, min

17

Figura 4.1.

Ejemplo 3.2 Sea X = nmero de nias en familias de 5 hijos y supongamos que X ~ 5(5,1/2). La funcin de distribucin de X es
0

si x < O

0.0312 0.1875

siO<x<l sil<x<2
si 2 < x < 3

F(x) = < 0.5


0.8125 0.9688
1

si3<*<4 si 4 < x < 5


si x > 5

La representacin grfica de F(x) aparece en la figura 4.2.

Figura 4.2. La regla para encontrar una muestra simulada de X a partir de una m.a.s. de Y es

18

Introduccin a la Inferencia Estadstica

4. DEFINICIN DE ESTADSTICO En la prctica solemos observar una funcin de la muestra. Cuando lanzamos una moneda n veces rara vez nos interesa el resultado de cada prueba. Ms bien contamos el nmero de caras en n pruebas. Si Xl,...,Xn es una m.a.s., cualquier funcin observable de la muestra es un estadstico. Un estadstico al ser funcin de las v.a. observadas en el proceso de muestreo repetido es a su vez una v.a. y tiene, por tanto, su propia distribucin de probabilidad. Dada una m.a.s. X\,...,Xn, un estadstico Tes cualquier funcin de dicha muestra que no depende de parmetros desconocidos. As pues, el clculo de un estadstico a partir de la muestra no requiere conocimiento de ningn parmetro desconocido de la poblacin. Los estadsticos se utilizan para sacar conclusiones inferenciales sobre los parmetros poblacionales desconocidos. SeaX{,...,Xn una m.a.s. de una funcin de distribucin F. Algunos estadsticos importantes son la media muestral y la desviacin tpica muestral, que se definen de la siguiente manera: Media muestral:
desviacion tipion muestral:S

El cuadrado de la desviacin tpica muestral se llama varianza muestral y se denota por S2. Si ordenamos las observaciones mustrales en orden creciente de magnitud y denotamos mediante X^,...,X^ las variables aleatorias ordenadas, entonces el vector (x (l) ,..., X^\ se llama vector de estadsticos ordenados. Los siguientes estadsticos se obtienen como funcin de los estadsticos ordenados: Mnimo: X(l) = min( X } ,..., Xn) . Mximo: X(n) = max(X},...,Xn).

19
Rango:
(n)-X(l).

si n es impar

Mediana muestral: Msi n es par

Observamos que los estadsticos mustrales son simplemente caractersticas numricas de la muestra igual que los parmetros son caractersticas numricas de la poblacin. Sin embargo, los estadsticos mustrales son variables aleatorias y varan de muestra a muestra, mientras que los parmetros son constantes fijas. La siguiente tabla resume algunos resultados sobre parmetros y estadsticos.
Caracterstica numrica Poblacin Parmetro (constante fija) Muestra Estadstico (v.a.)

Media Varianza Desviacin tpica Momento de orden k

5. DISTRIBUCIN MUESTRAL DE UN ESTADSTICO Un estadstico T T(X\,..., Xn), como una funcin de observaciones mustrales que son v.a., es tambin una v.a. Su valor vara de muestra a muestra. El comportamiento de la variabilidad en sus valores viene dado por su distribucin de probabilidad. La distribucin de probabilidad de T se llama distribucin muestral de T. La deduccin terica de la distribucin muestral de T puede ser fcil o difcil (o quiz imposible). A veces, lo ms que podemos hacer es obtener una distribucin emprica de T mediante simulacin. Dos estadsticos importantes en inferencia estadstica son la media muestral X y la varianza muestral S2. En los siguientes apartados describimos algunas propiedades de sus distribuciones mustrales. 5.1. Distribucin muestral de la media muestral Supongamos que X\,...,Xn es una m.a.s. de una v.a. X con media// y varian- 1 (X +...+X ). Usando resultados conocidos de teora zacr 9 . Recordamos que X } n n

20

Introduccin a la Inferencia Estadstica

de la probabilidad podemos obtener la esperanza y la varianza de la distribucin muestral de X, as como caracterizar la distribucin muestral de X por su funcin generatriz de momentos. La esperanza y la varianza de la distribucin de X se expresan fcilmente en trminos de los momentos poblacionales. En efecto,

pues las X estn idnticamente distribuidas; y como las X son incorrelacionadas dos a dos por ser independientes:

La distribucin completa de X, definida por su funcin generatriz de momentos, puede expresarse mediante la distribucin poblacional. Sea Mx (7) la funcin generatriz de momentos de X. La funcin generatriz de momentos de la media muestral es

(por ser X
(por ser X,,...,X generatriz de momentos comn Mx ( t ) ) . idnticamente distribuidas con funcin

Ejemplo 5.1. Distribucin de X cuando la poblacin es normal Si X se distribuye N(jU,cr2) entonces M Luego

Vemos que Mx(t) es la funcin generatriz de momentos de una distribucin TV u , y, por tanto, X se distribuye TV j u ,

21

Ejemplo 5.2. Distribucin de X cuando la poblacin es exponencial Si X se distribuye Exp( ) entonces/(je) = Ae go Mj (O = 1 yM . Lue-

Q116 es 1a funcin generatriz de momentos de una distribu-

cion gamma con media = y varianza

5.2. Correccin por poblacin finita Si la poblacin es finita y contiene N elementos, una m.a.s. de n elementos es una muestra elegida de modo que todas las combinaciones de n elementos tienen igual probabilidad de ser elegidas. Al ser un muestreo sin reemplazamiento, las variables X{,...,Xn no son independientes y, por tanto, para la distribucin de X no es (en el desarrollo aparecen trminos de covarianza). Para una m.a.s. de una poblacin finita se cumple que V(X) = donde A^es el tamao de la poblacin y n es el tamao de la muestra. El factor ( N n)( N 1) se llama factor de correccin por poblacin finita. Si n es pequeo comparado con N (por ejemplo, cuando n es inferior al 5% de N), entonces puede omitir. 5.3. Esperanza de la varianza muestral Como sabemos, la varianza muestral denotada por S se define mediante Para evaluar la esperanza de S2 observamos que 0=1,..., n) y, por tanto,
'j

= 1, y el factor de correccin por poblacin finita se

22
Tenemos as, que

Introduccin a la Inferencia Estadstica

6. MUESTREO DE UNA POBLACIN NORMAL Supongamos que X},...,Xn es una m.a.s. de una distribucin normal con media JL y varianza a2. Nuestro objetivo es obtener las distribuciones de algunos estadsticos que son funciones de X y S . Estos resultados forman la base de la inferencia en el muestreo de una poblacin normal. En la seccin 5 se ha demostrado que Tambin hemos probado que X se distribuye por toanto, Z = -\(X-jU)/<7 se distribuye W(0,l). Desde un punto de vista prctico o suele ser desconocido y resulta deseable reemplazar (7 por su estimacin S. Cul es la distribucin de la variable aleatoria ^(X-ju)/Sl Para responder esta y otras preguntas relevantes vamos a demostrar el siguiente resultado fundamental en Estadstica. Teorema 6.1. Teorema fundamental de muestreo de una poblacin normal Sea Xl,...,Xn,n>2, una m.a.s. de una distribucin N(ju ,o ) . Entonces: 1. Z = J(X-fi)/ase distribuye Af(0,l). 2. X y S2 son independientes. 3. (n-l)S21'a2 tiene una distribucin Ji-cuadrado conw-1 grados de libertad U-i). 4. *Jn(X-ju)/S
('-i).

tiene una distribucin t de Student con n-l grados de libertad

Demostracin 1. Resultado probado en la seccin anterior. 21_Vamos ajiemostrar que X es independiente de X - X para todo /. Veamos que X y X - X tienen una distribucin normal bivariante. Entonces la solucin es fcil: Basta comprobar que Cov(X,X - X) = O .

23

La distribucin conjunta de X y X, - X es normal bivariante. En efecto, la distribucin conjunta deX^...,Xn es una distribucin normal -variante con media ju y matriz de varianzas-covarianzas d 2 /, donde / denota la matriz identidad de rango n . X y Xi,- X es un vector aleatorio bidimensional formado por dos combinaciones lineales de X\,...,X n y, por t a n t o , ( X , X t , - X ) sigue una distribucin normal bivariante. Hemos demostrado que X y X X son independientes, para / = !,...,. Por consiguiente, x y /.(X X) =\ 3. Por otra parte,
n * ^
^

son independientes y tambin lo son X y S .

<^

yaqu Enton bservamos que (X-f)/<J, para cada , sigue una distribucin vV(0,l) , y V n (X ]U }(J es tambin A^(0,l) . En consecuencia, (Xt: //) o sigue una distribucin X\ , y tambin n(X- u}2a2 es X\ . Dado que las X son independien2 2 tes y la suma de n variables independientes X\ es una variable %n, tenemos que sigue una distribucin % . Por otra parte, los trmino
son indepen

dientes, pues el primero depende slo de S2 y no de X, el segundo depende slo de


teorema

se ha demostrado en la parte 2 que cumplindose la hiptesis del son independientes.

24

Introduccin a la Inferencia Estadstica

En conclusin, segn el teorema de adicin de la distribucin X , el estadstico (n-T)S2/<r2 sigue una distribucin Xn-\ siempre que la v.a. X de la poblacin siga una distribucin normal.
4. Sea T =

Como hemos visto, sigue una distribucin sigue

una distribucin Xn-\ y ambas distribuciones son independientes. Por tanto, teniendo en cuenta la definicin de la distribucin t de Student, la v.a. T sigue una distribucin tn_\. El teorema 6.1 puede generalizarse a la situacin en que tenemos dos muestras independientes. Sean^f n ,..., X l n y X2l,...,X2n^ dos m.a.s. independientes de distribuciones A r (// 1 ,<rf)y N(i 2,o\\ respectivamente. Sean X}, X2, ^ y Sf ^as correspondientes medias y varianzas de las muestras. Entonces sigue una distribucin normal tipificada. Si<j? y o 1 son desconocidas y suponemos quecJ" 2 = a\ =a2 (desconocida), tiene esperanza o . En efecto, entonces

2 Adems, tiene una distribucin/tr,+M2-2. Esto se deduce del teorema de adicin de distribuciones Ji-cuadrado independientes ya que (, -1)5", /<r y tienen ambas distribucin Ji-cuadrado. En consecuencia,
9 / 9

sigue una distribucin Adems, teniendo en cuenta la definicin de la distribucin F de Fisher, se sigue que tiene una distribucin F, En lo sucesivo, la funcin de densidad y la funcin de distribucin de una distribucin normal tipificada las denotaremos por 0(z) y O(z), respectivamente.

25

Para referirnos a los puntos crticos de las distribuciones que han aparecido en el muestreo de poblaciones normales, usaremos la siguiente notacin. Para la distribucin normal tipificada, denotaremos por za la abscisa que deja a la derecha un rea a bajo la curva de densidad 0(z). Para la distribucin t de Student, denotaremos por ta.v la abscisa que deja a la derecha un rea a bajo la curva de densidad de la variable t con v grados de libertad. De forma anloga, denotaremos mediante Xa\v y ^a;v,,v 2 ls puntos crticos que dejan a la derecha un rea a bajo las curvas de densidad de la distribucin Ji-cuadrado con v grados de libertad y de la distribucin F de Fisher con (v,, V2) grados de libertad, respectivamente. 7. TEOREMA CENTRAL DEL LMITE En la seccin 5 se demostr que s\X\,...,Xn representa una m.a.s. de cualquier distribucin con media u y varianza <j 2 , entonces

en

esta seccin recordamos una aproximacin para la distribucin muestral de X, que se puede utilizar cualquiera que sea la distribucin de la poblacin de donde se toma la muestra con tal de que el tamao muestral sea grande. Si se extrae la muestra de una poblacin normal, entonces por el teorema fundamental de muestreo de una poblacin normal resulta que X tiene una distribucin muestral que es normal. Pero, qu podemos decir de la distribucin muestral de X si las X no siguen una distribucin normal? Si las X son n v.a. independientes e idnticamente distribuidas con varianza finita, entonces para n suficientemente grande X sigue aproximadamente una distribucin normal. El enunciado formal de este resultado constituye el teorema central del lmite. Teorema 7.1. Teorema central del lmite Sean X\,...,X n una secuencia de v.a. i.i.d. con media u y varianza cr2<oo. Sea S . Entonces ). Es decir,

bajo las condiciones del teorema, Zn converge en distribucin a una distribucin ./V(0,l) Podemos observar que Zn puede escribirse en trminos de X como Si se cumplen las hiptesis del teorema se tiene que Z donde el smbolo ^> se interpreta como converge en distribucin o en ley a. Este es un resultado de gran inters en inferencia estadstica y se usar ms adelante. A continuacin ilustramos mediante dos ejemplos de simulacin que cuando se muestrea una poblacin binomial el comportamiento de la media muestral se puede aproximar muy bien mediante una distribucin normal. Consideramos una v.a. X binomial con parmetros n - 5 y p = 0.3, es decir, X ~ 5(5,0.3). La media y la varianza de X son ju = 5 0.3 = 1.5 y o 2= 5 0.3 0.7 = 1.05, respectivamente. En conse-

26

Introduccin a la Inferencia Estadstica

cuencia, la media y la varianza de la distribucin de la media muestral son E(X) = E(X) = 1.5 y o\ = <72/n = W5/n, respectivamente. Para estudiar el comportamiento emprico de la media muestral, primero consideramos n = 5. Simulamos 1000 m.a.s. de tamao 5 de la poblacin binomial, y calculamos para cada muestra la media muestral. De esta forma obtenemos 1000 medias mustrales que representan una m.a.s. de tamao 1000 de X. Despus, el mismo experimento se repite con muestras simuladas de tamao 10. La tabla 7.1 compara las medias y las varianzas de las muestras simuladas de X con las medias y las varianzas tericas. Observamos que las medidas resumen de las muestras simuladas aproximan mucho los respectivos parmetros poblacionales, y adems que la aproximacin es mejor para n = 10 que para n = 5. Tabla 7.1. Resultados tericos y clculos empricos de las 1000 muestras generadas para cada valor de n (5 y 10).
Tamao de la muestra Promedio de las Media poblacional medias mustrales Varianza de las medias mustrales

n =5 = 10

1.4820 1.4882

1.5

1.5

0.2065 0.1032

0.210 0.105

Figura 7.1.

27

Figura 7.2.

Las figuras 7.1 y 7.2 presentan para n = 5 y n = 10, respectivamente, el histograma de frecuencias relativas de las medias mustrales y la funcin de densidad de la distribucin normal con media 1.5 y varianza 1.05/w . Observamos que para ambos tamaos mustrales los histogramas son campaniformes y bastante simtricos. Vemos adems que en cada caso la funcin de densidad normal aproxima bastante bien el histograma de frecuencias mustrales de X . En resumen, el estudio emprico de simulacin nos proporciona medias de las medias mustrales y varianzas de las medias mustrales que estn bastante cerca de los valores tericos esperados. Adems cabe esperar que el histograma de frecuencias de la media muestral se aproxime cada vez ms a la correspondiente funcin de densidad de la distribucin normal conforme el tamao muestral aumente. 8. DISTRIBUCIN DE LA PROPORCIN MUESTRAL Sea X una v.a. Bernouilli con parmetro p, es decir, una variable categrica que toma slo dos valores, codificados mediante O y 1, con probabilidad/ de tomar el valor 1. Sea X } ,...,X n una m.a.s. de X . Este modelo es aplicable, por ejemplo, a n lanzamientos de una moneda con probabilidad de cara p. Otras aplicaciones importantes son a muestras aleatorias simples de tamao n de poblaciones infinitas para las que se requiere estimar la proporcin poblacional p de alguna caracterstica (proporcin de no fumadores en una ciudad, de piezas defectuosas en la produccin de una fbrica, etc.). El estimador que se utiliza para estimar p es la proporcin muestral p que se define com donde porcin muestral se puede escribir como sigue una distribucin B(n,p). En consecuencia, la distribu-

28

hIntroduccin a la Inferencia Estadstica

cion muestral de p puede basarse en la distribucin B(n,p) para n pequeo.


La esperanza y la varianza de p son

' respectivamente. Por la desigualdad de en Chebichev consecuencia Vf>0 se cumple esto que es

cuando n aumenta, la probabilidad de que la proporcin muestral se desve de la proporcin poblacional menos de cualquier > O tiende a la unidad. Como Sn es la suma de n v.a. i.i.d. con varianza finita, el teorema central del lmite garan
en terrninos de p

es decir,
este resul

tado es bsico para resolver los problemas inferenciales para variables categricas mediante muestras grandes. Conviene observar que si el valor de p es desconocido, entonces la desviacin tpica <j - ^]p(l p)/n ser desconocida tambin. En este caso, su valor se estima reemplazando p por p, de modo que

Ejercicios

29

EJERCICIOS 1. Una distribucin utilizada con frecuencia para modelizar la distribucin de las rentas en una comunidad es la distribucin de Pareto, cuya funcin de densidad es/(jc) = aBa I'xa+l si x > /3, y cero en otro caso. Los parmetros a y B han de cumplir las restricciones a > 1 y B > 0. Si 0.378, 0.296 y 0.973 es una m.a.s. de tamao 3 de una distribucin uniforme en el intervalo [0,1], simular una muestra de 3 observaciones de la distribucin de Pareto con a= 1.5 y B = 1. Solucin La funcin de distribucin de Pareto es

Si Y = F(X], entonces, por el teorema de la transformacin integral, Y sigue una distribucin uniforme en el intervalo [0,1]. Adems, X = F~\Y) sigue una distribucin de Pareto. El clculo de F~l es el siguiente: De obtene-

8 = 1 resulta F~*(y) =

^-. Para obtener la muestra simulada de X, sustituir-

mos en F ( y ) cada uno de los valores de la m.a.s. de Y. La m.a.s. de X resulta:

2. El coste total X de producir una unidad de output es la suma de un coste fijo 6 y de un coste variable inobservable (de modo que 6 es un parmetro desconocido). Se sabe que el coste total Xse distribuye con funcin de densidad / (x) = exp{ -(x- Q}} six>0,y cero en otro caso. Si el coste fijo es 6 = 2, encontrar la muestra simulada correspondiente a la siguiente m.a.s. de la distribucin t/(0,l): 0.457, 0.799, 0.878.

30

introduccin a la Inferencia Estadstica

Solucin La funcin de distribucin de X es

es decir, y = l-e (x G ) , de donde obtenemos quel-jy = e (x &). Tomando logaritmos obtenemos ln(l-j)=-(:c- 6) y, despejando x tenemos que x = F~\y] = 0-ln(l- y). Luego la muestra simulada de X correspondiente a la m.a.s. y

3. Se sabe que el nmero de personas que llegan a una carnicera es una variable que sigue un proceso de Poisson de media 3.5. Obtuvimos, utilizando la transformacin integral, una m.a.s. simulada de tamao 4 de dicha variable con valores 1, 4, 3 y 8. Encontrar todos los nmeros aleatorios del intervalo [0,1] que dan lugar a esta m.a.s. Solucin Sean xl = 1, x2 = 4 , x3 = 3 y *4 = 8. Entonces los correspondientes nmeros aleatorios del intervalo [0,1], que denotamos por ^ , y 2 , ^3 e>> 4 , han de cumplir respectivamente

donde F(JC) denota la funcin de distribucin de una variable Poisson con media 3.5, es dec ] igual a la parte entera de.

4. Partiendo de una observacin y procedente de una distribucin U(0,1), indicar cmo se generara una observacin aleatoria de cada una de las siguientes distribuciones de probabilidad: a) La distribucin uniforme entre - 10 y 40. b) La distribucin uniforme de 25 a 75. c) La distribucin de la v.a. X cuya funcin de densidad es f ( x ) = (x- 40)/200 si 40 < x < 60, y cero en otro caso. Solucin a) Es fcil comprobar que si 7~/(0,l) entonces 50-7-10 ~C/(-10,40). Por tanto, x = 50- y 10 es una observacin simulada de una distribucin U(10,40). b) Si r ~ 7(0,1), entonces 50-7+25 ~ 7(25,75). En consecuencia, x = 50- y + 25 es una observacin simulada de una distribucin 7(25,75).

Ejercicios

31

c) La funcin de distribucin de X es Luego


de donde

Como 40 < je < 60, entonces x = 40 + 20 Jy es una observacin simulada de X.

5. Generar tres observaciones aleatorias de una distribucin normal con media 10 y desviacin tpica 5. Solucin Sea X ~N(n,c>2} con // = 10 y (7 = 5. La funcin de distribucin de X tanto, dado y, * se halla con una tabla de la distribucin W(0,l). Por ejemplo, si y = 0.2 tenemos que O = 0.2 y, por tanto, =z -0.84. Obtene-

mos finalmente x - 5.8. De igual modo se pueden generar las otras dos observaciones de X. 6. Generar cuatro observaciones aleatorias de una distribucin normal con media O y desviacin tpica 1. Despus emplear estas cuatro observaciones para generar dos observaciones de una distribucin Ji-cuadrado con dos grados de libertad. Solucin Si X ~ N(0,l) entonces la funcin de distribucin de X es y - OO). Dada una m.a.s. (^,^2'^3'^4) de una distribucin 7(0,1), obtenemos una m.a.s. de X haciendo x = O"1 (>>,-). Como la suma de los cuadrados de dos normales tipificadas independientes sigue una distribucin Ji-cuadrado con 2 grados de liberes una m.a.s. de tamao 2 de una distribuci tad 1. Generar cuatro observaciones aleatorias a partir de una distribucin exponencial con media 1. Despus emplear estas cuatro observaciones para generar una observacin aleatoria que siga una distribucin gamma con parmetros 4 y 1. Solucin si Si X~Exp(l) entonces la funcin de distribucin de :c>0- Despejando je tenemos que j = -ln(l-^). Luego si (^1,^2^3,^4) es una m.a.s de una distribucin 7(0,1), entonces (xl,x2,x3,x4) es una m.a.s. de X y, por

32

Introduccin a la Inferencia Estadstica

tanto, en virtud de la propiedad que afirma que si X ~ Exp() entonces sigue una distribucin gamma con parmetros aleatoria de una distribucin gamma con parmetros 4 y 1. es una observacin

8. Un producto fabricado por una compaa requiere que se perforen cilindros en un bloque metlico y que se inserten pistones en ellos. Es necesario que los pistones tengan un radio de 1.00 centmetro por lo menos y, hasta donde sea posible, muy poco ms grande. La distribucin de probabilidad del radio del pistn (en centmetros) tiene una funcin de densidad/ (*) = 400-exp{-400(jt-1.00)} s i x > 1.00, y cero en otro caso. De igual manera, la distribucin de probabilidad del radio de los cilindros (en centmetros) tiene funcin de densidad fc(x) - 100 si 1.00 < x < 1.01, y cero en otro caso. El espacio libre entre el cilindro y el pistn es la diferencia entre sus radios. Como el cilindro y el pistn se seleccionan al azar, en ocasiones hay interferencia (es decir, espacio negativo) entre un cilindro y el pistn que va dentro. El objetivo es determinar con qu frecuencia ocurre esta interferencia en las distribuciones de probabilidad actuales. Describir cmo se realizara un experimento de simulacin para estimar la probabilidad de interferencia. Solucin Es fcil comprobar que las inversas de las funciones de distribucin para el radio del pistn y para el radio del cilindro son x respectivamente, donde y = F (x) e yc = Fc(x) siguen distribuciones uniformes en el intervalo [0,1]. A partir de dos observaciones aleatorias de una uniforme en el intervalo [0,1] obtenemos una observacin aleatoria (x p ,x c ), de la cual se obtiene una observacin aleatoria de la diferencia xc - xp . Repitiendo este proceso un nmero grande de veces obtendremos una muestra simulada de la variable diferencia. La frecuencia relativa de diferencias negativas en la muestra simulada proporciona una estimacin de la probabilidad de interferencia. 9. Los ampermetros producidos por una compaa particular se venden en el mercado con la especificacin de que la desviacin estndar de las lecturas no es mayor que 0.2 amp. Se utiliz uno de estos ampermetros para efectuar 10 lecturas independientes en un circuito de prueba con corriente constante. Si la varianza de estas mediciones es 0.05 y suponiendo que las lecturas tienen una distribucin normal, indican los datos que el ampermetro que se utiliz no satisface las especificaciones del fabricante? Solucin La especificacin que figura en los ampermetros es <7< 0.2 o, de forma equivalente, o"2 < 0.04. Puesto que E(S2) = o2, S2 tomar valores prximos a cr2 con gran

Ejercicios

33

probabilidad. Dicho de otra manera, la probabilidad de que S2 tome valores alejados de o"2 ser pequea. Por tanto, para decidir si el ampermetro satisface las especificaciones del fabricante, deberamos calcular PS2 = 0.05 / <r = 0.2) (la probabilidad del resultado muestral), pero esta probabilidad es cero ya que S2 es una variable continua. Sin embargo, podemos calcular P S2 > 0.05 / a = 0.2 j (la probabilidad de obtener un valor de S2 al menos tan grande como 0.05, cuando cr=0.2). Si esta probabilidad es pequea, concluiremos que 0.05 es un valor muy alejado del centro G . Este ser un argumento en contra de la especificacin ya que nos negamos a pensar que algo tan improbable pueda observarse. Dicha probabilidad es

que no es una probabilidad muy pequea (usualmente consideraremos que una probabilidad de este tipo es pequea si es inferior o igual a 0.05). Por tanto, no podemos dudar de la especificacin que figura en los ampermetros (no existe fuerte evidencia en contra del supuesto cr= 0.2). 10. De una poblacin normal se extrae una muestra aleatoria simple de tamao 10, obtenindose los siguientes resultados: -0.2,0.3,0.2, -0.5,0.4,0.1,0.2, -0.1, -0.3,0.2. Calcular la probabilidad de que la media muestral difiera de la media poblacional menos de 0.3. Solucin La probabilidad de que la media muestral difiera de la media poblacional menos

11. Consideremos dos poblaciones independientes X e Y tales que X ~ N(l, a2) e Y ~ N(2,<J2). Si de estas dos poblaciones se extraen m.a.s. de tamaos nx = 10 y n =16 cuyas varianzas mustrales respectivas son Sx = 0.1 y Sy = 0.05 , acotar la probabilidad P(X - Y < -0.8). Solucin Como las dos poblaciones muestreadas son normales e independientes con varianza comn, sabemos que En nuestro ejemplo, = 0.262. En consecuencia, la probabilidad deseada es

34

Introduccin a la Inferencia Estadstica

Segn las tablas de la distribucin t de Student, esta probabilidad pertenece al intervalo (0.95,0.975). 12. Un economista desea estimar la renta media fi en un barrio de una gran ciudad. Decide usar la media muestral como una estimacin de /x, y quiere asegurar que el error en la estimacin es no mayor que 40000 pesetas con probabilidad 0.90. Cul debe ser el tamao de la muestra si sabe que la desviacin tpica es 400000 pesetas? Solucin El economista desea que P\X - u < 40000] = 0.90. Suponiendo que el tamao muestral buscado n es grande podemos usar el teorema central del lmite de modo que donde , de donde obtenemos n = 271. Como el tamao muestral calculado es grande, el uso del teorema central del lmite est justificado. 13. En una fbrica muy grande donde trabajan mujeres y varones el salario por hora tiene media 1000 pesetas y una desviacin tpica de 250 pesetas. Un grupo de mujeres de esta planta muestrea 36 trabajadores mujeres y encuentra que el salario medio muestral es 850 pesetas por hora. Suponiendo que la desviacin tpica del salario de los trabajadores mujeres es de 250 pesetas, existe evidencia para sugerir que el salario medio por hora de los trabajadores mujeres es menor que el salario medio de la fbrica? Solucin Denotemos el salario, en pesetas por hora, de los empleados mujeres mediante X_ y sea E( X) = JA . Queemos decidir si n < 1000. Observamos que en la muestra, X - 850. Puesto que E(X) = // , X tomar valores prximos a (J. con gran probabilidad. Si la probabilidad P(X < 850/// = 1000) es pequea, concluimos que 850 es un valor muy alejado de// = 1000 y, por tanto, este ser un argumento en contra de ju = 1000. Utilizando el teorema central del lmite ( n = 36), dicha probabilidad es

Ejercicios

35

Como vemos, suponiendo// = 1000 la probabilidad de observar valores de la media muestral menores o iguales al valor muestral de X es muy pequea. Luego, dudamos de que en la poblacin de mujeres se cumpla que // = 1000, o lo que es lo mismo, s hay evidencia de que el salario medio de las mujeres es menor que el de todos los trabajadores. 14. Un fabricante de automviles anuncia que sus modelos compactos XYZ ofrecen en promedio un consumo de 4.35 litros por 100 km. Se sabe que la desviacin tpica poblacional es <j=0.45 litros por 100 km. Los 100 coches del modelo XYZ de una muestra elegida al azar fueron conducidos bajo idnticas condiciones en carretera abierta. a) Suponiendo que el anuncio del fabricante es verdadero, cul es la probabilidad de que la media muestral est entre 4.20 y 4.44 litros por 100 km? b) Si la media muestral result ser 4.48, qu conclusin debemos obtener en relacin a la veracidad o falsedad de la afirmacin del fabricante? Solucin a) La probabilidad de que la media muestral est entre 4.20 y 4.44 litros por 100 kilmetros es

= 0.9768, donde Z ~ N(0,1) aproximadamente. b) La media muestral es 4.48, de modo que la probabilidad de obtener una media muestral mayor o igual que la observada bajo el supuesto//= 4.35 como esta probabilidad es muy pequea, dudamos de la afirmacin del fabricante. 15. Una empresa produce pelotas de golf. De la produccin diaria se inspecciona una muestra de 80 pelotas. Si la muestra contiene un 10% o ms de pelotas defectuosas se detiene el proceso productivo y se reajusta. Si cierto da la mquina est produciendo realmente un 15% de pelotas defectuosas, cul es la probabilidad de que se detenga el proceso y se reajuste? Solucin Sea p la proporcin de pelotas defectuosas y denotemos por p la proporcin muestral de pelotas defectuosas. La probabilidad de detener el proceso cuando p = 0.15 es P(p > 0.10 / p = 0.15). Utilizando la distribucin asinttica de la proporcin muestral (con correccin de continuidad), obtenemos que

36

Introduccin a la Inferencia Estadstica

16. La media y la desviacin tpica de la variable X = renta en millones de pesetas en la poblacin formada por los 500 participantes de un congreso de economistas es // = 3.25 y <7 = 0.5, respectivamente. Si se extrae una muestra aleatoria simple de 60 participantes del citado congreso, encontrar la probabilidad de los siguientes sucesos:

Solucin El tamao de la poblacin es jV = 500 y el tamao muestral es n = 60, de modo que la fraccin de muestreo es n/N =60/500 = 0.12 > 0.05 . Como la fraccin de muestreo es mayor del 5%, en el clculo de la desviacin tpica de la media muestral es necesario utilizar el factor de correccin por poblacin finita, es decir, . Adems, dado que n es grande, por el teorema central del lmite la distribucin de . es aproximadamente una normal tipificada. Este

resultado se usa a continuacin para aproximar las probabilidades de inters.

17. Cuando una mquina est bajo control produce una media del 1 % de artculos defectuosos. Aproximar la probabilidad de que en 100 artculos producidos por la mquina bajo control existan 2 o ms defectuosos. Comparar las aproximaciones Poisson y normal con la probabilidad exacta binomial bajo la hiptesis de independencia.

Ejercicios

37

Solucin f 1 si el artculo / es defectuoso en otro caso LO nmero de artculos defectuosos en una m.a.s. de tamao 100. Entonces, si la mquina est bajo control, X ~ 5(1,0.01), por lo que Y ~ (100,0.01). La v.a. Y tiene aproximadamente una distribucin de Poisson de media A = n-p-100 0.01 = 1. Por tanto, usando la aproximacin Poisson, la probabilidad de que en 100 artculos producidos por la mquina existan 2 o ms defectuosos es Con la aproximacin normal con correccin de continuidad, la probabilidad es Sea X

La probabilidad binomial exacta es

Vemos que la aproximacin Poisson proporciona una aproximacin excelente, mientras que el error de aproximacin de la aproximacin normal es mayor de 0.04. 18. El nmero de accidentes automovilsticos en un fin de semana de 2 das en una determinada carretera puede modelizarse mediante una distribucin de Poisson de media 3. Encontrar la probabilidad de que el nmero promedio de accidentes en 45 fines de semana de dos das en esta carretera a) sea mayor que 4. b) sea menor que 2.5. c) est entre 2.8 y 3.5, ambos inclusive. Solucin Sea X el nmero de accidentes automovilsticos en un fin de semana de 2 das en la citada carretera y denotemos por Y el nmero total de accidentes en 45 fines de semana de dos das. Como es grande, en virtud del teorema central del lmite, una distribucin normal tipificada. a) La probabilidad de que el nmero promedio de accidentes en los fines de semana no festivos en esta carretera sea mayor que 4 es Adems, como n - sigue aproximadamente

38

Introduccin a la Inferencia Estadstica

b) La probabilidad de que el nmero promedio de accidentes en los fines de semana no festivos en esta carretera sea menor que 2.5 es

c) La probabilidad de que el nmero promedio de accidentes en los fines de semana no festivos en esta carretera est entre 2.8 y 3.5, ambos inclusive, es

CAPITULO 2 ESTIMACIN PUNTUAL

1. INTRODUCCIN Sea X\,...,Xn una muestra aleatoria simple de una variable aleatoria X. Si la forma funcional de la funcin de distribucin de X es conocida exceptuando los valores numricos de un nmero finito de parmetros 9l,...,9k, entonces la familia de posibles distribuciones de X es una familia paramtrica. En este caso surge un problema de inferencia cuando queremos elegir el valor numrico de alguna(s) constante(s) 9 basndonos en la informacin de la m.a.s. de X. Como sabemos, con frecuencia los valores de 6 estn restringidos por la naturaleza del problema. Al conjunto de valores admisibles para 6 le llamamos espacio paramtrico. Un estimador puntual 9 es un estadstico (funcin observable de la muestra) que slo toma valores en el espacio paramtrico. El valor que toma el estimador para una muestra concreta se llama una estimacin. La abundancia de estimadores de un parmetro hace necesaria la fijacin de las propiedades deseables que ha de satisfacer un estimador para considerarlo un buen estimador. Basndonos en estas propiedades deseables podremos elaborar algn criterio para elegir entre los posibles estimadores. En este tema estudiamos las propiedades de insesgadez y consistencia, y definimos criterios para comparar estimadores alternativos. Tambin estudiamos dos mtodos que permiten obtener buenos estimadores: el mtodo de los momentos y el mtodo de la mxima verosimilitud. 2. INSESGADEZ El comportamiento de un estimador en el proceso de muestreo repetido viene descrito por su distribucin muestral. La calidad de un estimador depende de las propiedades de su distribucin muestral. Intuitivamente es deseable que el centro de gravedad de la distribucin muestral del estimador de 9 coincida con el parmetro 9, Los estimadores que cumplen esta propiedad se llaman insesgados. Formalmente, 9 es un estimador insesgado de

40

Estimacin puntual

6 si y solo si E(9} = 6, V0e0, donde 0 denota el espacio paramtrico. Por otra parte, 6 es un estimador sesgado de 6 si E(9} ^ 9 para algn 0e 0. El sesgo de 9 como estimador de 0 se denota mediante b(9,9} y se define como b(9,9} = E(9)-9. El sesgo es un error sistemtico (en la misma direccin). La insesgadez de 9 garantiza que 9 es correcto en promedio, esto es, que la media de la distribucin de 9 es 9. Si tomamos un nmero grande de m.a.s. y para cada muestra calculamos el valor correspondiente de 9, entonces esta coleccin de valores de 9 tendr una media aproximadamente igual a 9. Ejemplos de estimadores insesgados a) En el captulo 1 se ha demostrado que E(X) = ju . Por tanto, la media muestral X es un estimador insesgado de la media poblacional i. Tambin se ha demostrado 9 9 . 9 que E(S ) = o . Por tanto, la varianza muestral S es un estimador insesgado para la varianza poblacional b) Si la media poblacional / es conocida, entonces es un estimador insesgado para o1. En efecto,

Ejemplo de estimador sesgado Vamos a ver que sesgo es En efecto, es un estimador sesgado para acuyo

y por tanto 9* es sesgado para <j 2 . Adems, Los estimadores insesgados cumplen la siguiente propiedad de invarianza ante transformaciones lineales: Si 9 es insesgado para 9entonces a-9 + b es insesgado para a-9+b. En consecuencia, si E(9} = a9 + b entonces E\(9-b)/a\ = 9, y por tanto (9 - b)/a es un estimador insesgado para 9. En general no es cierto que si E( 9 ) = 9 entonces Ef(0)} = f(0) con/una funcin cualquiera. As, por ejemplo, S2 es un estimador insesgado para <j 2 , pero S = VS no es un estimador insesgado para o-\G . Suponiendo que Xsigue una distribucin normal se puede demostrar que E(S) = aJ -, con lo

41

que S es un estimador sesgado para <7 y 6 = insesgado para 3. CRITERIO DEL ERROR CUADRTICO MEDIO

S es un estimador

Es la insesgadez necesariamente una propiedad deseable de un estimador? Para responder esta pregunta veamos un ejemplo.^En te figura 3.1 se han representado las funciones de densidad de dos estimadores 6\ y 92, donde 6\ es insesgado para O pero #2 es sesgado para 6. Observamos que la distribucin de 9} tiene una dispersin respecto a 6 muy grande, mientras que la de 92 est concentrada alrededor de & (que es prximo a 6). Entonces el estimador sesgado 62 puede ser preferido al estimador insesgado 0\. Es necesario por tanto observar la variabilidad del estimador respecto a 6 para hacer una eleccin.

Figura 3.1.

La varianza de un estimador O mide la dispersin de O respecto a E(6}. Si 6 es insesgado, su varianza da una buena medida de su precisin. En cambio, si O es sesgado, la varianza de 9 no es una medida adecuada de su precisin y debemos considerar la variabilidad de 9 respecto a 9. Para medir esta variabilidad usamos el error cuadrtica medio, denotado por ECM, y que se define como ECM(9}- E\(9-9)1\. Se puede probar que el ECM es igual a la suma y el del sesgo, es decir, cuadrado de la varianza . En efecto,

yaque Menor ECM significa mayor precisin. Al comparar dos estimadores de 0, el criterio del error cuadrtico medio implica elegir el que tenga menor ECM. As, si

42

Estimacin puntual

ECM(0\) < ECM(62), V#G 0, con desigualdad estricta para al menos un 6, entonces el estimador d{ es preferido a 62 Con frecuencia esta comparacin se efecta mediante el cociente ECM(62}/ECM(6\), llamado eficiencia relativa de 0{ con respecto a #2 Y denotado por ER(6{,62} Es obvio que, segn el criterio del error cuadrtico medio,0} es preferido a 92 si ET?^,^)^! con desigualdad estricta para al menos un 6. Si los estimadores 0l y 62 son insesgados para 6, entonces la eficiencia relativa de 9\ con respecto a 0~> es el cociente de varianzas, es decir, ER(6\,62) = V(d2)V(6\). En consecuencia, en la clase de estimadores insesgados para 6, el criterio ECM es equivalente al criterio de mnima varianza. Cuando se dispone de dos estimadores insesgados para un mismo parmetro, el criterio del error cuadrtico medio conduce a elegir el estimador de menor varianza.
/ \
1

'

Ejemplo 3.1. Estimacin de la varianza de una poblacin normal Sea Xl,...Xn una m.a.s. de una distribucin normal con media // y varianza <j2 desconocidas. Si deseamos estimar <72 ya sabemos que S es insesgado para o2 . Si consideramos que escoger un estimador sesgado no es un obstculo podemos encontrar un estimador con menor ECM. Supongamos que deseamos el estimador con menor ECM de la clase de todos los estimadores de la forma Tc - cS2 donde o O es una constante que hay que determinar.

Como , por tanto

tenemos que . Adems el sesgo de

Si hacemos w(c) = en c = c* que resuelve

entonces el mnimo de ra(c) se alcanza en . Como

tenemos que c* =

. Entonces,

es el estimador que tiene el mnimo ECM en la clase de todos los estimadores Observamos que
2

de modo que 7

como estimador de <j tiene sesgo negativo y, por tanto, tiende a subestimar <j2 .

43

4. CONSISTENCIA A menudo deseamos estimar un parmetro O con un error menor que un valor prefijado e. Esto no puede cumplirse con certidumbre porque 6(x,,...,xn) es una variable aleatoria. Sin embargo, podemos calcular la probabilidad P\\0(x,...,xn)-0 < e\ como una funcin de 6, e y n, y usar esta probabilidad como una medida de la proximidad de 0 respecto a 9. Intuitivamente es deseable que cuando el tamao muestral aumente, el sesgo disminuya. Esto no ocurre necesariamente a menos que la distribucin de 0 tienda a concentrarse alrededor de O cuando el tamao muestral aumenta. Esta propiedad se llama consistencia. Un estimador 0 es consistente para 9 si para todo e > O se cumple que cuand bv O cuando n oo , decimos que 9 converge en probabilidad a 9 y escribimos tambin plim# = 9). Hay que enfatizar que la consistencia es una propiedad de una secuencia de estimadores y es una propiedad de muestra grande. A continuacin describimos algunos resultados que son tiles para comprobar si un estimador es consistente. Proposicin 4.1. Si lim E(9 entonces 0n es consis-

tente para 9. En particular, si E(9n) = 0 (es decir, 9n es insesgado) y lim V(9n) = O, entonces 9 Demostracin Segn la desigualdad de Markov, cualquier variable aleatoria no negativa X para la que O < E(X) < o , verifica la desigualdad P(X >)< E ( X ) / , VA > O. Para como

y, por tanto, 9 Ejemplo 4.1. Si X^...,Xn es una m.a.s. de una poblacin X con media JL y varianzacr (finita), entonces satisface

En
>ju. Si usamos el

consecuencia, X es un estimador consistente para /n, es decir, X necesitamos estimar el momento poblacional de orden

44

Estimacin puntual

momento muestral de orden


cs dccir

que es consistente e insesgado para


suponiendo

Proposicin 4.2. 1. Sea g una funcin continua. Si 6n >6 entonces g(0n)^-g(0). 2. Si 6 entonces:

entonces 0 que F es continua.

es dicir

para todox en

La demostracin de este resultado se omite. Sin embargo la utilidad del resultado se ilustra en los siguientes ejemplos. Ejemplo 4.2. Estimacin de la varianza poblacional Sabemos que si X^,...,Xn es una m.a.s. de una poblacin con varianza o1 1 n entonces la varianza muestral es un estimador insesgado de a . Supongamos E(X ) < o o . Entonces, por la consistencia de los momentos mustrales para los momentos poblacionales y la parte 2 de la proposicin 4.2, tenemos que

En consecuencia, 52 es consistente para O" 2 . Por la parte 1 de la proposicin 4.2 resulta que S es consistente para (7, aunque 5 no es insesgado para a. Observamos que tambin es consistente par

Ejemplo 4.3. La variable aleatoria T converge en distribucin a una normal Cuando muestreamos una poblacin normal, sabemos que tiene una

distribucin t de Student con (n-l) grados de libertad y puede escribirse como Observamos que (X-ju)^n/(7 normal tipificada mientras S/G tiene una distribucin exacta

>1 (segn el ejemplo anterior). Por tanto, la

45

parte 3 de la proposicin 4.2 implica que T converge en distribucin a una normal tipificada. Si las X no son normales pero tienen varianza finita cr2 y E(Xf} < , entonces por el teorema central del lmite se obtiene el mismo resultado. Ejemplo 4.4. Consistencia de la funcin de distribucin emprica Sea X\,...,Xn una m.a.s. de una funcin de distribucin F. La funcin de distribucin emprica de la muestra se define por nmero de X menores o iguales que F = numero de X meores o iguales que x. Entonces Y sigue una distribucin binomial con parmetros Por la consistencia de la media muestral para la media poblacional resulta que 5. MTODO DE LOS MOMENTOS 5.1. Introduccin El mtodo de los momentos es posiblemente el mtodo de estimacin ms antiguo. Consiste en tomar como estimador de la caracterstica numrica de la poblacin (parmetro) la correspondiente caracterstica numrica de la muestra (estadstico); por ejemplo, tomar como estimador de la media poblacional fj. la media muestral X, como 9 9 estimador de la varianza poblacional o la varianza muestral S , etc. Supongamos que se trata de estimar un vector de parmetros 9 = (9^...,9k] cuyas componentes son funciones de los momentos poblacionales:

Entonces, calculamos

los correspondientes momentos mustrales y los sustituimos en el sistema de ecua-

ciones. As obtenemos los estimadores por el mtodo de los momentos de 61,62,...,0k. 5.2. Ejemplos de estimadores obtenidos por el mtodo de los momentos a) Sea X\,...,Xn una m.a.s. de una distribucin de Poisson con parmetro desconocido. Como m\ = E(X} es A , tenemos que = m} y, por tanto, el estimador de A por el mtodo de los momentos es

46

Estimacin puntual

b) Sea X\,...,Xn una m.a.s. de una distribucin uniforme en el intervalo [0,b] donde b es desconocido. Como w = E(X] es b/2, tenemos que consecuencia, el estimador de b por el mtodo de los momentos es c) Sea X,...,Xn una m.a.s. de una distribucin normal con media JUQ y varianza <j2 (desconocida). Como W j = / 0 es conocido entonces Luego el estimador de o1 por el mtodo de los momentos es

5.3. Propiedades de los estimadores obtenidos por el mtodo de los momentos


sabemos que
. Por tanto, si quere-

mos estimar los momentos poblacionales, el mtodo de los momentos proporciona estimadores insesgados y consistentes. Adems, en virtud del teorema central del lmite, los estimadores de los momentos poblacionales obtenidos por el mtodo de los momentos tienen una distribucin asinttica normal. En general, si h es una funcin continua, el estimador por el mtodo de los momentos 9 es consistente para d. Bajo algunas condiciones dbiles sobre la funcin h, el estimador 9 es tambin asintticamente normal. 6. MTODO DE LA MXIMA VEROSIMILITUD 6.1. Introduccin Ya sabemos que la distribucin conjunta de la muestra representa la probabilidad de obtener cada combinacin de valores de las variables X. Ms explcitamente, sea X una v.a. y sea X},...,Xn una m.a.s. de X. La funcin de densidad conjunta es: si las X son discretas
si las x son continuas

Cuando 9 es conocido, esta funcin permite calcular la probabilidad de aparicin de cada muestra particular. Pero en inferencia, en un problema de estimacin se conoce un valor particular de la muestra Xl,...,Xn y 9 es desconocido. Como los valores mustrales de X{,...,Xn son conocidos y Oes desconocido, podemos considerar la expresin de la funcin de densidad conjunta como una funcin de 9. Esta funcin se llama funcin de verosimilitud y la denotamos por L(9), es decir, L(9}- /(*],...,*;#). Supongamos que tuvisemos que decidir entre dos valores posibles para B, 0, y 9r Si, por ejemplo, L(0,)>L(0 2 ) intuitivamente pensaramos que, a la vista de los resultados mustrales, el valor de 9} es ms plausible o ms verosmil que el de 9 . El mtodo de estimacin maximoverosmil (o de la mxima

47

verosimilitud) consiste en elegir como estimador de 6 aquel valor 6 que haga mxima la probabilidad de aparicin de los valores mustrales efectivamente observados o, lo que es lo mismo, que maximice la funcin de verosimilitud. En la prctica, para encontrar el estimador maximoverosmil conviene trabajar con el logaritmo neperiano de la funcin de verosimilitud denotado por In L. Como el logaritmo es una funcin montona creciente, si L alcanza el mximo en 6 entonces In L tambin alcanza el mximo en 9. Diremos, por tanto, que 6^y es el estimador maximoverosmil de 6 (estimador MV de 6) si L0MV;x{,...,xn} = sup L(6;x\,...,xn} o, equivalentemente, Si la funcin de verosimilitud es diferenciable en el espacio paramtrico 0, para obtener 9MV podemos resolver las ecuaciones de verosimilitud = O y comprobar que 6.2. Ejemplos de estimadores maximoverosmiles a) Estimacin maximoverosmil de la media de una distribucin Poisson El nmero de llamadas equivocadas recibidas en una centralita telefnica se modeliza con frecuencia mediante una distribucin de Poisson. Sean X^,...,Xn el nmero de llamadas equivocadas en n das diferentes. Si suponemos que el nmero medio de llamadas equivocadas es el mismo, digamos A,, en cada da y que los sucesos son independientes, entonces

En consecuencia

proporciona el estimador maximoverosmil

b) Estimacin de 6 para una distribucin uniforme U(Q,0) Supongamos que un autobs llega a una parada entre la hora O y la hora 6 (inclusive) y que la probabilidad de llegada en cualquier subintervalo de tiempo es proporcional a la longitud del subintervalo. Entonces el tiempo X que tiene que esperar una persona que llega a la hora O sigue una distribucin uniforme en el intervalo [0,0]. Para estimar 9 suponemos que tomamos una m.a.s. de n observacio-

48
nes de X. La funcin de verosimilitud de la

Estimacin puntual

muestra

es

en otro caso Pero esta funcin no es diferenciable para todo 6 (no es continua para todo 0). Observando que Q<x.<6, i=l,2,...,n, es equivalente a 0<jc (w) <0, donde (w) = maxjjc,}, podemos escribir la funcin de verosimilitud como

cuya representacin grfica aparece en la figura 6.1.

Figura 6.1.

El mximo de la funcin de verosimilitud se alcanza en Q=x{fl) y, por tanto, el estimador maximoverosmil de 6 es 0(Xl,...,Xn') = max{Jfj,..., X n } = X^, supuesto que Jf(w) * O . Este resultado se obtiene observando que L(6) es una funcin positiva para G>x^n) (y cero en el resto) y estrictamente decreciente para 0>*(w), de modo que el mximo de L(9) se alcanza en 0=Jt(M). Puede comprobarse que 0 es consistente para O pero no es insesgado. c) Estimacin de la media y la varianza de una distribucin normal Sea Xl,...,Xn una m.a.s. de una distribucin normal con media y varianza o2 . Supongamos que fJ. y a1 son desconocidos, de modo que 6 = (//, cr 2 ). La funcin de verosimilitud es L(0',x\,...,xn) = modo que In L(0) . Diferenciando In L(6)

49

con

respecto

//

<j2

obtenemos . Resolviendo simultneamente las dos ecua-

cones de verosim mximo verosmiles

d = O obtenemos los estimadores

Observamos que, aunque // es insesgado para //, cr es sesgado para <j ya que Adems, / / y o " son estimadores consistentes para ju y cr 2 , respectivamente. Si // es desconocido y <j2 es conocido, el mismo argumento conduce a / = X como estimador maximoverosmil de u. Si cr2 es desconocido y u conocido, el estimador maximoverosmil de 6.3. Propiedades de los estimadores maximoverosmiles En general un estimador maximoverosmil no es nico y puede ser sesgado. Sin embargo, bajo algunas condiciones razonables, puede demostrarse que el mtodo de la mxima verosimilitud proporciona estimadores consistentes que tienen distribucin asinttica normal. La normalidad asinttica de los estimadores maximoverosmiles es muy til para efectuar inferencias estadsticas basadas en muestras grandes. Los estimadores maximoverosmiles cumplen tambin la siguiente propiedad de invarianza: Si O es un estimador maximoverosmil de 6 y d es una funcin biunvoca o biyectiva, entonces d( 9) es un estimador maximoverosmil de d(&). En efecto, por ser la funcin d biunvoca, existe d~x y adems se cumple que L(0\xl,...,xn) = L\d~l(d(0));x{,...,xn \ = L[d(0);xl,...,xn], donde L(d(0)) = L\d~l(d(0))\ .Si 6 es un estimador MV de 6, entonces \/0e0 se cumple que Lj(^;xp...,xJ = l(^;^ 1 ,...,x w )>L(6';x 1 ,...,x w ) = L[/(<9);A:1,...,Jcw].Portanto, el estimador maximoverosmil de d(6) es d(0). El uso de la propiedad de invarianza de los estimadores MV simplifica en algunas ocasiones el clculo como se ilustra en el siguiente ejemplo. Ejemplo 6.1. Estimacin de p2 en una distribucin Bernouilli Sea Xl,...,Xn una m.a.s. de una distribucin Bernouilli con parmetro p. Supongamos que queremos estimar 6= p2. Observamos que#= d ( p ) = p1 es una funcin biyectiva de [0,1] en [0,1] con funcin inversa p = 01'2 . Es fcil comprobar que X es el estimador MV de p, de modo que por la propiedad de invarianza el estimador MV de 9 es X2.
V

50

Estimacin puntual

EJERCICIOS 1. Se toma una m.a.s. de tamao n de una poblacin exponencial de media 6, de modo que la funcin de densidad poblacional es cero en otro caso. a) Obtener el estimador de 6 por el mtodo de la mxima verosimilitud. Es insesgado el estimador obtenido? b) Obtener un estimador maximoverosmil de 62. c) Determinar un estimador insesgado de 62 basado en el estimador maximoverosmil encontrado en b). Solucin a) La
v

funcin

de

verosimilitud

de

la

muestra

es

y su logaritmo . El valor de 0que maximiza esta funcin = O y comprobando que, en el

neperiano es In L(6} = n\n&

se obtiene resolviendo para 9 la ecuacin

punto solucin, la segunda derivada de lnL(0) respecto a 6 es negativa. De obtenemos que 6=X. Por otra parte,
. Por tanto, ^ = yV es el estimador

maximoverosmil de 6, y es insesgado porque sabemos que la media muestral es insesgada para la media poblacional. b) Como Q = X es el estimador maximoverosmil de 6, por la propiedad de invarianza de los estimadores mximo verosmiles, 62 = X2 es el estimador maximoverosmil de O 2 . c) La esperanza del estimador maximoverosmil de d2 es . Por tanto,
X es sesgado para B . Observamos que El X l- d , de modo que

es un estimador insesgado para 6 2 basado en el estimador maximoverosmil de 6. 2. El porcentaje X de un componente en un producto tiene una funcin de densidad cero en otro caso. a) Dada una m.a.s. de tamao n, calcular el estimador de 6 por el mtodo de los momentos y analizar su consistencia.

Ejercicios

51

b) Suponiendo que el tamao muestral es uno, calcular el estimador maximoverosmil de 6 y comparar la eficiencia de los estimadores obtenidos por los mtodos de la mxima verosimilitud y de los momentos. Solucin a) El primer momento poblacional es

Por tanto, el parmetro 6 expresado como funcin del primer momento poblacional (u) es 9 = 3/1. Sustituyendo el primer momento poblacional por el primer momento muestral (X) obtenemos que el estimador por el mtodo de los momentos de 9 es 6 = 3X . Analicemos la consistencia de este estimador usando la proposicin 4.1. Por una parte, E(3X) = 3E(X) = 3E(X) = 3 = O, es decir, 3X es insesgado para 6. Por otra parte, como
n

E ( X 2 ) = (

mos que

> O. Luego 3 X es consistente para 9.

b) Sea x el valor muestral obtenido. El logaritmo de la funcin de verosimilitud de la muestra es In . El valor de O que maximiza esta fun= O . En cin se obtiene resolviendo para 9 la ecuacin de verosimilitud este caso resulta = O, es decir,

= O, cuya solucin es

9 = 2x . Por tanto, 0 = 2X es el estimador maximoverosmil de 9, mientras que el estimador de 9 por el mtodo de los momentos para el caso particular n = 1 es 9 = 3X . Para comparar la eficiencia de estos dos estimadores usaremos el cociente ECM(6)/ECM(6), que mide la eficiencia relativa de 9 respecto a 0 . Para calcular ECM(0), primero observamos que E(9} = 2E(X) = , de modo que el estimador por el mtodo de la mxima verosimilitud es sesgado para 9 con varianza

As,

ECM(0) = V(0) + (b(0,0)J

+ = .

Por

otra

parte,

52

Estimacin puntual

. Por tan Luego el estimador obtenido por el mtodo de la mxima verosimilitud, 2 X , es ms eficiente que el estimador obtenido por el mtodo de los momentos, 3X. 3. Se extrae una muestra aleatoria simple de tamao n de una variable aleatoria X con funcin de densidad y cero en otro caso. Los parmetros a y f cumplen las restricciones a) Suponiendo {$ conocido, encontrar un estimador de a por el mtodo de los momentos y demostrar su consistencia. b) Suponiendo oc conocido, encontrar un estimador insesgado de 3 basado en el estimador maximoverosmil. Solucin a) El primer momento poblacional es

Por tanto, el parmetro a expresado como funcin del primer momento poblacional es a = . Sustituyendo el primer momento poblacional por el primer \-P momento muestral obtenemos que el estimador por el mtodo de los momentos de a Este estimador es consistente para a pues haciendo uso de la proposicin 4.2 tenemos que phm b) Veamos cul es la estimacin maximoverosmil de a . La funcin de verosimilitud es L(fi) = si x>/3( i = 1 , . . . , n), y cero en otro caso. Aqu el
TY1

dominio de definicin de la funcin de verosimilitud depende de fi. Si inconscientes no. " diferenciamos lnL(/7) llegaramos a = O que da /? = . En casos como este, en los que el dominio de definicin de la funcin de verosimilitud depende del parmetro, se necesita llevar mucho cuidado para encontrar el estimador maximoverosmil. Para escribir L(ff) sin la parte x .> ft (i = 1 , . . . , n) usamos una funcin indicador. Sea A un conjunto cualquiera. Definimos la juncin indicador de A mediante . Las funciones indicador tienen propiedades simples, y la

Ejercicios

53

propiedad ms til que necesitamos es que I A ( x ) - I B ( x ) = IAl^B(x) . Usando la funcin indicador podemos reescribir L(P) como anBna Adems es (l)= > como equivalente a ;c (1) >/3, la funcin de verosimilitud tambin se puede escribir como Observamos que L(/3) es positiva para valores P iguales o menores que el mnimo valor observado de la muestra y cero para valores P mayores que el mnimo valor observado de la muestra. Como resulta que L(j3) es una funcin creciente con p. Por tanto, el dft p mximo de L(p) se alcanza en x (1) . As, el estimador maximoverosmil de P es Si queremos encontrar un estimador insesgado de P basado en el estimador P=X(V), calculamos la esperanza de X^. Para encontrar la esperanza de.Y(1) necesitamos la funcin de densidad de X(l}, que es de la forma
=*(!)

pues
Asi, Luego moverosmil. 4. Se extrae una m.a.s. de tamao n de una variable aleatoria X con funcin de densidad a) Demostrar que y cero en otro caso. como estimador de 6 es insesgado y consistente. es un estimador insesgado de P basado en el estimador maxi-

b) Encontrar razonadamente otro estimador insesgado para 6. c) Calcular la eficiencia relativa del estimador insesgado obtenido en el apartado b) respecto al estimador insesgado obtenido en el apartado a).

54

Estimacin puntual

Solucin a) El estimador es insesgado para 9 ya que

Por la parte 1 de la proposicin 4.2, como nua, entonces consistente para d. b) La funcin de verosimilitud de la muestra es
e

es conti, es decir, el estimador es

0<JC

y cero en otro caso. El logaritmo neperiano de la parte

positiva de la funcin de verosimilitud es lnZ,(0) = ln3+ ^Zln;*:,- -3ln0. Como = < O, resulta que la parte positiva de la funcin de verosi-

militud es decreciente con 6. La funcin de verosimilitud se puede escribir como Observamos que L(9) es positiva para valores 9 iguales o mayores que el mximo valor observado de la muestra y cero para valores 9 menores que el mximo valor observado de la muestra. Por tanto, el mximo de L(9) se alcanza en x(n). As, el estimador maximoverosmil de 9 es 9 = X(n}. Si queremos encontrar una estimador insesgado de 9 basado en el estimador Q = x(n), primero calculamos la esperanza de X(n). Para realizar este clculo necesitamos la funcin de densidad de X^, que es de la forma

As

Luego es otro estimador insesgado para 9. c) Vamos a comparar la eficiencia de los dos estimadores insesgados mediante el criterio de mnima varianza, considerando la eficiencia relativa de pecto a res-

Ejercicios

55

El clculo de las varianzas de estos estimadores se realiza de la siguiente manera.

con siendo Por otra parte,

donde

con donde

En consecuencia,

y, portante, Entonces,

Por tanto, el estimador insesgado

basado en el estimador maximove-

rosmil de 6 es ms eficiente que el estimador insesgado X que se obtiene por el mtodo de los momentos. 5. Sea Xl,...,Xn una m.a.s. de una variable aleatoria X con funcin de densidad y cero en otro caso. a) Encontrar por el mtodo de la mxima verosimilitud un estimador para (a,B). b) Suponiendo 6 conocido, encontrar por el mtodo de los momentos el estimador de a y demostrar su consistencia.

56

Estimacin puntual

Solucin a) La funcin de verosimilitud de la muestra es y cero en otro caso. El logaritmo neperiano de la funcin de verosimilitud es In
v

. Diferenciando con

respecto a a e igualando a O obtenemos

de donde se deduce que a

es el estimador

maximoverosmil de a. Diferenciando con respecto a 6 obtenemos

de modo que L(9) es una funcin decreciente con 9. Como x< O Vi= 1,... ,n es equivalente a jc(w) < 6, tenemos que L(0) es positiva para 6>X(n} y cero para (n). Entonces el mximo de L(0) se alcanza en X(ny As, el estimador maximoverosmil de 6 es O = X (w) . Por tanto, el estimador maximoverosmil para (a,0)

b)

El

primer

momento

poblacional

es

6. Expresando a como funcin de Wj obtenemos = . Sustituyendo el primer momento poblacional por el

primer momento muestral obtenemos que el estimador por el mtodo de los momentos de d es

Este estimador es consistente para a pues haciendo uso de la proposicin 4.2 tenemos que plim

Ejercicios

57

6. Sea Xl,...,Xn una muestra aleatoria simple de una poblacin X con funcin de densidad f ( x ) = exp{-O -//)/cr} si x > u , y cero en otro caso. <j a) Si o es conocido, encontrar por el mtodo de los momentos un estimador puntual para //. b) Si ambos parmetros, / / y a , son desconocidos, cul es el estimador mximo verosmil para (n,o)l
Solucin

a) Para facilitar la obtencin de la esperanza de X observamos que Y = X - fj. sigue una distribucin exponencial de media o y, por tanto, m} = E(X)=LL+ a. Por tanto, el parmetro ju expresado como funcin del primer momento poblacional es (JL= m,- cr. Igualando el primer momento poblacional al primer momento muestral obtenemos que el estimador por el mtodo de los momentos de fJ. es // = X - o . b) La funcin de verosimilitud es Xj > ju, y cero en otro caso. El logaritmo de la parte positiva de la funcin de verosimilitud es In a w obtenemos Diferenciando con respecto = > O, es decir, L(a,<j) es creciente con respecto a //.

Como x > u Vi = !,..., es equivalente a x(1) > //, tenemos que L(n,a) es positiva para / / < x(1) y cero para // > jc (1) . Entonces, el mximo de L(n,<3) se alcanza en X^ . As, el estimador maximoverosmil de u es ju = X(l). Diferenciando con respecto a <7 e igualando a O obtenemos

de donde se deduce que

es el estimador maximo-

verosmil de o. En definitiva, el estimador maximoverosmil para (/i,cr) es

7. Sea X una v.a. continua con funcin de densidad y cero en otro caso. Obtener el estimador de j3 por el mtodo de los momentos para una m.a.s. de n observaciones y analizar la consistencia del estimador obtenido.

58

Estimacin puntual

Solucin El

primer

momento

poblacional

es

El parmetro 5 como funcin del primer momento poblacional es 3 = //. Sustituyendo el primer momento poblacional por el primer momento muestral obtenemos que el estimador por el mtodo de los momentos de /3 es /? = X. Este estimador es consistente para f pues haciendo uso de la proposicin 4.2 tenemos que X y, por tanto, 8 >//, por lo que

8. El coste total X de producir una unidad de output es la suma de un coste fijo Q y de un coste variable aleatorio inobservable, donde 6 es un parmetro desconocido. Se sabe que el coste total X se distribuye con una funcin de densidad. /(#) = exp{#- x] si *> 0, y cero en otro caso. Supongamos que se toma una m.a.s. de tamao n de dicha variable aleatoria X. a) Encontrar un estimador maximoverosmil del coste fijo 9. b) Estimar el coste fijo O por el mtodo de los momentos y analizar la consistencia del estimador obtenido. c) Obtener los estimadores insesgados del coste fijo Abasados en los estimadores encontrados en a) y b). d) Encontrar la eficiencia relativa de los dos estimadores insesgados obtenidos en c). Solucin a) La funcin de verosimilitud de la muestra es

L(0) es positiva para 0^x) (y cero para 0>*(1)) y creciente para 9>xw. Luego el mximo se alcanza en jc (1) . Por tanto, el estimador maximoverosmil de 0es 6 = X(^. b) El primer momento poblacional es

El parmetro 0como funcin del primer momento poblacional es d=[i-l. Sustituyendo el primer momento poblacional por el primer momento muestral obtenemos que el estimador por el mtodo de los momentos de 6 es 6 X 1. Este estimador es consistente para 0pues haciendo uso de la proposicin 4.2 tenemos que por lo que y, por tanto,

Ejercicios

59

c) Para facilitar la obtencin de la esperanza de X(l) observamos que Y=X- 9~Exp(l), es decir, Y se distribuye con una funcin de densidad f ( y ) = exp{-^} si y > O , y cero en otro caso. Entonces, la funcin de densidad de

Por tanto, Y
asi

tiene una distribucin exponencial con media l/n, es decir,


luego

consecuencia, X({) es un estimador insesgado de 6. Por otra parte, Luego X -1 es otro estimador insesgado para 9. d) Vamos a comparar la eficiencia de los dos estimadores insesgados mediante el criterio de mnima varianza. La eficiencia relativa de X(]) respecto a X-l es ER\X(])-- X-l =-r_ = __ = -7-3- = / i , que es mayor que la

unidad para n > 1. Luego el estimador insesgado basado en el estimador mximoverosmil es ms eficiente que el estimador insesgado obtenido por el mtodo de los momentos. 9. Sea X},...,Xn una m.a.s. de una distribucin gamma con funcin de densidad cero en otro caso. a) Suponiendo que r y A son desconocidos, obtener por el mtodo de los momentos los estimadores de r y A . b) Si r = 3, calcular el estimador de A por el mtodo de los momentos. c) Si r 3, obtener el estimador maximoverosmil de A . Solucin a) Los dos primeros momentos de la distribucin gamma con parmetros r y /I son Resolviendo para los parmetros r y A ^ . Sustituyendo

se obtienen las siguientes expresiones: A =

el primer y segundo momentos poblacionales por los correspondientes momentos mustrales obtenemos que los estimadores por el mtodo de los momentos de A y r

60

Estimacin puntual

son, respectivamente,

b) Como w1 = , entonces A = es el estimador de A por el mtodo de los momentos. c) La funcin de verosimilitud es logaritmo neperiano es ln que maximiza esta funcin se obtiene resolviendo para A la ecuacin que en este caso es . As, el estimador maximoverosmil de es
el valor de

10. Sea X},...,Xn una m.a.s. de una poblacin con funcin de densidad f ( x ) = 2x/62 si 0<;c< 9, y cero en otro caso. a) Encontrar un estimador de Q por el mtodo de los momentos y estudiar si cumple las propiedades de insesgadez y consistencia. b) Obtener un estimador maximoverosmil de 6, calcular su sesgo y estudiar su consistencia. Solucin a) El primer momento poblacional es Entonces el parmetro 9 como funcin del primer momento poblacional viene dado Sustituyendo el primer momento poblacional por el primer momento muestral obtenemos que el estimador por el mtodo de los momentos de 9 es Este estimador es insesgado para Q pues Para estudiar si este estimador insesgado es consistente, comprobaremos si

Ejercicios

61

como

tenemos

que

Luego efectivamente 9 es consistente para 6. b) La funcin de verosimilitud de la muestra es , y cero en otro caso. El logaritmo neperiano de la parte positiva
;-2nln&

. Diferenciando con respecto a 9 ob-

tenemos

< 0 . En consecuencia, L(9) es una funcin decrecien-

Haciendo uso de una funcin indicador, la funcin de verosimilitud se puede escribir como Es decir, L(0) es positiva para

valores 9 iguales o mayores que el mximo valor observado de la muestra, y cero para valores 9 menores que el mximo valor observado de la muestra. Por tanto, el estimador maximoverosmil de 9 es 9= X(n). Si queremos encontrar un estimador insesgado de 9 basado en el estimador 9 = Xw, calculamos la esperanza de XM . Para encontrar la esperanza de X(n) necesitamos la funcin de densidad de X ( n ^ . Como la funcin de distribucin de X es forma f caso. As, E(X la funcin de densidad del mximo es de la
cero en otro

Para comprobar que el estimador maximoverosmil de 9 es consistente (usando la proposicin 4.1), probaremos que lim E(X vemos que lim'(^ sesgado como Primero

es decir, X(n) es asintticamente intenemos que

consistente para 9.

62

Estimacin puntual

11. Sea X{,...,Xn una muestra aleatoria simple de una poblacin con funcin de densidad f ( x ) = (9 + \)xe si 0< x < 1, y cero en otro caso (siendo 0>-l). a) Obtener el estimador de 6 por el mtodo de los momentos y demostrar que es consistente. b) Obtener el estimador maximoverosmil de 9. Solucin a) El primer momento poblacional es

Por tanto, el parmetro 6 expresado como funcin del primer momento poblacional es 0 . Sustituyendo el primer momento poblacional por el primer

momento muestral obtenemos que el estimador por el mtodo de los momentos de 6 es . Este estimador es consistente para 9 pues por la proposicin 4.2

tenemos que pli b) La funcin de verosimilitud es no es In obtiene resolviendo para 9 la ecuacin que es equivalente a estimador maximoverosmil de y su logaritmo neperiaEl valor de 9 que maximiza esta funcin se = O, es decir, . Por tanto, el

CAPITULO 3 ESTIMACIN POR INTERVALOS DE CONFIANZA

1. INTRODUCCIN En el captulo anterior hemos estudiado las propiedades que deben poseer los buenos estimadores puntuales y hemos expuesto dos mtodos de estimacin y las propiedades de los estimadores que producen. En cualquier situacin, la eleccin de un estimador particular depende de factores estadsticos (tales como fiabilidad del proceso de muestreo, validez del modelo asumido, etc.) y de factores no estadsticos (implicaciones econmicas, razones prcticas y facilidad de ejecucin). Una estimacin puntual tiene poco significado por si sola, ya que generalmente difiere del verdadero valor del parmetro. Es adems necesario medir la precisin del estimador puntual y tener informacin sobre el posible error de estimacin asociado a la estimacin puntual. Para proporcionar esta informacin adicional, la estimacin puntual se suele acompaar de un intervalo de estimacin que indica un rango de valores del parmetro y una medida del grado de confianza que tenemos en que el intervalo de estimacin incluya el valor verdadero del parmetro. Antes de formalizar el concepto de intervalo de confianza ilustramos las ideas subyacentes en el ejemplo siguiente. Ejemplo 1.1 Sea X ~ N(ju,(J2) con o1 conocido. Supongamos que disponemos de una m.a.s. de tamao n de X y queremos estimar \i. Sabemos que en esta situacin cumple y, por tanto, para un valor prefijado a, 0<a<l, se y tambin de forma equivalente

54

Estimacin por intervalos de confianza

Esta ltima probabilidad la podemos escribir asimismo de la forma Es decir, el intervalo

\ contiene el verdadero valor de // con una probabilidad 1-a. Un intervalo aleatorio tal como
se lama

intervalo de confianza para// con nivel de confianza 1-a. Simblicamente,

Debe observarse que en el momento en que tomamos una m.a.s. y en el anterior intervalo sustituimos la v.a. X por su valor muestral, obtenemos un intervalo fijo (llamado intervalo de estimacin) para el cual ya no tiene sentido hablar de la probabilidad de que i est contenido en l. Sin embargo, si extrajramos muchas muestras y calculsemos para cada muestra el correspondiente intervalo de estimacin, aproximadamente el (l - c] 100% de dichos intervalos incluiran el verdadero valor de \i y el a-100% de dichos intervalos no contendran i. Es en este sentido en el que podemos decir que tenemos una confianza del (!-*) 100% de que un intervalo de estimacin especfico contenga el JL verdadero. Por este motivo los intervalos de estimacin tambin se llaman intervalos de confianza. Estas ideas se ilustran en la figura 1.1. La parte superior de la figura 1.1 presenta la distribucin muestral de la media muestral de n observaciones procedentes de la poblacin normal del ejemplo 1.1. Como se ha visto, un intervalo de confianza para la media poblacional estar basado en el valor observado de la media muestral, es decir, en una observacin extrada de la distribucin muestral de X .La parte inferior de la figura muestra una sucesin de intervalos de confianza con nivel de confianza del (l-df)-100% obtenidos de muestras independientes de la poblacin. Los centros de estos intervalos, que son simplemente los valores observados de la media muestral, estarn con frecuencia muy cerca de la media poblacional jU. Sin embargo, algunas medias mustrales pueden estar sensiblemente alejadas de j u . No obstante, si se construye un nmero elevado de intervalos, el (l o] 100% de estos intervalos incluir la media poblacional. Las consideraciones anteriores motivan la siguiente definicin. Sea Xl,...,Xn una m.a.s. de una funcin de distribucin F y sea 6=6(F) un parmetro numrico. Sean 6 y 6S dos estadsticos tales que P(6 <0<0s) = l-a, 0<a<l. Entonese el intervalo aleatorio se llama intervalo de confianza para el parmetro 6con nivel de confianza es un lmite de confianza

65

Figura 1.1.

superior para 0 con nivel de confianza 1 - a, mientras que si P(6I < 0} - 1 - a , 9 es un lmite de confianza inferior para 6 con nivel de confianza 1 - a. Cuando las distribuciones de 6 y 9S son discretas, no todos los niveles de confianza (1 -a) son alcanzables. En tales casos, sustituimos las igualdades anteriores por desigualdades > y hablamos de intervalo de confianza (o lmite de confianza) con nivel al menos (1-a). La cantidad \-a es una medida del grado de confianza (credibilidad) del intervalo. En la prctica, el nivel de confianza 1 - a se suele fijar en valores que estn prximos a 1, tales como 0.90, 0.95 0.99. La amplitud de un intervalo de confianza se usa como una medida de su precisin. En general, deseamos que nuestros intervalos de confianza sean tan estrechos como sea posible. Como el intervalo de confianza es nuestro estimador de 6, para un nivel de confianza fijo cuanto menor sea la amplitud del intervalo ms precisa es la informacin sobre 6. En la mayora de problemas de estimacin de parmetros los intervalos de confianza son preferibles a las estimaciones puntuales. Una estimacin puntual da un solo valor numrico de 6 para cada muestra que es verdadero o falso, pero esto nunca lo sabemos porque 9 es desconocido. Por otra parte, un intervalo de estimacin da un rango de valores posibles de 9 (para cada muestra). Podramos preguntarnos si siempre ser posible encontrar un intervalo de confianza tal y como hemos hecho en el ejemplo 1.1. Los pasos que hemos seguido hasta llegar al intervalo podremos repetirlos siempre que partamos de una variable aleatoria T(X\,...,Xn;6] que cumpla los siguientes requisitos: 1. Para cada 9 fijo del espacio paramtrico 0, T( X,,..., Xn; 9} es un estadstico.

66

Estimacin por intervalos de confianza

2. Como funcin de 6, T(X},...,Xn;0) es una funcin estrictamente creciente o estrictamente decreciente para cada muestra. 3. La distribucin de probabilidad de T( X},..., Xn; 9} no depende del parmetro 6. Si T(X{,...,Xn\d] cumple los anteriores requisitos siempre es posible encontrar dos valores, } y A2, no necesariamente nicos, que cumplen P(} <T(Xt...,Xn;6)<2)>l-a para todo 6e0 y que no dependen de a Por la monotona de T respecto a O, las ecuaciones T(X{,...,Xn;9) = , (i = 1,2) ofrecen cada una de ellas una solucin nica de 9 para cada muestra fija. Las dos soluciones obtenidas proporcionan los dos lmites del intervalo de confianza para 9 con nivel de confianza 1 - a. Una v.a. T(X},...,Xn;9] cuya distribucin de probabilidad no depende de O se llama pivote. Como el mtodo para construir intervalos de confianza que acabamos de describir parte de un pivote se llama mtodo del pivote. Es obvio que en cualquier situacin concreta existirn mltiples intervalos de confianza de nivel I-a. El problema de construir un intervalo de confianza se reduce a encontrar un pivote. Sin embargo, debemos considerar adems el estadstico en el que ha de estar basado el pivote, dado que la eleccin del estadstico afectar a la precisin del intervalo de confianza resultante. Generalmente, la mejor eleccin es usar un pivote basado en el estimador maximoverosmil. Como la amplitud de un intervalo de confianza mide su precisin, si es posible elegiremos un intervalo de confianza, basado en un estadstico T (por ejemplo, el estimador maximoverosmil de 9), que tenga la amplitud mnima entre todos los intervalos de confianza para 9 con nivel 1 - a. Si la distribucin de T es simtrica respecto a 9, es fcil comprobar que la amplitud del intervalo de confianza basado en T se minimiza eligiendo un intervalo de confianza con colas iguales. Es decir, elegiremos /I, y A2 tales que P(T>2) = a/2 y P(T< /I,) = a/2 . A veces se eligen intervalos de confianza con colas iguales incluso cuando la distribucin de T no es simtrica, sobre todo si el clculo del intervalo ms estrecho basado en T es difcil. En las siguientes secciones detallamos cmo construir intervalos de confianza para algunos parmetros importantes. 2. INTERVALOS DE CONFIANZA BAJO NORMALIDAD 2.1. Problema de una muestra En este apartado consideramos el problema de construir intervalos de confianza 2 para // y o al muestrear una poblacin normal. Suponemos que X},...Xn es una m.a.s. de X, donde X ~ N(ju,(72). 2.1.1. Intervalo para la media poblacional, varianza conocida Si deseamos un intervalo de confianza para u al nivel I-a sabemos que y cumple, adems, todos los requisitos para aplicar el mtodo

67

del pivote. Este caso es el que se ha desarrollado en el ejemplo 1.1. El intervalo de confianza para 2.7.2. Intervalo para la media poblacional, varianza desconocida Si deseamos un intervalo para la media poblacional y o es desconocido, usamos como pivote partimos de la igualdad de confianza para i es
2.1.3. Intervalos para la varianza poblacional

. Para obtener el intervalo de confianza para f i , y obtenemos que un intervalo

Si nuestro objetivo es construir un intervalo de confianza para o2, entonces tenemos que considerar dos casos segn que JL sea o no conocido. Si jU es desconocido, entonces usamos el pivot n, podemos encontrar tales que - Dados a y . Para

cada par ( A ] , 2) obtenemos un intervalo de confianza para o1 con nivel 1 - a de la forma . Como la distribucin Ji-cuadrado no

es simtrica no podemos usar la simetra para elegir A, y A 2 (como hacemos en el clculo del intervalo de confianza para jU). Aunque es posible encontrar numricamente /!, y A 2 de modo que la amplitud del intervalo de confianza sea mnima, es ms simple asignar igual probabilidad a cada cola y elegir { = zl-\-\-a/2 Y A 2 = Xn-\-ai2 Entonces el intervalo de confianza para <j2 con nivel mnimo \-a y colas iguales es / Si JU es conocido, el intervalo de confianza para <r2 con nivel 1 - a es

Este resultado se debe a que

son variables aleatorias norma-

les tipificadas independientes. En consecuencia, las variables

68

Estimacin por intervalos de confianza

/=!,...,n, siguen distribuciones Ji-cuadrado con 1 grado de libertad y, como son 2 independientes, su suma es una variable Xn Si deseamos un intervalo para la desviacin tpica poblacional d, ste se obtiene a partir de un intervalo para la varianza poblacional cr2 tomando la raz cuadrada de sus lmites. 2.2. El problema de dos muestras Supongamos que Xu,...,Xlfl y X2l,...,Y2^ son dos m.a.s. independientes de distribuciones normales X\ ~ ,/(//,,<j 2 ) y X2 ~ N([2,<3\} Despectivamente. Sean X } , X2, S\ y S2 las medias y las varianzas mustrales respectivas. En este apartado consideramos la construccin de intervalos para la diferencia de las medias y el cociente de las varianzas de dos poblaciones normales independientes. 2.2.7. Intervalo para la diferencia de dos medias, varianzas conocidas El mtodo para encontrar un intervalo de confianza para fJ-\ jn2 a partir del muestreo de dos poblaciones normales es anlogo al usado en el caso de una muestra. Si las varianzas poblacionales son conocidas, el pivote adecuado es

De la igualdad P

= 1 ex, se obtiene que un inter-

valo de confianza para // -// 2 al nivel de confianza 1 -a es

2.2.2. Intervalo para la diferencia de dos medias, varianzas desconocidas Supondremos en este apartado que las varianzas de las dos poblaciones son 9 9 9 desconocidas pero iguales, es decir, cr, =a2. Denotaremos por cr el valor comn de las varianzas poblacionales. Entonces, si queremos construir un intervalo para la diferencia de medias poblacionales, consideramos como pivote la v.a. , donde . Como sabemos, T

sigue una distribucin t de Student con n} + n2 - 2 grados de libertad. Por tanto, , de donde obtenemos que el intervalo para la diferencia de medias poblacionales es

69

2.2.3. Intervalo para la diferencia de dos medias, muestras apareadas Con frecuencia tenemos n pares independientes de observaciones procedentes de dos poblaciones X\ y X2 con medias //j y // 2 , donde las observaciones de cada par (Xu,X2i), = !,...,, son dependientes. Supongamos que en esta situacin deseamos un intervalo de confianza para ju\ -// 2 Si la distribucin de Xj - Jf2 es normal, podemos considerar D\ = Xu- X2l,...,Dn = Xln - X2n como una muestra aleatoria de tamao n de una poblacin normal D = X\ X2 con media //>=//! -// 2 y varianza cr^. Para obtener un intervalo de confianza para HD, aplicamos los mtodos para obtener intervalos de confianza para u. Sean respectivamente, la media y la varianza mustrales de las n diferencias D ,/=!,...,n. Entonces, usando el pivote T = , obtenemos que

es un intervalo de confianza para // - ]U2 con nivel 1 - a. 2.2,4. Intervalo para el cociente de varianzas Para construir un intervalo de confianza para el cociente <7 2 / o\ al muestrear dos poblaciones normales independientes (cuando fj.\ y // 2 son desconocidos), usamos el pivote . Sabemos que F sigue una distribucin F de Fisher con
9 / 9

, -1 grados de libertad en el numerador y 2 -1 grados de libertad en el denominador, es decir, F ~ Fn _\ n^_\ . Entonces, para 1 -a fijo, es posible encontrar/l, y tales que Como la distribucin F de Fisher es

asimtrica, usamos la versin de colas iguales que consiste en elegir Entonces

de donde obtenemos que el intervalo para

es

70

Estimacin por intervalos de confianza

Un intervalo de confianza para el cociente de desviaciones tpicas se obtiene tomando la raz cuadrada de los lmites del intervalo de confianza para

3. INTERVALOS DE CONFIANZA PARA MUESTRAS GRANDES Sea X\,...,Xn una m.a.s. de una distribucin con media // y varianza o . Sabemos que la media muestral X es un estimador insesgado de H y que la varianza muestral S es un estimador insesgado de a1 para todo n. Si n es pequeo, necesitamos hiptesis adicionales sobre la forma funcional de la distribucin de las X para construir un intervalo de confianza estrecho para u (o <j 2 ) o para efectuar afirmaciones relativas al error de estimacin. Tanto si n es pequeo como si n es grande podemos usar la desigualdad de Chebichev para obtener un intervalo de confianza o para calcular una estimacin del error de estimacin, pero los intervalos obtenidos sern muy amplios y las estimaciones del error de estimacin muy pobres. En efecto, segn la desigualdad de Chebichev P giendo obtenemos que es un intervalo de confian-

za con nivel al menos 1 - a para /u . Anlogamente, G ^ccn es una estimacin del error al estimar u por X con probabilidad al menos 1 - a. Observamos que la precisin de X est medida por su varianza a2n que disminuye conforme n aumenta. En efecto, X es consistente para // de modo que X est cerca de // en probabilidad para n grande. Por el teorema central del lmite sabemos que si n es grande la distribucin de X est altamente concentrada alrededor de fJ. y es aproximadamente normal. Cuando n es grande, usando el teorema central del lmite podemos obtener intervalos de confianza para // ms estrechos que los obtenidos usando la desigualdad de Chebychev. Si n es grande, tenemos que
DONDE ELIGICNDO OBTE

nemos que

es un intervalo de confianza para // con

nivel aproximado 1 - ce. Se puede comprobar que este intervalo es ms estrecho que el basado en la desigualdad de Chebichev. Si <J es desconocido podemos sustituir S por a ya que S est prximo en probabilidad a o para n grande (por la consistencia y el hecho de que el estadstico t tiene una distribucin asinttica normal). El mtodo para construir intervalos de confianza asintticos ( n grande) basado en el teorema central del lmite es muy general y es aplicable cuando podemos

71

encontrar un estimador 6 de 6 que tiene distribucin asinttica normal con media 6 y varianza <j \ , esto es, cuando P\ n suficientemente grande
es un

<x

>O(x) . En este caso, para y, por tanto,

intervalo de confianza para 6con nivel

aproximado l-a. En la prctica, <j| suele ser desconocido y debe ser estimado mediante la informacin muestral. Esto se hace reemplazando en <j| cualquier parmetro desconocido por estimaciones consistentes. El intervalo de confianza, que se obtiene fcilmente por la sustitucin adecuada, es
C7 ^
U,j , fj

U/

/ J

onde b\ es una estimacin consistente de


ft

A continuacin presentamos intervalos de confianza en algunos casos particulares. Si la m.a.s. procede de una distribucin Bernouilli con parmetro 6=p, entonces Para estimar <r| de forma consistente usamos . Por tanto, el intervalo de confianza para p con nivel de confianza aproximado Si disponemos de dos m.a.s. de dos poblaciones Bernouilli independientes con parmetros /?, y p2 , respectivamente, y el parmetro de inters es 9=pl-p2, entonces de forma consistente usamos Para estimar . Por tanto, el

intervalo de confianza para 9=pl-p^ con nivel aproximado l - a es

72

Estimacin por intervalos de confianza

EJERCICIOS 1. a) SeaXl,...,Xloo una muestra aleatoria simple de una poblacin X con distribucin Bernouilli de parmetro p. Encontrar un intervalo de confianza de colas iguales y con nivel de confianza aproximado del 95% para el parmetro 6 = . b) A partir de una muestra aleatoria simple de tamao 11 de una poblacin normal con varianza o1, proponer un pivote adecuado para el parmetro v definido como v = I/o1 . Con el pivote propuesto, hallar un lmite superior de confianza para v con un nivel de confianza 0.95. Solucin a) Sabemos que un intervalo para p (con muestras grandes) se construye a partir del pivote Z = Intentaremos, pues, obtener un inter-

valo para

l a partir de dicho pivote.

Sabemos que P

Ejercicios

73

b) Sabemos que ser ; escribir

Luego el pivote parav . Por tanto, para un nivel de confianza 0.95 podemos

POR TANTO

. Luego

el lmite superior de confianza para v con un nivel de confianza del 95%

2. Se extrae una muestra aleatoria simple de tamao 1 de una variable aleatoria X con funcin de densida cero en otro caso. Construir

razonadamente un intervalo de confianza de colas iguales para 3 con nivel de confianza 0.95. Solucin El estadstico
dad es

constituye un pivote para /?, ya que su funcin de densi, que es independiente de3. Por

tanto, dado un nivel de confianza 0.95, sean/1, y A 2 dos nmeros tales que P(A, < T < 2) - 0.95 . Si tomamos colas iguales tendremos que P(T > A 2 ) = 0.025 , es decir, otra parte, , de donde obtenemos A , es decir, . Por de donde l intervalo

obtenemos Luego P ^0.025 < de confianza de colas iguales para /3 es

3. Se extrae una muestra aleatoria simple de tamao 1 de una variable aleatoria X con funcin de densidad y cero en otro caso. Construir

razonadamente un intervalo de confianza de colas iguales para O con nivel de confianza 1 - a.

74

Estimacin por intervalos de confianza

Solucin El estadstico es un pivote para d ya que

que es independiente de 9. Luego, dado un nivel 1 - a, sean a y b tales que Entonces por tanto, el intervalo de confianza para 9 es Calculemos a y b para que el intervalo tenga colas iguales. Asignando una probabilidad al2 a la cola izquierda tenemos que decir, es

3y dy = a = a/2 , de donde obtenemos a = ^]a/2 . Asignando igualmen-

te una probabilidad al 2 a la cola derecha tenemos que P(Y>b) = a/2, es decir, por tanto b uego el intervalo de confianza

4. En una fbrica nacional y otra internacional se estn haciendo zapatos con el mismo material. En cada fbrica se toma una muestra aleatoria simple de la variable cantidad de caucho empleada en la fabricacin de un par de zapatos, obtenindose los siguientes resultados: Fbrica nacional: 128, 130, 130, 130, 131, 132, 132, 134. Fbrica internacional: 126, 128, 128, 130, 130, 130, 130, 131, 133, 134, 134. Suponemos que la cantidad de caucho empleada en la fabricacin de un par de zapatos sigue una distribucin normal. a) Hallar un intervalo de confianza para el cociente entre la desviacin tpica de la cantidad de caucho empleada en la fabrica nacional y la desviacin tpica de la cantidad de caucho empleada en la fbrica internacional con un nivel de confianza 0.90. b) Estimar mediante un intervalo con nivel de confianza 0.90 la diferencia entre las cantidades promedio de caucho empleadas en ambas fbricas justificando el intervalo elegido. Solucin a) Para un cociente de desviaciones tpicas, sabemos que el pivote es

(utilizamos el subndice TV para

la fbrica nacional y el subndice / para la fbrica internacional). De

Ejercicios

75

se obtiene que

Los estadsticos mustrales son S, = 2.54. Por otra parte, tando finalmente b) Puesto que el intervalo de confianza anterior contiene a la unidad, podemos ES DECIR admitir G Por tanto, suponemos que las desviaciones tpicas desconocidas son iguales. Entonces el intervalo para la diferencia de medias de ambas fbricas

con
El intervalo de estimacin que se

obtiene es 5. El fabricante de cierto modelo de automvil ha publicado que dicho modelo tiene un consumo medio de 5.2 litros a los 100 kilmetros con una desviacin tpica de 0.8 litros. Un estudio posterior realizado con 60 automviles del mismo modelo ofreci, para la variable X (consumo en litros por cada 100 kilmetros), los resultados mustrales X = 5.47 y S2 = 0.7 . Admitiendo que para dicho modelo de automvil la variable X se distribuye normalmente, analizar utilizando intervalos de confianza (con un nivel de confianza del 95%) la veracidad de las afirmaciones del fabricante. Solucin Suponemos que litros. El intervalo . El fabricante afirma que n = 5.2 litros y <T=0.8 ju al 95% de confianza es

para

intervalo

para

de

confianza

es

de modo que el intervalo para Parece, por tanto, que deberamos dudar de la afirmacin del fabricante en

76

Estimacin por intervalos de confianza

relacin a la media ya que 5.2 /Jf % . Sin embargo, no podemos dudar de la afirmacin respecto a a ya que 0.8 E I#5%. 6. En una muestra de n individuos con un plan de jubilacin ZZZ se observa que la edad X en la que se contrat el plan de jubilacin tiene una media muestral de 50 aos y una desviacin tpica muestral de 6 aos. a) Si se supone que la variable edad X tiene una distribucin normal y el tamao de la muestra es n = 19 , determinar un limite superior de confianza para la varianza poblacional de X con un nivel de confianza del 99%. b) Si se supone que la variable edad X tiene una distribucin aproximadamente normal, construir razonadamente un intervalo de confianza para la varianza poblacional de X al nivel de confianza del 99% si n = 200 (utilizar el hecho de que la desviacin tpica muestral, para muestras grandes, tiene una distribucin aproximadamente normal con media la desviacin tpica poblacional y varianza la varianza poblacional dividida por el doble del tamao muestral). Solucin a) Si entonce
n_\.

Llamando k al lmite superior de

confianza (al 99% de confianza) para o

tendremos que P(o <k} = 0.99 . Entonces

Por tanto,

de donde obtenemos que k por

b) Para n = 200 (muestra grande) sabemos que tanto,

j= ~ JV(0,1) . Luego dado un nivel de confianza 1-a, , en consecuencia,

Por tanto,

y el intervalo de confianza para a es

Ejercicios

77

El intervalo para la varianza es

y sustituyendo a=0.01, = 200 y S = 6, obtenemos I99,% =[28.256,47.426].

7. En una encuesta efectuada entre los estudiantes de una universidad, 300 de 500 miembros de asociaciones estudiantiles estn de acuerdo con la propuesta A. Por otra parte, 64 de 100 estudiantes no miembros de asociaciones estudiantiles tambin estn de acuerdo con la propuesta A. a) Estimar mediante un intervalo de confianza la diferencia de proporciones a favor de la propuesta, fijando un lmite de dos veces la desviacin tpica para el error de estimacin. Cul es el nivel de confianza aproximado de dicho intervalo? b) Suponiendo que las dos muestras tienen igual tamao, cuntos estudiantes miembros y no miembros hay que incluir en una encuesta si se desea que la estimacin de la diferencia de proporciones tenga un error mximo de 0.05 con una probabilidad de al menos 0.95? Considrese que en ambas poblaciones el mximo de p(\-p) es 0.25. Solucin a) Las proporciones mustrales son p\ = 300 / 500 = 0.60 y p2 = 64 /100 = 0.64. Para estimar la diferencia de proporciones fijando un lmite de dos veces la desviacin tpica para el error de estimacin tenemos que

Luego el nivel de confianza aproximado es 0.9545. As, el intervalo de confianza para la diferencia de proporciones es

b)

Buscamos

n\

2 tales Sabiendo que

que

n}=n2=n y para todo p,

podemos realizar la acotacin nos permite tambin acotar la probabilidad

que

78

Estimacin por intervalos de confianza

Entonces, para que P(\p\ ~ Pi~ (P\ ~ P2 )| - 0-05) > 0.95 basta con seleccionar un tamao muestral n tal que que verifique valor mnimo de n es 769. 8. En un estudio sobre la conservacin del jamn se obtuvieron los siguientes datos sobre residuos de cido srbico en 8 lonchas de otros tantos jamones un da despus de sumergirlo en la solucin y a los 60 das: Loncha Un da despus 60 das despus | l | 2 | 3 | 4 | 5 | 6 | 7 | 8 224 270 400 444 590 660 1400 680 116 96 239 329 437~ 597 689 576~ As obtenemos que , es decir, un tamao muestral n . Luego el

Suponiendo normalidad, contrastar mediante un intervalo de confianza de nivel 0.95 si se puede admitir que la reduccin media de los residuos de cido srbico en los 60 das es 250. Solucin Como se trata de una muestra apareada, sabemos que un intervalo de confianza para la media de las diferencias de las diferencias aparece en la siguiente tabla: Loncha Un da despus 60 das despus Diferencia 1 2 224 270 116 96 108 ~T74 3 4 400 444 239 329 161 ~15 | 5 590 437 153 6 660 597 63 | La muestra

7 8 1.400 680 689 576 711 104

Los estadsticos resumen para la muestra de las diferencias son D = 198.625 y SD =210.165. Sustituyendo en la expresin del intervalo de confianza obtenemos Este es, como vemos, un in-

Ejercicios

79

tervalo de gran amplitud y, por tanto, ofrece poca informacin sobre la reduccin media. Dicho de otra forma, es un intervalo poco preciso. 9. Las varianzas mustrales de dos poblaciones normales X\ y X2 independientes son 5? = 61.33 y S% = 76.8 , respectivamente. Los tamaos de las muestras son Wl =18 y 2 =121. a) Hallar un intervalo de confianza al 96% para la varianza poblacional a\ de X\. Podemos admitir que la varianza poblacional es G\ = 50 al nivel de significacin a=0.04? b) Suponiendo que las varianzas poblacionales de X{ y X2 son iguales, hallar un intervalo de confianza al 90% para la varianza poblacional comn. Solucin a) Si X\ sigue una distribucin normal entonces (n{ -l)5?/<72 ~ %2n _j y, por tanto, un intervalo de confianza con nivel de confianza I-a para o\ es . Sustituyendo los resultados mustrales y teniendo en cuenta que a/2 = 0.02, Z'om-M =31.3 y jo.98;i7 =7.2, obtenemos el intervalo 7^.2% = [33.3,144.8]. A la vista del resultado, podemos admitir que d\ - 50 a un nivel de significacin 0.04. b) Suponemos o\ = a\ = o1. Puesto que X} y X2 siguen sendas distribuciones normales, entonces porlapro-

piedad

aditiva

de

la

distribucin

Ji-cuadrado,

intervalo para . Slo resta sustituir los datos mustrales y usar la aproximacin normal de la distribucin Jicuadrado, obteniendo 10. Construir un intervalo de confianza al nivel 0.95 para la diferencia de medias poblacionales de las variables X e Y (basado en las medias mustrales) suponiendo que X sigue una distribucin uniforme en el intervalo (0,20), Y sigue una distribucin exponencial de media , X e Y son independientes y los tamaos mustrales son grandes y distintos.

gO

Estimacin por intervalos de confianza

Solucin Tenemos que los tamaos mustrales m y n son grandes. Sabemos que Por el teorema central del lmite (para m y n grandes), tenemos que aproximadamente o, tipificando, Por tanto, aproximadamente Puesto que

en la varianza de X Y aparecen parmetros desconocidos, stos deben ser sustituidos por estimadores consistentes. Sabemos que aproximadamente ._ por lo que

~ 7V(0,1). En consecuencia, para m y n gran-

des se cumple que P confianza asinttico para

y por tanto el intervalo de

11. Dos marcas de refrigeradores, A y B, tienen una garanta de un ao. En una muestra aleatoria de 50 refrigeradores de la marca A, doce se averiaron antes de terminar el periodo de garanta. Una muestra aleatoria de 60 refrigeradores de la marca B present tambin doce averas durante el periodo de garanta. Contrastar mediante un intervalo de confianza de nivel 0.98 si la proporcin de averas durante el periodo de garanta en ambas marcas de refrigeradores es la misma. Solucin Tenemos que W teorema central . Por el aproximadamente que Y entonces Tipificando obtenemos que aproximadamente la variable

del

lmite

se

cumple

Luego

el

intervalo

de

confianza

asinttico

para

PA~PB

es

Usando los resultados mustrales obtenemos que el intervalo de estimacin para la diferencia de proporciones es

Ejercicios

81

de modo que, con un 98% de confianza, p lo contiene el cero se acepta que p

Como este interva-

2x 12. Sea X\,...,Xn una m.a.s. de una poblacin con densidad /(*) = si Q 0<;t< 6, y cero en otro caso. Para una muestra de tamao 1, obtener un pivote para 9 y, a partir de l, construir un intervalo de confianza de colas iguales con nivel 1 - a para 6.

Solucin Es fcil ver que Y = X/6 es un pivote para 6 ya que su funcin de densidad es

que no depende de 9. Adems,


para X fijo, X/d es una funcin estrictamente decreciente de 6. Luego, dado un nivel de confianza 1 - a, existirn dos valores a y b tales que P(a< Y<b) = 1 - a,

es decir,

y tambin

. Por tanto, el
si queremos que

intervalo de confianza para d es de la forma

este intervalo tenga colas iguales, se deber cumplir que P(Y<a)=a/2 y Entonces partimos de , de donde a y obtenemos ara obtener b , . Por tanto, el intervalo de

confianza para 6 (con colas iguales) es I

13. Los siguientes valores corresponden a la duracin, en cientos de horas, de los elementos de una m.a.s. de 10 componentes electrnicos que operan en un sistema de control direccional de misiles: 0.637 1.601

1.531 0.152

0.733 1.826

2.256 1.868

2.364 1.126 , y cero

La duracin de un componente de este tipo se supone que sigue una distribucin Weibull con funcin de densidad / en otro caso. Usando un nivel de confianza del 95%:

82

Estimacin por intervalos de confianza

a) Obtener un pivote para 6 y, a partir de l, construir razonadamente un intervalo de confianza de colas iguales para 6. (Recurdese que el doble de la suma de n exponenciales independientes de media uno sigue una distribucin Ji-cuadrado con 2/1 grados de libertad). b) Obtener un intervalo de confianza para la mediana poblacional. Solucin
a) Sea La funcin de densidad de Y es

En consecuencia, Y ~ Exp(l), por lo que Entonces el pivote para 0es


un nivel l-o, se cumple que

Dado

forma equivalente, el intervalo de confianza para 9 es

luego

b) Denotemos la mediana poblacional por ^ 05 . Por la definicin de la mediana debe cumplirse que cuencia, decir, con lo que In0.5 n conse-

Del intervalo para 6 obtenido en el apartado anterior, se deduce que el intervalo para la mediana poblacional es

CAPITULO 4 CONTRASTES DE HIPTESIS

1. INTRODUCCIN Un modelo aleatorio est basado sobre ciertos supuestos. Cuando decimos que la variable aleatoria X puede modelizarse mediante una funcin de densidad f(x, 6), estamos expresando un supuesto terico sobre el comportamiento de dicha variable aleatoria. Cualquier supuesto de este tipo es una hiptesis estadstica. En los anteriores captulos hemos usado trminos tales como las variables aleatorias son independientes, las variables aleatorias se distribuyen idnticamente, /es una funcin de densidad simtrica, la moneda es correcta, la resistencia elctrica de un componente se distribuye normalmente con media 5 Ohm., etc. Todos estos supuestos son ejemplos de hiptesis estadsticas. Sea (X\,...,Xn) un vector aleatorio con funcin de distribucin conjunta F9, O E 0, donde 0 denota el espacio paramtrico. La familia F = {F0 19 G 0} puede ser paramtrica (en cuyo caso 9 es un vector numrico de dimensin finita) o no paramtrica (en cuyo caso F0 no puede caracterizarse por un vector de escalares de dimensin finita). En los captulos anteriores hemos considerado el problema de inferencia estadstica consistente en la estimacin puntual (o por intervalo) de algn (algunos) parmetro(s) numrico(s) de la distribucin poblacional de una v.a. En este tema vamos a considerar el problema del contraste de hiptesis en el que nos planteamos tomar una decisin sobre la verdad o falsedad de alguna afirmacin respecto a un parmetro tal como la media es no negativa, la varianza es mayor o igual que O"^, o la probabilidad de cara al lanzar una moneda es 1/2 . Formalmente, sea 00c:0 y 0!=0-0 0 prefijados y sea F0 = [Fe 19 e 00} c F y F, = F - F0. El problema que vamos a considerar puede establecerse como sigue: Dado un vector de datos (X},..,,Xn), la distribucin verdadera de ( X } , . . . , X n ) pertenece a F0 o a Fj ? Antes de presentar las definiciones formales vamos a considerar algunos ejemplos.

84

Contrastes de hiptesis

Ejemplo 1.1. Supongamos que deseamos jugar a cara o cruz con una moneda que nos ofrece el adversario, pero antes queremos decidir si la moneda es correcta. De hecho, supondremos que la moneda es correcta hasta que exista evidencia en contra. Este supuesto es la hiptesis a contrastar que llamaremos hiptesis nula. La especificacin de una hiptesis nula nos fuerza a pensar en la eleccin de una conjetura rival que aceptaremos en caso de que rechacemos la hiptesis nula. Como conjetura rival podemos considerar que la moneda no es correcta, que est sesgada a favor de caras o que est sesgada a favor de cruces. La conjetura rival se llama hiptesis alternativa y su especificacin depende mucho del uso que deseamos asignar a la moneda. Cmo contrastaremos la hiptesis nula de que la moneda es correcta? Supongamos que lanzamos la moneda n veces. Sea X =1 si el /-simo lanzamiento ofrece cara, y Xi.- O, en otro caso. Entonces X},...,Xn es una m.a.s. de una distribucin Bernouilli con parmetro /'(cara) = p, p E 0 = [O, l]. La hiptesis nula se convierte en la afirmacin HQ:p = 1/2 . La hiptesis alternativa de que la moneda no es correcta se convierte en la afirmacin H}:p 1/2. Observamos que bajo HQ la distribucin comn de las X est especificada completamente, mientras que bajo H} la distribucin comn est especificada salvo para el valor de p. El resultado muestral es un punto del espacio muestral E = [(*, ,...xn]/ x = 1 o O, ! < / < } Bajo qu circunstancias rechazaremos //0 ? La teora de la probabilidad nos permite calcular la probabilidad de observar la muestra bajo la hiptesis nula y bajo la hiptesis alternativa. En efecto, la probabilidad de observar el resultado muestral xl,...xn cuando P(X = 1) = p es

Observamos que P nuestra muestra es tal que >

depende slo de

x , el nmero total

de caras en n lanzamientos. Esto significa que si queremos rechazar H0 cuando x = s, entonces desearemos rechazar H0 para toda muestra donde el nmero total de caras es s con independencia de cuales sean las x individuales. Supongamos que observamos una muestra que es muy improbable desde el punto de vista de H0. Es decir, supongamos que es

pequea. Si a pesar de su pequea probabilidad hemos observado realmente el resultado (x{,...xn] para el cual 2j. *, - s, entonces ste es un fuerte argumento contra H0 : Nos resulta difcil creer que algo tan improbable pueda ocurrir. Teniendo en cuenta que el clculo de la probabilidad se ha hecho bajo la creencia de que H0 es verdadera, empezaremos a dudar sobre la base de nuestro clculo (HQ) Para ser ms concretos tomemos @0 = {0.5} y 0] = {0.7}, y supongamos que lanzamos la moneda n = 6 veces. Entonces necesitamos elegir entre H0:p = 0.5 y H{:p = 0.7 en base a una m.a.s. de tamao 6. Es fcil comprobar que

85

donde

es el nmero de caras observadas. sigue una distribu-

Por la teora de la probabilidad sabemos que

cin 5(6,0.5) bajo H0:p = 0.5 y una distribucin 5(6,0.7) bajo //,:/? = 0.7. De modo que podemos calcular las probabilidades asociadas con los resultados s = 0,1,...,6 bajo HQ y H} . Estas probabilidades figuran en la siguiente tabla. Probabilidad del resultado Resultado 0 1 2 3 4 5 6

;? = 0.5 0.0156 0.0938 0.2344 0.3125 0.2344 0.0938 0.0156

/? = 0.7 0 . 0 0 0 7 0.0102 0.0596 0.1852 0.3241 0.3026 0.1176

Una posible regla para decidir si //0 o Hl es verdadera es la siguiente: Elegir H0 si s es ms probable bajo H0 que bajo H{, y elegir H} si s es ms probable bajo H{ que bajo HQ . Esta regla es equivalente a la siguiente: Aceptar H0 si s < 3 y aceptar //, si s > 4. Cules son las consecuencias de esta regla de decisin? Esto es, cul es el coste de equivocarse? Supongamos que s pertenece a C = {4,5,6} (C es la regin crtica de la regla) de modo que rechazamos H0. En este caso la probabilidad de equivocarnos es Esta probabilidad es ^(rechazar H0 IH0 verdadera) y se llama probabilidad del error de tipo I. El error al rechazar H0 cuando H0 es verdadera es un error de tipo I. Existe otro error posible, llamado error de tipo I I , que ocurre al aceptar H0 cuando Hl es verdadera (y, por tanto, H0 es falsa). En el ejemplo, la probabilidad del error de tipo Es obvio que existen otras reglas de decisin razonables para el problema que nos estamos planteando. Una cuestin relevante es cmo elegir entre las diferentes reglas para el mismo problema. Es obvio que deseamos que las dos probabilidades de error sean lo ms pequeas posible. Desafortunadamente no es posible controlar simultneamente ambas probabilidades para una muestra de tamao fijo. El procedimiento usual consiste en controlar la probabilidad del error de tipo I en un nivel prefijado pequeo tal como 0.05 0.01, y entonces encontrar una regla que minimice la probabilidad del error de tipo II. Ahora formalizaremos los conceptos introducidos en el ejemplo anterior. Sea un vector aleatorio con funcin de distribucin conjunta

86

Contrastes de hiptesis

Una hiptesis estadstica es una afirmacin sobre la distribucin conjunta de (Xl,...,Xn). La afirmacin de que FQ e F0 = \Fe 16 e 00} que se quiere contrastar se llama la hiptesis nula, y la abreviaremos escribiendo //0: de 00. La afirmacin rival que sospechamos que es verdadera en vez de //0 se llama la hiptesis alternativa y la abreviaremos escribiendo H\\ OE 0i=0-0 0 . La hiptesis a contrastar es no paramtrica si F0 es una familia no paramtrica de distribuciones, mientras que la hiptesis a contrastar es paramtrica si F0 es una familia paramtrica de distribuciones. Usualmente la hiptesis nula se elige de modo que corresponda al subconjunto 00 de 0 que es menor o ms simple y es una afirmacin de no diferencia. En todos los casos consideramos la hiptesis nula de la forma 9- 00, 9> 60 o 9< 00. El signo de igualdad siempre aparece en la hiptesis nula, mientras que el signo de estricta desigualdad siempre aparece en la hiptesis alternativa. Si la distribucin de (X\,...,Xn) est especificada completamente por una hiptesis, decimos que es una hiptesis simple; en otro caso, decimos que la hiptesis es una hiptesis compuesta. As, cuando 00 o 0, consta exactamente de un punto, la hiptesis correspondiente es simple; en otro caso es compuesta. Sea E el conjunto de todos los valores posibles de (X},...,Xn). Entonces E cz R". Un test de H0 contra H} es una regla (de decisin) que especifica un subconjunto C de E tal que si (X,...,Xn}e C entonces rechazamos // 0 , y si (X{,...,Xn)C entonces aceptamos //0 . C se llama la regin crtica del test. Un estadstico de prueba es un estadstico que se usa en la especificacin de C. Al usar un test de //0 contra //, podemos incurrir en dos tipos de errores. El error de tipo 1 consiste en rechazar H0 cuando H0 es verdadera. El error de tipo II consiste en aceptar H0 cuando //0 es falsa. La tabla siguiente ilustra los dos tipos de error. H0 verdadera //, verdadera Rechazar 7/0 Error de tipo I Accin correcta Rechazar //, Accin correcta Error de tipo II

La figura 1.1 representa las probabilidades de los dos tipos de error del contraste de una hiptesis nula simple H0: 6= 60 contra una hiptesis alternativa simple H\: 9= 9\ (0\ > OQ) usando una regin crtica de la forma C = {T > k] , donde T denota el estadstico de prueba.

Figura 1.1.

87

El test ideal sera aquel para el que ambos tipos de error tienen probabilidad igual a cero, pero esta situacin es imposible salvo en casos triviales. En la prctica tenemos que conformarnos con mantener estas probabilidades en un nivel pequeo aceptable. Se acostumbra a fijar la probabilidad del error de tipo I en un nivel (pequeo) prefijado a, 0< a< 1, y entonces se intenta minimizar la probabilidad del error de tipo II. Se dice que un test de la hiptesis nula H0: 6e 0Q contra //,: 0e @j tiene tamao a, 0< a< 1, si sup Pe (Rechazar //0) = a. El tamao elegido a es a veces inalcanzable. De hecho, en varios problemas slo son alcanzables una cantidad numerable de niveles a de [O, l]. En este caso tomamos el mayor valor menor que a que sea alcanzable. Tambin decimos que una regin crtica C es de nivel de significacin a si Pe( C)<cc, para todo de @Q. Si sup P e (C) = a, entonces el nivel y el tamao
0e en
060,)

de C son ambos iguales a a. Por otra parte, si sup Pe(C) < a, entonces el tamao de
6>e00

C es menor que su nivel de significacin a. Con frecuencia el nivel de significacin elegido es alcanzable. Si //0 es una hiptesis simple, entonces es obvio que ^//0(O es el tamao de la regin crtica C, pero PH (C) no es necesariamente igual al nivel de significacin a prefijado. La eleccin de un valor especfico para a es arbitraria. De hecho no es estrictamente un problema estadstico. La eleccin de a depender de consideraciones tales como las posibles consecuencias de rechazar H0 errneamente, las implicaciones prcticas y econmicas de rechazar // 0 , etc. A veces es posible usar un enfoque alternativo que consiste en indicar el llamado P-valor del estadstico de prueba observado. El P-valor es el mnimo nivel de significacin a para el cual el estadstico muestral observado implica el rechazo de la hiptesis nula. Antes de dar una definicin formal del P-valor, vamos a volver al ejemplo 1.1. Supongamos que el nmero observado de caras es 5 = 5. Entonces bajo HQ, P(S = 5) = 0.0938 . Sin embargo, la probabilidad de inters no es P(S = 5) sino P(S > 5) = 0.1094, ya que la probabilidad PH (S = 6) es incluso menor, y si rechazamos HQ cuando observamos s = 5 lo mismo debemos hacer cuando observamos un valor ms extremo de 5. Esto motiva la definicin del P-valor. Supongamos que la regin crtica apropiada para contrastar H0 contra //, es unilateral. Esto es, supongamos que C es de la forma [T > c\} o \T < c2} , donde T es el estadstico de prueba. Entonces el P-valor es la probabilidad de observar bajo H0 un resultado muestral al menos tan extremo como el observado en la muestra. Si /o es el valor observado del estadstico de prueba y la regin crtica es unilateral con rechazo por la derecha, es decir, C es de la forma {T > c } ] , entonces el P-valor es PH ( r > / 0 ) . Si la regin crtica es unilateral con rechazo por la izquierda, es decir, C es de la forma {r<c 2 j, entonces el P-valor es PH (T<tQ}. Cuanto menor es el P-valor, ms extremo es el resultado muestral y ms fuerte es la evidencia contra // 0 .

gg

Contrastes de hiptesis

En la mayora de los problemas considerados en este libro el P-valor es una cantidad bien definida. Si la regin crtica C es bilateral, es decir, si C es de la forma [T<c\ o T>c2}, entonces el P-valor se define como el doble de la probabilidad de una cola incluso cuando la distribucin de T no es simtrica. En concreto, si C es bilateral y tQ es el valor observado del estadstico de prueba, el P-valor se calcula como 2 mi Cuando el P-valor est bien definido, puede interpretarse como el mnimo nivel de significacin al que el valor observado del estadstico de prueba es significativo. Proporcionar un P-valor nos ofrece mucha ms informacin que indicar si un valor de T es estadsticamente significativo al nivel a. En efecto, si el nivel a est prefijado y p0 es el P-valor asociado con tQ, entonces tQ es significativo al nivel a sip0<a. En determinadas circunstancias las tablas disponibles de la distribucin nula (distribucin bajo H0) del estadstico de prueba no nos permiten calcular exactamente el P-valor aunque s es posible acotarlo. Ahora vamos a centrar la atencin en la probabilidad del error de tipo II. Para estudiar el comportamiento de un test bajo la hiptesis alternativa se define la funcin de potencia. Sea C la regin crtica de un test de H0: 6e 0Q contra //,: 0e 8,. Entonces la funcin 7r(0) =/^(Rechazar H0) = Pe(C) como funcin dej? se llama la funcin de potencia, del test, y la funcin /?(#) = /^(Aceptar //0) = P9(C) = \-7c(6) como funcin de 0 se llama funcin caracterstica de operacin del test.

Figura 1.2.

89

Observamos que si 6E @ 1? entonces n(B) es 1 P(error tipo II) y f(9) es P(error tipo II). As, la minimizacin de la probabilidad del error de tipo II es equivalente a la maximizacin de n(Q) (o minimizacin de /3(0)) para 0e Q{, sujeto a la restriccin del nivel de significacin: n(9)<a(o f(9)>\-a) para 9e @0. Si 00 = {00} , entonces HQ es una hiptesis nula simple y n (00) es el tamao del test. Si 0, ={#i}, entonces 7r(0,)=l-P(error tipo II) = 1-/3(0|) es la potencia del test. Usar la funcin de potencia o la funcin caracterstica de operacin es una cuestin de gusto. En algunas reas de aplicacin es ms comn la funcin caracterstica de operacin, mientras que en el trabajo terico suele preferirse la funcin de potencia. La figura 1.2 muestra algunas funciones de potencia. Ejemplo 1.2. Vamos a volver al ejemplo 1.1 donde lanzamos una moneda 6 veces. Sea X\,... X6 una m.a.s. de tamao 6 de una poblacin Bernouilli con parmetro p . Supongamos 6 = [0,1], 00 = {0.5} y 0! = [0,0.5[ u ](X5,l]. La hiptesis nula H0:p = 0.5 es una hiptesis simple, mientras que la hiptesis alternativa H\.p 0.5 es una hiptesis compuesta. Podemos usar la tabla del ejemplo 1.1 para calcular los P-valores asociados con los diversos resultados del estadstico de prueba S. Por ejemplo, si el nmero de caras observado es 1, el P-valor es 2-mm\PH (S>l),PH (S<l)\ = 2- min{0.9844,0.1094} = 2-0.1094 = 0.2188. Si prefijamos a=0.05, entonces es fcil comprobar que la regin crtica es C = {S = 0,5 = 6} con tamao (nivel real) PH(S = Q) + PH(S = 6) = 0.0156 + 0.0156 = 0.0312, que es menor que 0.05. La situacin resulta peor si =0.2. En este caso, de nuevo C = {S = 0,S - 6} con tamao 0.0312. Para obtener la funcin de potencia necesitamos especificar un test. Supongamos que tomamos la regin crtica C = {S = O, S = 6} con tamao 0.0312. Entonces n(p) = P(S - O o S 6 I p} es una funcin de/? y puede calcularse para distintos valores de p. En la tabla del ejemplo 1.1 hicimos esto para p = 0.7 y, por simetra, los mismos resultados son vlidos para p = 0.3 . As, 71(0.3) = 71(0.7) = P (S = QoS = 6) = 0.0007 + 0.1176 = 0.1183. La siguiente tabla presenta otros valores de n(p).

p n(p)

I 0.9 I 0.8 I 0.7 I 0.6 I 0.5 I 0.4 I 0.3 I 0.2 I 0.1 0.531 0.262 0.118 0.051 0.031 0.051 0.118 0.262 0.531

Como puede esperarse, la potencia crece conforme aumenta la desviacin P-QJ5 . Ejemplo 1.3. Supongamos que acaba de lanzarse al mercado un nuevo modelo de coche y el productor anuncia que consume un promedio de 5.8 litros por 100 kilmetros en carretera. Una agencia de proteccin al consumidor decide contrastar este anuncio. Toma una muestra de 15 coches. Se conduce cada coche sobre un tramo de carretera

90

Contrastes de hiptesis

y se encuentra que en la muestra el consumo tiene una media de 6.1 litros por 100 kilmetros y una desviacin tpica de 0.2 litros por 100 kilmetros. Observamos que el consumo medio muestral es superior al anunciado por el fabricante, pero es suficientemente alto para dudar del anuncio del fabricante? Puede que la diferencia entre el promedio anunciado y el promedio muestral observado sea debida al azar? Sea [i la media verdadera (desconocida) para el nuevo modelo de coche. Supongamos que el anuncio del fabricante es correcto de modo que la hiptesis que queremos contrastar es //0:// = 5.8 . La hiptesis alternativa es Hl:/> 5.8 . Sea X el consumo del z'-simo coche (/' = !,...,!5) de la muestra. Sabemos que para una muestra de tamao 15, la media muestral X es 6.1. Si el valor observado de X fuera menor o igual que 5^8 no habra razn para cuestionar la validez de H0 . Como el valor observado de_^ es 6.1, es natural preguntar cul es la probabilidad de observar un valor de X tan grande como 6.1 en una m.a.s. de una poblacin con ju = 5.8. (Sabemos que X es un buen estimador de //, as que esperamos menores valores de X bajo HQ que bajo Hv). Esta probabilidad es la que hemos llamado P-valor. Si el P-valor es pequeo la evidencia contra HQ es fuerte y si el P-valor es grande la evidencia contra H0 es dbil. El clculo del P-valor es equivalente a calcular PH (X>61). Para un clculo exacto de esta probabilidad necesitamos conocer la distribucin de X. Esto significa que tenemos que hacer ciertos supuestos sobre la distribucin subyacente de las X. Si creemos que la familia de posibles distribuciones de X es |jV(//,cr 2 ),//>0,(7 2 >OJ , entonces

Como el P-valor (probabilidad estimada de observar un valor de X mayor o igual que 6.1 bajo el supuesto //0:// = 5.8) es muy pequeo, la evidencia muestral en contra de HQ es fuerte. 2. CONTRASTES DE HIPTESIS BAJO NORMALIDAD En esta seccin presentamos los contrastes de hiptesis relativos al muestreo de poblaciones normales. El supuesto de normalidad de la distribucin poblacional ha jugado un papel muy importante en los procedimientos de contraste clsicos basados en muestras pequeas. Primero describiremos los contrastes relativos a los parmetros de una distribucin normal (problema de una muestra). Despus estudiaremos contrastes relativos a los parmetros de dos poblaciones normales (problema de dos muestras). Por ltimo consideraremos el contraste de igualdad de las medias de k poblaciones normales (problema de k muestras). Para cada contraste especfico construiremos el estadstico de prueba e indicaremos la distribucin del estadstico de prueba bajo la hiptesis nula, que nos permitir por una parte establecer la regin crtica para que la

91

probabilidad del error de tipo I sea igual a a (usualmente 0.05 0.01), y por otra parte obtener la expresin del P-valor. El contraste de hiptesis consistir en rechazar la hiptesis nula cuando el valor muestral del estadstico de prueba pertenece a la regin crtica o, de forma equivalente, rechazar la hiptesis nula cuando el P-valor asociado al valor del estadstico de prueba es menor o igual que a. Tambin desarrollaremos la frmula analtica para calcular la probabilidad del error de tipo II (y, por tanto, la potencia del contraste) en los casos en que este desarrollo sea fcil. Asimismo indicaremos cmo determinar el tamao muestral (o los tamaos mustrales) para que las probabilidades de los errores de tipo I y de tipo II del procedimiento de contraste sean aceptables para el usuario. 2.1. Problema de una muestra Sea X{,...,Xn una m.a.s. de una distribucin Nju ,cr J . En este apartado consideramos contrastes de hiptesis relativos a los parmetros y o. 2.1.1. Contrastes para la media poblacional, varianza conocida Consideremos el contraste bilateral de la hiptesis nula H0:u =// 0 contra la hiptesis alternativa
Q

. El estadstico de prueba es Z0 =

p-, que bajo

la hiptesis nula sigue una distribucin jV(0,l). Como X es un estimador insesgado del parmetro i, si la hiptesis nula es verdadera cabe esperar que el valor muestral de Z0 sea pequeo. Por tanto, dudaremos de HQ cuando el valor muestral de Z0 sea lo suficientemente grande. Si deseamos que la probabilidad del error de tipo I del contraste sea igual a , la regin crtica que debemos elegir es C = {Z 0 /Z 0 >z f f / 2 o Z 0 <-z a / 2 }. El P-valor es 2-P(z> z0|), donde Z ~ N(Q,\) y z0 es el valor muestral del estadstico de prueba. La regla de decisin consiste en rechazar //0 si Z0 e C y aceptar HQ si Z0 C. Esta regla es equivalente a rechazar H0 si el P-valor es menor o igual que a y aceptar HQ si el P-valor es mayor que a. Para el contraste unilateral de la hiptesis nula //0:// =/ 0 contra la hiptesis alternativa H^.ju > / / o > se utiliza el mismo estadstico de prueba Z0 que en el contraste bilateral. Dudaremos de HQ cuando el valor muestral de Z0 sea lo suficientemente grande. Para que la probabilidad del error de tipo I sea igual a a, la regin crtica es El P-valor es El contraste unilateral de la hiptesis nula H0:ju = JUQ contra la hiptesis alternativa //,://<// 0 utiliza tambin el mismo estadstico de prueba que el contraste bilateral. Sin embargo, en este caso debemos dudar de H0 cuando el valor muestral de Z0 sea lo suficientemente pequeo. La regin crtica de tamao a es El P-valor es Para calcular la probabilidad del error de tipo II necesitamos la distribucin del estadstico de prueba Z0 bajo la hiptesis alternativa. Supongamos que Ju = /l 0 +5,

92

Contrastes de hiptesis

(ya que u es el verdadero valor de la media), resulta que Z

Por

tanto, si suponemos H\ : 1=^^+8, la probabilidad de aceptar la hiptesis nula (error de tipo II) en el contraste bilateral es

La probabilidad del error de tipo II tambin se puede obtener grficamente usando las curvas caractersticas de operacin (curvas OC). Las curvas OC correspondientes a a=0.05 y a=0.01 aparecen en las figuras 4.1 y 4.2, respectivamente, y representan la probabilidad del error de tipo II contra d = = para distin-

tos valores de n . En estas figuras se observa fcilmente que, para n y a dados, la probabilidad del error de tipo II disminuye segn j se aleja de // 0 , y que, para 8 y a dados, la probabilidad del error de tipo II disminuye segn n aumenta. En el contraste unilateral //0:// = //0 frente a H\./n > / / 0 , la probabilidad de aceptar la hiptesis nula cuando

En este contraste las figuras 4.3 y 4.4 representan las curvas caractersticas de operacin para a=0.05 y a=0.01, respectivamente. La abscisa de estos grficos corresponde a d = = como en el contraste bilateral.
<7 <T

En el contraste unilateral de H0:u = UQ frente a //,://< // 0 , es fcil comprobar que la probabilidad de aceptar la hiptesis nula cuando (=in0-S( >>0) es la misma que en el otro contraste unilateral, es decir como abscisa Si el experimentador tiene la oportunidad de seleccionar el tamao muestral al inicio del experimento y desea simultneamente tener una probabilidad del error de tipo I igual a a y aceptar la hiptesis nula cuando ^=/n0+8 con probabilidad igual a /?, el tamao muestral necesario para cumplir los anteriores requisitos en el contraste bilateral se puede obtener analticamente. En efecto, como la probabilidad del error
se pe

Adems, tambin se

pueden usar las curvas caractersticas de operacin de las figuras 4.3 y 4.4, tomando

93

quena comparada con /? se obtiene que P=Q>\za/2


-a/2

, por lo que

El clculo del tamao muestral, para a, S y /3 dados, tambin se puede realizar grficamente usando los haces de curvas OC de las figuras 4.1 y 4.2. Para el procedimiento de contraste unilateral de la hiptesis nula H0:u = ju0 contra la hiptesis alternativa H[:ju> JUQ, el tamao muestral requerido para tener simultneamente una probabilidad del error de tipo I igual a a y una probabilidad del error de tipo II igual a /? cuando I=n0+ 8( >0), tambin se puede calcular analticamente. En efecto, como la probabilidad del error tipo II es entonces z Esta expresin para el tamao muestral es tambin aplicable cuando la hiptesis alternativa es H^.ju < //0 En los dos contrastes unilaterales, el tamao muestral para a, 8 y {$ dados, tambin se puede calcular grficamente usando los haces de curvas OC de las figuras 4.3 y 4.4.

Figura 4.1. Curvas OC para una prueba normal bilateral con a=0.05

Figura 4.2. Curvas O C para una prueba normal bilateral con a=0.01

94

Contrastes de hiptesis

Figura 4.3. Curvas OC para una prueba normal unilateral con a=0.05

Figura 4.4. Curvas OC para una prueba normal unilateral con =0.01 2.7.2. Contrastes para la media poblacional, varianza desconocida Para realizar el contraste bilateral de la hiptesis nula H0:u = jU0 contra la hiptesis alternativa H\\n ^ JQ cuando la varianza poblacional <j es desconocida, el estadstico de prueba es 0 = . Suponiendo que HQ es verdadera, grados de

el estadstico de prueba /0 sigue una distribucin t de Student con n-\

libertad, es decir, tQ ~ tn_\. Como valores grandes de tQ favorecen la hiptesis alternativa, la regin crtica de tamao a es C = \t y el P-valor es igual a 2 Para contrastar //0:// = // 0 frente a la alternativa unilateral Hl:t> JUQ a un nivel de significacin a la regin crtica es C = ltQ /1()> ta.n_}\ y P-valor = P(t mientras que para el contraste unilateral //0:/ = // 0 frente a la regin crtica es y P-valor

95

Para determinar la probabilidad de error de tipo II necesitamos conocer la distribucin del estadstico de prueba t0 cuando H0 es falsa. Cuando /=[10+S, el estadstico de prueba es t0 = Z ~ #(0,1), W ~ donde

y las variables Z y W son independientes. La distribucin , y la denotaremos mediante t'n_\. En consecuen-

obtenida se denomina distribucin t no central con w-1 grados de libertad y parmetro de no centralidad cia, para el contraste bilateral la probabilidad del error de tipo II es P = p(-tai2-n-\ ^'o ^ ta/2-n-i / $ * 0) = P(-/a/2;w-i ^ Ci ^ 'a/2; W -i) Las curvas OC de las figuras 4.5 y 4.6 muestran (3 en funcin de un parmetro d para diferentes tamaos mustrales n y corresponden respectivamente a a=0.05 y ce=0.01. El parmetro d se define como d Si el contraste es unilateral con
<7

//,:/j>/ 0 se utilizan los haces de curvas OC de las figuras 4.7 y 4.8 haciendo mientras que si //,: < 0 se utilizan estas mismas curvas OC con . Observamos que el parmetro d depende del valor de cr, que es desconocido. En la prctica, d se aproxima estimando o mediante la desviacin tpica muestral S.

Figura 4.5. Curvas OC para una prueba t de Student bilateral con a=0.05

96

Contrastes de hiptesis

Figura 4.6. Curvas OC para una prueba t de Student bilateral con a=0.01

0,90

Figura 4.7. Curvas OC para una prueba t de Student unilateral con a=0.05

Figura 4.8. Curvas OC para una prueba t de Student unilateral con ce=0.01

97

2.7.3. Contrastes para la desviacin tpica poblacional Si deseamos realizar el contraste bilateral de H0: <7= <T0 contra Hl: a <70, el estadstico de prueba es XQ = ~. Suponiendo que H() es verdadera, el estads-

tico de prueba sigue una distribucin X de Pearson con n-\ grados de libertad, es decir, bajo H0 se cumple Xo~Xn-\- Por tanto, la regin crtica tiene nivel de significanation P-valor se obtiene mediante P-valor = 2-min El mismo estadstico de prueba se emplea para los contrastes unilaterales. Para el contraste unilateral de //0: <r= <70 contra H\\ <7> (70 la regin crtica de tamao a es > mientras que para el contraste unilateral de // 0 :<7=<7 0 contra H\:o<o() la regin crtica de tamao a es

l estadstico de prueba cumple que ^o ~ ^ ' /?T-i > donde A2 = r-. De esta forma, la probabilidad del error de tipo II en el contraste bilateral es

Esta expresin permite calcular 3 (o n dado j8) con las tablas de la distribucin X2 si conocemos A . La expresin para calcular la probabilidad del error de tipo II en los contrastes con hiptesis alternativas unilaterales se puede obtener de forma similar. Las figuras 4.9 y 4.10 presentan las curvas OC del contraste bilateral para a=0.05 y a=0.01, respectivamente. Las figuras 4.11 y 4.12 muestran las curvas OC para el caso //,:<7>CT 0 , y las figuras 4.13 y 4.14 representan las curvas OC para //,: cr< <70. En todas estas curvas OC el parmetro del eje de abscisas es A=o/ CTO.

98

Contrasted de hipotesis

Figura 4.9. Curvas OCpara una prueba X

bilateral con OJ=0.05

Figura 4.10. Curvas OC para una prueba X

bilateral con a=0.01

Figura 4.11. Curvas OC para una prueba X unilateral de cola derecha (rechazo en a> a a) con a=0.05

99

Figura 4.12. Curvas OC para una prueba X unilateral de cola derecha (rechazo en a> O0) con a=0.01

Figura 4.13. Curvas OC para una prueba X unilateral de cola izquierda (rechazo en a< o(}) con a=0.05

Figura 4.14. Curvas OC para una prueba X unilateral de cola izquierda {rechazo en a< aa) con a=0.01

100

Contrastes de hiptesis

2.2. El problema de dos muestras En esta seccin suponemos (salvo que se indique expresamente lo contrario) que X\ y X2 son dos poblaciones independientes tales que representan m. a. s. de respectivamente. 2.2.7. Contraste para la igualdad de dos medias, varianzas conocidas En el contexto que estamos considerando sabemos que

y, portante, Si las varianzas poblacionales son conocidas y queremos contrastar la hiptesis nula HQ\H\ = jU2 contra la hiptesis alternativa bilateral H\.fa * jU2, el estadstico de prueba adecuado es Z0 = , '
2

Cuando la hiptesis nula es verdade-

ra, el estadstico de prueba Z0 sigue una distribucin jV(0,l). Si deseamos que el nivel de significacin del contraste sea a, la regin crtica es C = \Z Si ZQ denota el valor muestral del estadstico de prueba, el P-valor es 2 PZ > z0\\ El mismo estadstico de prueba Z0 se usa para contrastar las hiptesis alternativas unilaterales. Sin embargo, las expresiones para la regin crtica y el P-valor son diferentes. Como la notacin X y X2 es arbitraria, denotando mediante X} la poblacin que bajo Hl tiene mayor media poblacional, es suficiente con estudiar el contraste de H0:jil = jU2 contra Hl:u] > jU2. Para este contraste la regin crtica de tamao a es C = {Z Para determinar la probabilidad del error de tipo II (o calcular la potencia del contraste), es necesario obtener la distribucin del estadstico de prueba cuando la hiptesis alternativa es verdadera. Si suponemos que fi\-(j,2=8, el estadstico de prueba se puede expresar como Z . En consecuencia,

Por

tanto,

el

estadstico

de

prueba

verifica

que

101
Si la hiptesis alternativa es bilateral, la probabilidad del error de tipo II es J3 = P( Aceptar

Tomando = del error de tipo II se simplifica a

, la expresin de la probabilidad Compa-

rando esta expresin de /3 con la del contraste bilateral de la media poblacional en un problema de una muestra (apartado 2.1.1), concluimos que en el contraste bilateral que estamos estudiando se pueden usar tambin las curvas OC de las figuras 4.1 y 4.2 tomando como abscisa \d\. Si la hiptesis alternativa es Hl:jul> ]U2, 1a probabilidad del error de tipo II cuando 5=/,-/ 2 >0, es

La expresin permite calcular analticamente la probabilidad del error de tipo II en los contrastes unilaterales. Para calcular grficamente j3 se pueden usar las curvas OC de las figuras 4.3 y 4.4. Un problema interesante es determinar los tamaos mustrales y 2 ^e forma que simultneamente la probabilidad del error de tipo I sea a y que la probabilidad del error de tipo II cuando ^-^=8 sea igual a j3. En el contraste bilateral los requisitos deseados se pueden expresar analticamente como ft = O z de forma equivalente como z En el contraste unilateral, 3 = O z a En consecuencia za dje donde

. Una vez calculado n, los tamaos mustrales deseados n\ y n 2 han de cumplir n = . Una solucin posible es n

102

Contrastes de hiptesis

2.2.2. Contraste para la igualdad de dos medias, varianzas desconocidas Supondremos en este apartado que las varianzas de las dos poblaciones son desconocidas pero iguales, es decir, o\ = 0\. Denotaremos mediante <j2 el valor comn de las varianzas poblacionales. En esta situacin sabemos que . donde , Si queremos contrastar la hiptesis nula //0://! = // 2 contra la hiptesis alternativa bilateral
2,

el estadstico de prueba es

. Cuando la

hiptesis nula es verdadera, el estadstico de prueba 0 sigue una distribucin de Student con j + 2 - 2 grados de libertad. Luego la regin crtica de tamao a es y el P-valor es igual a Si la hiptesis alternativa es unilateral, el contraste de hiptesis usa el mismo estadstico de prueba tQ. Sin embargo, si la hiptesis alternativa es Hl:fl > u-, la regin crtica de tamao a es C = {/o//o > /l a ;Wl + w ,-2J Y P-valor = P(t^+^_2 ^ o) Para determinar la distribucin del estadstico de prueba cuando la hiptesis alternativa es verdadera, hemos de tener en cuenta que dado
2=

que

5, el estadstico de prueba se puede expresar

como ?

. En consecuencia,

si

suponemos adems que w,1 = 2 9 = , obtenemos

de

modo que 0 sigue aproximadamente una distribucin t no central con


2 -2

= 2-2 grados de libertad y parmetro de no centralidad

(Observar que 2n 1, nmero que aparece dentro de la raz, es igual al nmero de grados de libertad ms uno). Este resultado sugiere que para los contrastes que consideramos en este apartado podemos usar las curvas OC construidas para los contrastes t de una muestra (apartado 2.1.2) con tal de que el parmetro del eje de abscisas sea d = 151/2(7 y que el tamao muestral que aparece en las curvas OC se interprete como n* = 2n -1.

103
2.2.3. Contraste para la igualdad de dos medias, muestras apareadas Supongamos que ( X U , X 2 ) (/ = !,...,) es una m.a.s. de ( X , X 2 ) de tamao n, donde X{ y X2 son v.a. dependientes. Las diferencias D = Xlf - X2 constituyen una m.a.s. de la v.a. D = X-X 2. El contraste de contra H]:^il ^ U2 es equivalente al contraste de HO:JLD = 0 contra donde JU D es la media poblacional de D. Si suponemos que es desconocida, las anteriores hiptesis se pueden contrastar usando el estadstico de prueba tQ = r~r=-> donde D y SD son la

media y la varianza mustrales de las diferencias. La regin crtica de tamao a es [ y el P-valo sis alternativas unilaterales es similar. 2.2.4. Contraste para el cociente de varianzas Sean X y X2 dos poblaciones normales independientes tales que X ~N(fj,^<j2) y X2 ~ N(ju2,Cfl), donde jU{, j U 2 , a 2 y a\ son desconocidas. Supongamos que queremos contrastar la hiptesis nula HQ:ff} =<J2 contra la hiptesis alternativa H^crf ^ <J2 Estas hiptesis se pueden escribir de forma equivalente como HQ,G\IO\ = 1 y H^.a2o\ ^ 1. Si disponemos de una m.a.s. (de tamao n\) de X\ y de una m.a.s. (de tamao n2) de X2 y denotamos las varianzas mustrales por S2 y S2 , respectivamente, entonces sabemos que
0|).

El tratamiento de las hipte-

Para contrastar H0 contra H\ podemos usar como estadstico de prueba que tiene una distribucin F de Fisher con (n} -I,n2-1) grados de libertad si H0 es verdadera. Observamos que valores del estadstico de prueba F0 alejados de la unidad apoyan la hiptesis alternativa, lo cual sugiere que la hiptesis nula debe rechazarse para valores pequeos- y para valores grandes del estadstico de prueba. Para un nivel de significacin ce la regin crtica es El P-valor muestral es

104

Contrastes de hiptesis

Para contrastar las hiptesis alternativas unilaterales se emplea el mismo estadstico de prueba. Como la notacin X\ y X2 es arbitraria, cosideraremos como X{ la variable que tiene mayor varianza segn la hiptesis alternativa. Entonces basta considerar el contraste //0:0f = o\ contra H\.d\>o\. En este contraste, la regin crtica de tamao a es y el P-valor es igual a

El estadstico de prueba cumple que Haciendo obtenemos

> donde serultado que nos

proporciona la distribucin del estadstico de prueba cuando la hiptesis alternativa es verdadera. De esta forma, en el contraste bilateral la probabilidad del error de tipo II cuando

Esta expresin permite calcular j3 analticamente. Las figuras 4.15 y 4.16 presentan las curvas OC del contraste bilateral para a=0.05 y a=0.01, respectivamente. Estas curvas OC permiten calcular /? grficamente cuando n}-n2. Si la hiptesis alternativa es unilateral de la forma H}\a\ > <7 2 , la probabilidad del error de tipo II cuando

Las curvas OC de las figuras 4.17 y 4.18 representan /3 como funcin de a=0.05 para respectivamente. Para determinar los tamaos mustrales n\ y 2 (suponiendo n\=n2} dado fi, podemos utilizar las curvas OC.

105

Figura 4.15. Curvas OC para una prueba F bilateral con a=0.05

Figura 4.16. Curvas OC para una prueba F bilateral con a=0.01

Figura 4.17. Curvas OC para una prueba F unilateral con =0.05

106

Contrastes de hiptesis

Figura 4.18. Curvas OC para una prueba F unilateral con =0.01

2.3. Problema de k muestras Consideremos k poblaciones X\,...,Xk independientes tales que cada X sigue una distribucin normal con media fi y varianza (comn) <7 . Supongamos que las medias //; (/ = !,...,&) y la varianza o1 son desconocidas. El problema de k muestras consiste en contrastar la igualdad de las k medias de las correspondientes poblaciones usando una m.a.s. de cada poblacin. Las hiptesis consideradas en el problema de k muestras son //0:^ =// 2 = --- = /^/t ( ^ - 2 ) y //,: no HQ. El procedimiento para realizar el contraste esta basado en un mtodo llamado anlisis de la varianza. Veamos en qu consiste este mtodo partiendo del caso particular de dos muestras. Como sabemos, para contrastar H0:ju\ ~ ^2 = 0 usamos el estadstico de prueba tQ = es verdade-

ra, entonces t0 ~ tn +n _ 2 . Para generalizar el estadstico 0 Para fil caso de k muestras, partimos de

donde

107

Es

fcil

probar

que

donde

es la media muestral ponderada de todas las medias mustrales. De esta forma, el estadstico Q para dos muestras se puede expresar como

Bajo la distribucin de ?0 es una distribucin F con un grado de libertad en el numerador y j + 2 2 grados de libertad en el denominador
(observar que si t =
v

entonces

La generalizacin a & muestras conduce al estadstico de prueba

donde ahora X, =

. Se puede demostrar que bajo Hn'-i\ ... jii

estadstico F0 para k muestras tiene una distribucin F de Fisher con k-\ grados de libertad en el numerador y n k grados de libertad en el denominador, donde n nl+...+nk . (Debemos recordar que en la construccin del estadstico tQ para 2 muestras se supone que las varianzas poblacionales son iguales, es decir, a\ = o\ = o2. En la generalizacin a k muestras, el estadstico F0 tiene la distribucin nula mencionada slo cuando las varianzas poblacionales son iguales, es decir, Definimos las siguientes cantidades: : Suma de cuadrados entre (que mide la variabilidad entre las muestras). SSW dad dentro de las muestras). Suma de cuadrados dentro (que mide la variabili-

108

Contrastes de hiptesis

SST =

Suma de cuadrados total (que mide la variabilidad

total). Es fcil demostrar que SST = SSB + SSW. Obsrvese que esta igualdad indica que la variabilidad total se puede descomponer como la suma de la variabilidad dentro y la variabilidad entre. Definimos el cuadrado medio entre (MSB) como MSB = SSB/(k -1) y el cuadrado medio dentro (MSW) como MSW = SSW/(n-k). Segn estas definiciones, el estadstico de prueba FQ se puede expresar en trminos de las variabilidades como . Es por este moti-

vo que el procedimiento de contraste que estamos describiendo se llama anlisis de la varianza. Evidentemente F0 > O . Adems observamos que cuanto mayor es el numerador MSB (y, por tanto, F0), mayor es la diferencia entre las medias mustrales de las k muestras. Luego debe rechazarse la hiptesis nula //0://i = ^2 = ---~ l^k Para valores grandes del estadstico de prueba. En consecuencia, para un nivel de significacin a , la regin crtica es , mientras que el P-valor es P-valor Todos los clculos necesarios para realizar el contraste se pueden disponer en la llamada tabla del anlisis de la varianza o tabla ANOVA:
Fuente
de

Grados
de

Suma de cuadrados

Cuadrado medio

Razn F

P-valor

variacin

libertad

Entre

MSB

Dentro

MSW

Total

En el caso de que se rechace la hiptesis nula nos gustara tener un procedimiento estadstico que nos permitiese agrupar en un mismo grupo las medias para las que no se detectan diferencias significativas y dejar en distinto grupo aqullas para las que s se detectan diferencias significativas. Existen varios mtodos para realizar dicha agrupacin. Aqu describiremos el mtodo de la diferencia significativa mnima de Fisher (FSD). El mtodo FSD considera el estadstico t0 para dos muestras

109

tomando S = ^ MSW . Entonces es fcil demostrar que baio la hiptesis nula //n://, = / , , el estadstico n = , - sigue una distribucin

t de Student con n - k grados de libertad. Por tanto, si tQ\>ta/2.n_k se rechazara la hiptesis nula //, = jUj . Si suponemos X > Xj , la desigualdad equivalente a la desigualdad X LSDj ta/2.n^( La cantidad

se llama diferencia significativa mnima. Si

, entonces el procedimiento FSD concluye que jU y ju pertenecen a distinto grupo (considera que //, y ju son diferentes). En cambio, si X-X <LSDj , entonces el mtodo FSD concluye que //, y // ; pertenecen al mismo grupo (considera que ju y // son iguales). Aplicando esta regla a todas las parejas de muestras (,y), las medias quedan agrupadas en los llamados grupos FSD. Debe observarse que si los tamaos de todas las muestras son iguales, la LSD es comn para todas las parejas de muestras (este es el caso ms fcil). Si no ocurre as, resulta bastante cmodo calcular la LSD mxima ( LSDmdl) que es la que corresponde a los dos tamaos mustrales ms pequeos, y la LSD mnima ( LSD m l n ) que corresponde a los dos tamaos mustrales ms grandes. De esta manera, si X - Xj es mayor o igual que L5Dmax entonces tambin es mayor o igual que LSDj, y si X - Xj es menor que LSDmln entonces tambin es menor que LSDj . Slo en el caso en que LSDmm < X - Xj < LSDm.dX es necesario calcular LSDj . En resumen, el mtodo FSD consta de las dos etapas siguientes: 1a etapa) Contrastar HO:JL] =// 2 == / mediante un anlisis de la varianza (usualmente a un nivel de significacin del 5%). Si se acepta la hiptesis nula, el procedimiento concluye admitiendo que todas las medias son iguales y que por tanto todas las medias estn en el mismo grupo. En caso de rechazar // 0 ://,=// 2 =...= // / t , pasar a la 2a etapa. 2a etapa) Efectuar la agrupacin de las medias en los diferentes grupos FSD mediante el procedimiento descrito anteriormente. 3. CONTRASTES DE HIPTESIS PARA MUESTRAS GRANDES Sea un estimador puntual de Abasado en una m. a.

Supongamos que 0 tiene distribucin asinttica normal con media 6 y varianza es decir, d ~ jV(0,cr|) (si n><*>). Este resultado puede utilizarse para contrastar hiptesis de la forma //0: 0= 00 contra cualquier alternativa unilateral o bilateral. El estadstico de prueba es donde &g(&o) denota la desviacin tpica

IIQ

Contrastes de hiptesis

de 6 calculada bajo la hiptesis de que 6= Q. Bajo HQ, el estadstico Z0 sigue aproximadamente una distribucin jV(0,l) para n grande. Luego cuando la alternativa es bilateral, la regin crtica con nivel de significacin aproximadamente a es y el P-valor es igual a 2P(Z > z0|). Si la hiptesis alternativa es H\\ 6>00, entonces valores grandes de 9 apoyan 6>QQ de modo que valores grandes de Z() tienden a desacreditar //0: 0=00 frente a H: 0>00. Por tanto, si la alternativa es //,: 0> 00, la regin crtica es C = (Z0/ Z0 > za] y el P-valor es igual a P(Z > z 0 ). El argumento para la otra alternativa unilateral es similar. A continuacin presentamos el valor de <J(#0) en algunos casos particulares. Si 9 = X y 00=0, entonces 0^(#o) = v v
xv / \ /
I

con

independencia del valor de 00. Si


de

6= (7, entonces # = S y suponiendo que la muestra procede de una poblacin aproximadamente normal
asi bajo

modo que el estadstico de prueba adecuado es Z Si la m.a.s. procede de una distribucin Bernouilli con parmetro 0=p, entonces . Si disponemos de dos m.a.s. de dos poblaciones Bernouilli independientes con parmetros p\ y p2 , respectivamente, y el parmetro de inters es 6=pt-p2, entonces 0= p} -p2 y Oo=Q- En consecuencia, como cr = , tenemos que bajo

. Como p es desconocido, debemos estimarlo de forma consistente. Se puede demostrar que la proporcin muestral combinada donde X e Y son los nmeros de xitos de la primera y segunda muestra, respectivamente, es consistente para p. Por tanto,

es el estadstico de prueba apropiado.

Ejercicios

\\\

EJERCICIOS

1. Un tcnico agrcola desea comparar el rendimiento de dos variedades diferentes A y B de tomate. Para ello elige 15 invernaderos distintos y en cada uno de ellos siembra una parcela con la variedad A y otra con la variedad B. Las dos parcelas de un mismo invernadero tienen suelos similares y se someten a los mismos procesos de fertilizacin, mientras que las parcelas de distinto invernadero son diferentes. En la siguiente tabla se muestran, para cada invernadero, las producciones obtenidas:
im a 1 2 j 23.2 4 6 5 18.7 19.8 23.1 7 8 9
10 11 28.7 26.2 15 12 13 14 23.3 22.3 37.0 31.5

21.4

20.9

18,9

22.8 25.6

17.6

15.0

21.7 2.2 28.1 2:5

13.6 25.1 22.7 27.7

26.6 25.2 26.6

19.1

33.9

25.3

Se supone que las producciones siguen distribuciones normales. a) A qu niveles de significacin podemos aceptar la hiptesis de que ambas variedades tienen distinta produccin? b) Si el tcnico agrcola hubiera usado parcelas de distintos invernaderos y hubiera obtenido las mismas producciones anteriores, sera la produccin media de la variedad A mayor que la de la variedad B al nivel de significacin a =0.05? Solucin a) Tenemos 15 pares independientes de rendimientos procedentes de dos poblaciones XA y XB con medias juA y JUB, donde los rendimientos de cada par (XAi,XB) son dependientes. Suponiendo que la diferencia en rendimientos D= XA- XB es una v.a. normal, podemos construir un test para contrastar la hiptesis H0:uD = 0 frente a H\\nD ^ O . Las diferencias de los rendimientos son las siguientes:
Inv D 1 3.8 2 5.9 3 1.5 4 5 1.7 6 1.6 7 5.3 8 9 0.9 10 0.8 1 1 12 13 3.6 14 3.1 15 6.2

-2,5

-2.3

-3.3

Es fcil comprobar que D =1.82, SD = 2.94

el estadstico de prueba es

El P-valor muestral es P(|14 > 2.4). Por tanto, se acepta H} a niveles de significacin mayores o iguales que Plt^ >2.4). Como

2-0.01 < P(\tl4 > 2.4) < 2 0.025, se acepta la hiptesis de que ambas variedades tienen distinta produccin a niveles de significacin a>0.05. b) Tenemos ahora dos m.a.s. independientes de distribuciones normales con varianzas desconocidas. Si suponemos que son iguales, es 9 9 9 O decir, suponiendo oA oE = cr y <r desconocido, el valor observado del estadstico de prueba para contrastar H^.(iA<nB frente a Hl:juA>jUB es

112

Como

n o na

Y suficiente evidencia para acep-

tar que la produccin de la variedad A es mayor que la produccin de la variedad B, al nivel de significacin a=0.05. 2. Se sabe por larga experiencia que la resistencia de un casco de seguridad a una fuerza externa estndar sigue una distribucin normal de media 1000 kg y varianza 1600 kg . Un ingeniero ha diseado un nuevo tipo de casco y desea vender la patente a una fbrica de cascos. La fbrica comprar la patente si los nuevos cascos tienen una resistencia media, //, significativamente mayor que 1000 kg y una varianza de la resistencia, <j 2 , significativamente menor de 1600 kg . Para tomar la decisin la fbrica elige un nivel de significacin a=0.05 para cada uno de los contrastes a efectuar. Suponiendo que la resistencia del nuevo casco sigue una distribucin normal, resolver los siguientes apartados. a) Si para una m.a.s. de 15 cascos nuevos la resistencia media muestral y la varianza muestral han sido de 1039 kg y 1400 kg2 respectivamente, comprar la fbrica la patente del nuevo tipo de casco? Por qu? b) Considerando exclusivamente el contraste relativo a la varianza, calcular O 9 analticamente la probabilidad de rechazar el nuevo casco si a = 1461 kg y = 15Solucin a) Para tomar la decisin, la fbrica ha de contrastar //0://<1000 contra //1://>1000 y fQ-.a2 > 1600 contra H(:o2 < 1600. La fbrica comprar la patente si se aceptan H^ y H{. Para contrastar HQ:JU< 1000 contra //,://> 1000 , el estadstico de prueba es tQ =7-7=^- Si prefijamos a=0.05, entonces la regin crtica es . Como = 4.04 > 1.76 , se acepta

que la resistencia media // es significativamente mayor que 1000 kg. Para contrastar //:<J2 > 1600 contra H{:a2 < 1600, el estadstico de prueba es y la regin crtica para un nivel de significacin del 5% es como se acepta

Ejercicios

113

por tanto, la varianza de la resistencia del nuevo casco no es significativamente menor de 1600 kg 2 . En consecuencia, la patente del nuevo casco no se comprar debido a que H { no se acepta. b) En este apartado se trata de evaluar la probabilidad del error de tipo II en el contraste de // contra H{. Dicha probabilidad es

3. Sea X una v.a. continua con funcin de densidad /(je) = - si Q<x< 9y cero en otro caso. a) Si se ha obtenido un observacin aleatoria de X, encontrar la regin crtica para contrastar H0: 9=2 contra H{: 0<2 al nivel de significacin a=0.01. b) Cul es la probabilidad del error de tipo II si 6= 1.5? Solucin a) Como E(X) = 9 , se debe dudar de la hiptesis nula a favor de la hiptesis alternativa para valores pequeos de X. Por tanto, la regin crtica debe ser de la forma C = [X < k} . Para que la probabilidad de error de tipo I sea igual a 0.01, k ha de cumplir 0.01 = P(X < k 10 = 2} = -dx = . Despejando obtenemos k = 0.2. Luego la regin crtica al nivel de significacin 0.01 es b) La probabilidad del error de tipo II es

Observamos que la probabilidad de error de tipo II es muy grande y, por tanto, la potencia (probabilidad de detectar un valor de 6 igual a 1.5) es muy pequea. Para disminuir la probabilidad de error de tipo II se debe de usar una muestra de mayor tamao y basar la regin crtica en el estimador maximoverosmil de 9. 4. Sea ^,...,^0 una m.a.s. de tamao 10 de una poblacin exponencial con funcin de densidad f ( x ) = e~ si x > O y cero en otro caso. Se desea contrastar la hiptesis nula //0: A = 1 contra la hiptesis alternativa //,: A = 2 al 5% de significacin. Resolver los siguientes apartados utilizando que el doble de la suma de n exponenciales independientes de media uno sigue una distribucin % con 2n grados de libertad. a) Determinar la regin crtica. b) Calcular la potencia del contraste.

\ 14

Contrastes de hiptesis

Solucin a) El estimador mximo verosmil de es l/X, de modo que un valor pequeo de X apoya la hiptesis de que A es grande. En consecuencia, la regin crtica debe ser de la forma cL Para que el nivel de significacin

sea del 5%, k debe ser tal que P( C/ = l) = 0.05 . Como resulta que P( C / A = l) = P(Y < 2 1 10) = P^xlo ^ 20^) Entonces la ecuacin = #20:0.95 =10-9 Y Pr tant0' ^ = -545 En consecuencia, la regin crtica al 5% de significacin es b) La potencia del contraste viene dada por la probabilidad de rechazar la hiptesis nula cuando la hiptesis alternativa es verdadera. Por tanto, la potencia es igual a
05 nos conduce a 2

5. En una fbrica nacional y otra internacional se estn haciendo zapatos del mismo tipo y con el mismo material. En cada fbrica se toma una m.a.s. de zapatos y se mide la cantidad de caucho (en gramos) empleada en cada zapato, obtenindose los siguientes resultados: Fbrica nacional: 126, 128, 128, 130, 130, 130, 130, 131, 133, 134, 134 Fbrica internacional: 128, 130, 130, 130, 131, 132, 132, 134. Se sabe que las cantidades de caucho empleadas en un zapato en ambas fbricas siguen distribuciones normales con varianzas iguales. Como la fbrica internacional vende los zapatos a un precio superior al de la fbrica nacional, una agencia de proteccin del consumidor desea investigar si la fbrica internacional emplea en promedio ms caucho en cada zapato que la fbrica nacional. a) Sugieren los resultados mustrales que se emplea en promedio ms cantidad de caucho en un zapato en la fbrica internacional que en la nacional? b) Suponiendo que la desviacin tpica poblacional en ambas fbricas es igual a 2.2 gramos, calcular razonadamente la potencia con que un contraste de igualdad de medias al 5% de significacin detecta una diferencia de 2 gramos en las cantidades promedio de caucho empleadas en un zapato por la fbrica internacional y la fbrica nacional. Solucin a) Denotemos por X e Y la cantidad de caucho empleada en un zapato por la fbrica nacional y la fbrica internacional, respectivamente. Para decidir si la fbrica internacional usa en promedio ms cantidad de caucho en la elaboracin de un zapato que la fbrica nacional, hay que contrastar la hiptesis nula contra la hiptesis alternativa

Ejercicios

115

Suponiendo que X e Y siguen distribuciones normales con la misma desviacin tpica, tenemos que el estadstico de prueba es 0 = . = , la regin crtica

es de la forma C = [t0 < k] y el estadstico de prueba bajo la hiptesis nula sigue una distribucin t de Student con nx +nY -2 grados de libertad. Por tanto, el P-valor es igual a P(t Para los datos mustrales es fcil comprobar que ^=11, w

En consecuencia,

Usando una tabla de la distribucin de Student se puede comprobar que el P-valor pertenece al intervalo (0.3,0.4). Como el P-valor es grande, los resultados mustrales sugieren que las medias poblacionales de X e Y son iguales y, por tanto, la media muestral de X no es significativamente menor que la media muestral de Y. b) Considerando las hiptesis H0 y H\ establecidas en el apartado a), y suponiendo ahora que la desviacin tpica comn es conocida, el estadstico de prueba es La regin crtica de tamao 0.05 es

0 < -z0 05 = -1.64} . La probabilidad de detectar una diferencia JUY - JLI x = 2 es igual a . Como Z0 sigue

una distribucin AM

, 1 , entonces

Por tanto, la potencia con que el contraste de igualdad de medias al 5% de significacin detecta una diferencia de 2 gramos en las cantidades promedio de caucho empleadas en un zapato por la fbrica internacional y la fbrica nacional es del 62.17%. 6. Un partido poltico realiza una encuesta a 1500 electores para decidir si en las prximas elecciones obtendr al menos un 45% de votos. La regla de decisin tiene que cumplir que la probabilidad de concluir que la proporcin de votos es menor del 45% cuando realmente es al menos del 45% ha de ser slo del 5%. a) Plantear el contraste adecuado y especificar la regin crtica. Si en la encuesta el partido poltico encuentra que 630 electores se manifiestan a su favor, cul es la decisin? Obtener el P-valor. b) Obtener la potencia del contraste cuando el verdadero porcentaje de votos a favor es del 43%.

116

Contrastes de hiptesis

Solucin a) Seap la proporcin de votantes a favor del partido poltico. Se desea contrastar la hiptesis nula H0:p> 0.45 frente a la hiptesis alternativa H\:p< 0.45 . Un buen estimador de p es la proporcin muestral p. Como valores pequeos de p favorecen //!, la regin crtica debe ser de la forma C = {p < k] , donde k se ha de elegir de manera que la probabilidad del error de tipo I no sea superior a 0.05. Como el tamao muestral es grande, la distribucin de la proporcin muestral es aproximadamente normal, y se puede utilizar el estadstico de prueba y la regin crtica C = {Z El valor observado Para la muestra del estadstico de prueba es

Como Z0 = -2.34 pertenece a la regin crtica, se debe rechazar la hiptesis nula de que el porcentaje de votos a favor es al menos del 45% al nivel de significacin del 5%. Por otra parte, como el P-valor del resultado de la encuesta es P(Z < -2.34) = 1 - 0.9904 = 0.0096, la hiptesis nula se debe rechazar para cualquier nivel de significacin mayor o igual que 0.0096. b) Si p = 0.43, la potencia del contraste planteado en el apartado a) es la probabilidad de que se rechace H0 cuando p = 0.43 . Como la hiptesis nula se rechaza cuando el estadstico de prueba pertenece a la regin crtica, la potencia pedida es #(0.43) = P(C / p = 0.43). La regin crtica es

ASI,

Por tanto, la potencia aproximada del contraste es del 46.02%. 7. El contenido medio de sulfates de determinada agua mineral era de 13.8 mg/1 (miligramos por litro) en 1997. En la actualidad sospechamos que el contenido medio de sulfatos es diferente. Para verificar nuestra sospecha requerimos un procedimiento de contraste de hiptesis que asegure que si el contenido medio actual es el mismo que en 1997 el procedimiento estadstico llegue a una decisin contraria slo el 5% de las veces. Adems, exigimos una potencia de al menos 0.90 cuando el contenido medio de sulfatos es en realidad de 12 mg/1. Suponiendo que el contenido de sulfatos sigue una distribucin normal:

Ejercicios

117

a) Plantear el contraste de hiptesis. Si la desviacin tpica es o = 2, obtener razonadamente el mnimo nmero de anlisis necesarios para cubrir nuestros requisitos de riesgo. b) Para el mnimo nmero de anlisis encontrado en a), es aceptable el procedimiento para detectar que la media actual es 0.5 mg/1 mayor que la de 1997? c) Suponiendo ahora que G = 2.5 y que a partir de una m.a.s. de 21 anlisis hemos obtenido X = 15.0 mg/1 y S = 2.1 mg/1, a qu conclusin debemos llegar respecto del contenido medio de sulfates? Calcular el P-valor. Solucin a) Denotemos por X el contenido actual de sulfates y por fj. la media poblacional de X. La hiptesis nula a contrastar es que la media poblacional de X es igual al contenido medio de sulfates de 1997, es decir, //0:// = 13.8. En caso de rechazar HQ aceptaremos la hiptesis alternativa //,://^13.8 . Los requisitos exigidos son que P(rechazar HQ/HO) = 0.05 y P(rechazar H0/fi = 12) > 0.90, es decir, a=0.05 y j8(12) < 1 - 0.90 = 0.10. Suponiendo que X sigue una distribucin normal con media // y <7 = 2, la regin crtica de H0 contra //, es de la forma La distribucin del estadstico Z() es y la potencia cuando u = 12 es

El requisito de que la potencia en // = 12 sea al menos 0.90 implica que Por tanto, el nmero n de anlisis necesarios para cubrir nuestros requisitos ha de cumplir b) La probabilidad de detectar que JL es diferente de 13.8 cuando // es igual a 13.8 + 0.5 = 14.3 coincide con la potencia en // = 14.3 . Considerando = 13, la potencia en i = 14.3 es

118

Contrastes de hiptesis

Por tanto, el procedimiento es poco potente para detectar una diferencia en la media de 0.5 mg/1. c) Si (7=2.5 y n = 21, el estadstico de prueba de //0 contra y la regin crtica es C = j|Z0 > 0025 = 1-96} Como X = 15.0 , el valor muestral del estadstico de prueba cumple que Z Luego se

rechaza que el contenido medio de sulfates es 13.8. Una forma equivalente de tomar la decisin consiste en comprobar que el P-valor del resultado muestral no supera al nivel de significacin del 5%. En efecto, P-valor = 2,P(Z > 2.2) = 0.027 < 0.05. 8. Sea X una v.a. discreta con la siguiente distribucin de probabilidad
X

-1

0 1/2

P(X = x)

(l-0)/4

(l+0)/4

donde 0e[-l,l]. Supongamos que se extrae al azar una observacin de dicha distribucin. a) Encontrar la regin crtica para contrastar H(): 6=-3/4 contra H} : 6 > -3/4 al nivel de significacin a=0.10. b) Para la regin crtica encontrada en el apartado a), calcular la potencia en 6= 1/2. Solucin a) Como valores grandes de X apoyan la hiptesis alternativa y, por tanto, la regin crtica debe ser de la forma C = { X > } . Para determinar la constante k imponemos el requisito de que la probabilidad del error de tipo I ha de ser no superior a 0.1, es decir, P(X > k / 9 - -3/4) < 0.1. La distribucin de probabilidad de X bajo la hiptesis nula //0: 0=-3/4 cumple
X
-1
0 1/2 1

P(X = x) P(X>x}

7/16
1

1/16 1/16

9/16

En consecuencia, el valor de k ha de cumplir k > 1. Para k = 1 la regin crtica es C - {X > 1} y la probabilidad del error de tipo I es igual a 1/16 = 0.0625, mientras que si k > 1 la regin crtica es C = { X > 1} y la probabilidad de error de tipo I es cero. Ambas regiones crticas tienen tamao no superior al 10% pero C = {X>l]

Ejercicios

119

tiene potencia positiva mientras que C = { X > 1} tiene potencia cero. Por tanto, preferimos la regin crtica b) La potencia de la regin crtica es

9. Actualmente la duracin de las lmparas elctricas fabricadas por una empresa tiene una media de 2000 horas y una desviacin tpica de 250 horas. Se est considerando la implantacin de un nuevo proceso de fabricacin. El proceso nuevo se implantar si la duracin media de n lmparas fabricadas con dicho proceso es por lo menos un 10% mayor que la duracin media poblacional del proceso actual. Se supone que la duracin de las lmparas fabricadas mediante el nuevo proceso sigue una distribucin normal con una desviacin tpica de 250 horas. a) Plantear el contraste de hiptesis que est considerando la empresa para decidir si implantar el nuevo proceso de fabricacin. Suponiendo n = 6, cul es la probabilidad del error de tipo I? b) Cul debe ser el tamao muestral mnimo para que exista un riesgo menor del 1 % de no implantar el nuevo proceso cuando dicho proceso proporciona lmparas con una duracin media de 2250 horas? Solucin a) Sea X la duracin de las lmparas fabricadas con el nuevo proceso. Suponemos ^-7^(^,250). La empresa est considerando el contraste de la hiptesis nula H0:jLi = 2000 contra la alternativa //:// > 2000 . Aceptar el nuevo proceso es equivalente a aceptar //, . Como la regla de decisin adoptada consiste en aceptar el nuevo proceso si una muestra de tamao 6 cumple X > 2000 H 2000, la regin crtica del contraste es La probabilidad del error de tipo I es por definicin la probabilidad de aceptar //! cuando H0 es verdadera, y para el procedimiento de la empresa es

b) El riesgo de no implantar el nuevo proceso cuando ste proporciona lmparas con una duracin media de 2250 horas es la probabilidad del error de tipo II para H = 2250 .Si C = \X > 2200} , la probabilidad del error de tipo II para ju = 2250 es

Para que j3 sea menor del 1%, el tamao muestral n ha de cumplir la desigualdad Observamos que esta desigualdad es equivalente a las siguientes desigualdades: Por tanto, el tamao muestral mnimo exigido es n = 136.

120

Contrastes de hiptesis

10. El coste total X de producir una unidad de output es la suma de un coste fijo 6 y de un coste variable. El coste variable es inobservable de modo que 9 es un parmetro desconocido positivo. El coste total X se distribuye con una funcin de. densidad f(x) = exp(9-x) x>9, y cero en otro caso. Una m.a.s. de 5 unidades de output ofreci los siguientes valores del coste total: 3.12, 2.80, 3.71, 2.07, 2.45. Se desea inferir si el valor del coste fijo 6 es 2 de modo que cuando el coste fijo 9 es realmente 2 se concluya (errneamente) que el coste fijo 9 no es 2 con una probabilidad no superior a 0.10. a) Establecer el problema en trminos estadsticos y encontrar una regla de decisin basada en el estimador maximoverosmil. b) Cul es el P-valor correspondiente a la muestra obtenida? Qu decisin debemos tomar? c) Si el verdadero valor del coste fijo 9 es 2.5, cul es la probabilidad de concluir (errneamente) que el coste fijo 9 es 2? Solucin a) Para decidir si el valor del coste fijo 9 es 2 hay que considerar el contraste de la hiptesis nula H0: 9=2 contra la hiptesis alternativa H}: 9^2. El requisito de que el procedimiento concluya que el coste fijo 9 no es 2 cuando 9 es 2 con una probabilidad no superior a 0.10 es equivalente a que la probabilidad del error de tipo I sea a lo sumo del 10%, es decir, P(C/ HQ) < 0.1 -a. Es fcil comprobar que el estimador maximoverosmil de 9 es X^ y que T=Xw-9~Exp(n), de modo que Dudaremos de la hiptesis nula tanto para valores pequeos de Xw como para valores grandes de X^ , de modo que la regin crtica debe ser de la forma Para determinar las constantes repartimos la probabilidad de error de tipo I mxima en partes iguales a cada una de las colas, es decir, Como

la constante k}

ha de cumplir que -5(k - 2) = ln(l - 0.05), de donde Por otra parte,

Para que esta probabilidad sea igual a 0.05, se ha de cumplir que -5(&2 - 2) = In 0.05 y, en consecuencia, k As, la regin crtica del contraste es de modo que la hiptesis nula debe rechazarse

Ejercicios

\2\

b) El valor muestral de X(]) es 2.07. Bajo la hiptesis nula,

y
El P-valor es igual a 2(rom{P(X Como el P-valor es mayor que 0.10, se acepta HQ . c) La probabilidad de aceptar la hiptesis nula cuando 6=2.5 es

11. Un autobs pasa cada 9 minutos por una parada. Dos amigos, Pedro y Juan, que toman ese autobs en dicha parada, no conocen el valor de 6 y desean efectuar inferencias sobre 6. Saben que el tiempo que esperan el autobs sigue una distribucin uniforme en el intervalo [O, 6]. Pedro cree que 6 es menor o igual que 00=30 minutos, mientras que Juan cree que 9 es mayor que 0 0 =30 minutos. Deciden contrastar si 9 < 30, de modo que cuando este supuesto es verdadero la probabilidad de sacar una conclusin equivocada sea a lo sumo 0.05. Si la primera vez que miden el tiempo de espera obtienen 25 minutos: a) Establecer la regla de decisin. Asociar los dos tipos de error con los riesgos de Pedro y Juan. A qu amigo favorece el contraste elegido? b) Calcular el P-valor del resultado muestral. c) Calcular el tamao del riesgo de Juan cuando 9 es 35. Solucin a) Sea X el tiempo de espera. Se supone que X~ /(0, 9) con 9 desconocido. El contraste que desean realizar Pedro y Juan considera la hiptesis nula H0: 9< 30 frente a la hiptesis alternativa H\: 9> 30. Obsrvese que H0 es la creencia de Pedro mientras que H} es la creencia de Juan. El riesgo de Pedro consiste en rechazar HQ cuando H0 es verdadera. Por tanto, el riesgo de Pedro est asociado con el error de tipo I. El riesgo de Juan consiste en aceptar //0 cuando su creencia ( H \ ) es verdadera, de modo que el riesgo de Juan est asociado con el error de tipo II. El tamao del riesgo de Pedro ser a lo sumo del 5% ya que han decidido fijar una probabilidad del error de tipo I a lo sumo del 5%, mientras que el tamao del riesgo de Juan no est acotado de antemano. Por tanto, el contraste elegido favorece la creencia de Pedro ( H 0 ) . La hiptesis nula se debe rechazar cuando el tiempo de espera es lo suficientemente grande, y por tanto la regin crtica debe ser de la forma Para que la probabilidad del error de tipo I sea a lo sumo 0.05, la constante k ha de cumplir 0.05> P(C 19= 30) = . En consecuencia,

122

Contrastes de hiptesis

k = 0.95-30 = 28.5 . Como el valor muestral de X es 25, el resultado muestral no pertenece a la regin crtica y, por tanto, se debe aceptar la creencia de Pedro (// 0 ). b) El P-valor es la probabilidad de obtener el resultado muestral o un resultado ms desfavorable a la hiptesis nula cuando la hiptesis nula es verdadera. Como valores grandes del tiempo de espera apoyan la hiptesis alternativa, el P-valor es P( X > 25 / 6 = 30) = dx = 0.16 Como el P-valor es mayor que la probabili-

dad del error de tipo I prefijada, no hay suficiente evidencia en contra de la hiptesis nula y debe aceptarse //0 . c) Cuando d es 35, el tamao del riesgo de Juan es Obsrvese que mientras el contraste garantiza que el tamao del riesgo de Pedro es a lo sumo del 5%, el tamao del riesgo de Juan es mucho mayor para valores de d poco mayores que 30. 12. En una poblacin de familias se quiere contrastar a un nivel de significacin del 5% si un aumento de precio de un bien disminuye el nmero medio de unidades compradas. Para una m.a.s. de 10 familias se midieron las variables X e Y, nmero de unidades compradas la semana anterior y posterior al aumento respectivamente, obtenindose los siguientes resultados:
Familia X (antes) Y (despus)

1
40 25

2
16 16

3
30 20

4
28 20

5
20 22

6
18 20

7
36 28

8
12 16

9
60 45

10 30 19

a) Establecer las hiptesis nula y alternativa. Establecer los supuestos necesarios sobre las distribuciones para que el contraste a realizar sea vlido. Calcular el P-valor muestral. Cul es la conclusin? b) Cul es la probabilidad aproximada de detectar una disminucin media de 4.4 unidades? c) Cul debera ser el nmero de familias muestreadas si se deseara que la probabilidad del error de tipo II para una disminucin media de 4.4 unidades fuera menor de 0.20? Solucin a) El contraste a realizar considera la hiptesis nula H0:jux = JUY contra la hiptesis alternativa H\\nx > JUY . Como las observaciones mustrales corresponden a una muestra apareada, las variables X e Fno se pueden considerar independientes. Sin embargo, si consideramos la variable diferencia D = X - Y y hacemos UD = jux - jUY , las hiptesis nula y alternativa pueden reescribirse como H0:uD=0 y Hl:juD> O , respectivamente. Si suponemos que D sigue una distribucin normal

Ejercicios

123

y que las variables prueba

son independientes, el estadstico de sigue, bajo HQ , una distribucin t de Student con n -1 grados

de libertad. Como debe dudarse de la hiptesis nula para valores grandes del estadstico de prueba, la regin crtica de tamao 5% es C - \ t0 > t005.9 = 1.83\ y el P-valor es igual a P(t9>t0}. Los resultados mustrales ofrecen = 10, Z)=5.9, SD = 7.2641 y tQ = 2.5685. Como el estadstico de prueba pertenece a la regin crtica, concluimos a un nivel de significacin del 5% que el aumento de precio del bien disminuye el nmero medio de unidades compradas. El mnimo nivel de significacin que, dados los resultados mustrales, conlleva el rechazo de la hiptesis nula HQ es el P-valor, que es P(t9 > 2.5685) (0.01, 0.025). En consecuencia, concluimos que para niveles de significacin mayores o iguales que el 2.5% la hiptesis nula es falsa. b) La probabilidad de detectar una disminucin media de 4.4 unidades se puede calcular de forma aproximada utilizando el haz de curvas OC correspondiente a los contrastes t unilaterales a un nivel de significacin a=0.05. Para = 10 y se obtiene que la probabilidad del error de tipo II es p = 0.45 , y por tanto la probabilidad de detectar el cambio es I-/? E 0.55. c) Si se deseara que la probabilidad del error de tipo II para una disminucin media de 4.4 unidades fuera menor de 0.20, el mnimo nmero de familias necesario se puede calcular haciendo uso del haz de curvas OC indicado en el apartado b). Para se obtiene = 20. Luego = 20 es el mnimo tamao de muestra necesario. 13. La resistencia de los fusibles de 5 ohmios producidos por una empresa es una v.a. normal. Se desea contrastar la hiptesis nula de que la resistencia media es igual a 5 ohmios. Para la prueba se establecen los siguientes requisitos: Si la resistencia media es de 5 ohmios se desea rechazar la hiptesis nula con una probabilidad de 0.01, mientras que si la resistencia media se separa de 5 en 0.02 ohmios se quiere detectar tal cambio con probabilidad al menos de 0.80. a) Si una m.a.s. de 10 fusibles ofreci las siguientes resistencias en ohmios: 4.994, 4.984, 5.007, 5.009, 4.992, 4.946, 5.001, 5.015, 5.004, 5.017, satisface esta muestra los requisitos establecidos? En caso negativo, cul es el nmero mnimo de fusibles adicionales que hay que tomar? b) Si una muestra cuyo tamao es el mnimo necesario para satisfacer los requisitos proporciona los resultados P-valor muestral? Debe aceptarse la hiptesis nula? cul es el

124

Contrastes de hiptesis

Solucin a) Si denotamos la resistencia media de los fusibles por fJ., las hiptesis del contraste son H0:ju = 5 y //,:// ^ 5. Como se supone que la resistencia sigue una distribucin normal y la desviacin tpica es desconocida, el contraste se debe realizar mediante un test t bilateral. Los requisitos establecidos exigen que la probabilidad del error de tipo I sea igual a 0.01 y que la potencia del contraste cuando u = 5 + 0.02 sea al menos 0.80. Si denotamos por C la regin crtica, los requisitos son P(Ci = 5) = 0.01 y P(C / \ju -5 = 0.02) > 0.8. Para saber si una m.a.s. de tamao 10 satisface los requisitos usaremos el haz de curvas OC para el contraste t bilateral con nivel de significacin del 1% (figura 4.6). Para que la muestra cumpla los requisitos es necesario que para d =J = , la probabilidad del error de

tipo II sea no superior al 20%. El valor aproximado de d se obtiene estimando cr mediante la desviacin tpica muestral S = 0.0206 , de modo que d = : = 1. Se

observa en la figura 4.6 que para d = 1 la probabilidad del error de tipo II es aproximadamente del 50% cuando n es 10 y aproximadamente del 20% cuando n es 15. Por tanto la muestra obtenida no cumple los requisitos establecidos y faltan al menos 15-10 = 5 observaciones adicionales. b) Suponiendo = 15, la desviacin tpica muestral es 0.0249 y el valor del estadstico de prueba es Entonces P-valor= 2 P(t} >0.6113)e (0.5,0.6). Como el P-valor es mayor que el nivel de significacin =0.01, se acepta la hiptesis nula de que la resistencia media es igual a 5 ohmios. 14. Se sospecha que la fbrica A produce ms artculos diarios, en promedio, que la fbrica B. Las desviaciones tpicas de sus producciones diarias son conocidas e iguales a a^ =10 y (75 =12. Se supone que las producciones diarias de las dos fbricas son independientes y se distribuyen normalmente. Para realizar el contraste se elige el nivel de significacin 0.01 y si JUAJUB =16 el procedimiento debe detectar esa diferencia con probabilidad 0.8. a) Plantear el contraste y determinar, analtica y grficamente, el nmero de observaciones necesarias. b) Calcular el P-valor asociado a los resultados XA =1433.42, SA =9.37, XB = 1426.80 y SB = 12.02 , obtenidos a partir de dos muestras con los tamaos encontrados en a). c) Determinar analticamente la potencia del contraste si JUA= 1338.7 y 05=1327.0.

Ejercicios

125

Solucin a) Las desviaciones tpicas son crA=10 y (7fi=12. El nivel de significacin del contraste es a=0.01 y se quiere que /'(detectar nA>nB/fj.A-fiB= 16) = 0.8. Se desea comprobar si la diferencia en las medias mustrales es significativa para concluir que la sospecha es cierta, o sea, para concluir fJLA > JLIB . Entonces se debe contrastar la hiptesis nula HQ:JUA = JUB contra la alternativa Como las producciones diarias de las dos fbricas son independientes y tienen distribuciones normales con desviaciones tpicas conocidas, se trata de un contraste para la diferencia de medias poblacionales con varianzas conocidas. El estadstico de prueba es Z0 Se rec azar la hiptesis nula si el estadsti-

co de prueba Z0 pertenece a la regin crtica C = {Z0 >z 0 oi =2.33}. Se desea detectar H} cuando JUA-UB=16 con probabilidad 0.8, luego la probabilidad del error de tipo II debe ser j3=0.2 para jUA-juB=l6. El tamao comn de las muestras viene dado por

Tambin podemos calcular el tamao muestral haciendo uso del haz de curvas OC para los contrastes unilaterales basados en la normal con a=0.01. La abscisa es y la ordenada es /3=0.2. Observamos que por el punto (1, 0.2) pasa la curva OC correspondiente a = 10. Por tanto, el nmero de observaciones necesarias para efectuar el contraste es nA = nB = 10. b) El valor muestral del estadstico de prueba es Como valores grandes del estadstico de prueba hacen dudar de HQ , el P-valor muestral es P(Z > 1.34) = 0.09 . Como el P-valor es mayor que el nivel de significacin del contraste a=0.01, se debe aceptar que las producciones medias de las dos fbricas son iguales. c) Por definicin, la potencia del contraste cuando es la probabilidad de rechazar la hiptesis nula cuando es decir, P(Z Como bajo la hiptesis alternativa el estadstico de prueba Z0 sigue una distribucin la potencia es

126

Contrastes de hiptesis

15. Un adivino afirma que en el 90% de los casos predice con xito el sexo de los nios antes del nacimiento. Se desea contrastar la veracidad de su afirmacin mediante muestras de tamao 15. a) Establecer las hiptesis del contraste. Cul debe ser la forma de la regin crtica? Por qu? b) Obtener la regin crtica para un nivel de significacin del 6%. Cul es el tamao del contraste? c) Para la regin crtica encontrada en b) determinar la probabilidad del error de tipo II. d) Si suponemos que los resultados mustrales han sido E, A, A, E, E, A, A, E, A, A, A, E, A, E y A, donde A denota "acierto" y E "error", cul es el P-valor asociado a la muestra anterior? Cul es la conclusin respecto a la afirmacin del adivino? Solucin a) Se trata de efectuar un contraste relativo a p, proporcin poblacional de aciertos. Como hiptesis nula se considera que el adivino acierta por azar, H0\p = l/2, y como hiptesis alternativa que el adivino acierta con probabilidad 0.9, H\:p = 0.9. Si denotamos por X el nmero de aciertos del adivino en 15 pruebas, entonces la regla de decisin debe rechazar HQ cuando X sea mayor que un determinado valor, es decir, rechazar //0 cuando el nmero de aciertos sea lo suficientemente grande. En consecuencia la regin crtica C ser de la forma b) Si a=0.06, la regin crtica se determina eligiendo el mnimo k tal que P(X > k I p = 0.5) < 0.06 .Si p = 05, entonces X ~ 5(15,0.5). Utilizando unas tablas de probabilidades binomiales se obtiene que P(X > 11 / p = 0.5) = 0.059 < 0.06 y P(X > IQ/p = 0.5) = 0.151 > 0.06. Por tanto, el mnimo k tal que C tiene nivel de significacin del 6% es 11. El tamao de la regin crtica C = { X > 11} es 0.059. c) La probabilidad del error de tipo II es la probabilidad de aceptar la hiptesis nula cuando la hiptesis alternativa es verdadera. En nuestro caso, esta probabilidad esj8 = l - j P ( J f > l l / / ? = 0.9). Usando que la distribucin de X cuando p = 0.9 es 5(15,0.9), obtenemos que j3 = 1-0.9873 = 0.0127 . d) El nmero de xitos en la muestra ha sido 9, es decir, X - 9 . Por tanto, el P-valor muestral es P( X > 9 / p = 0.5) = 1 - 0.6964 = 0.3036. El P-valor es mayor que los niveles de significacin usuales 0.05 y 0.01. En consecuencia, no existe suficiente evidencia para rechazar H0 , de modo que se debe aceptar H0 : el adivino acierta por azar. 16. El nmero de vehculos X que llegan al peaje de una autopista en un minuto sigue una distribucin de Poisson con parmetro A . Se sabe que bajo condiciones normales de trfico A es 0.5. La empresa responsable del peaje sospecha que
C = {X>k}.

Ejercicios

127

durante los meses de verano A es 2. Para decidir si la sospecha es verdadera se toma durante los meses de verano una m.a.s. de cinco intervalos de minuto obtenindose los siguientes valores de X : 1, 2, O, 2, 3. Suponiendo que la empresa asume un riesgo mximo del 5% de concluir que . es 2 cuando realmente es 0.5: a) Establecer el contraste de hiptesis, determinar la regin crtica y calcular su tamao. b) Calcular la potencia del contraste. c) Para la muestra observada, calcular el P-valor. Cul es la conclusin? Solucin a) Sea X el nmero de vehculos que llegan al peaje de una autopista en un minuto. Se cumple que X~3P(A). Se trata de contrastar la hiptesis nula H0:A = 0.5 contra la hiptesis alternativa H\.X = 2. Para una muestra de 5 intervalos de minuto, X denota el nmero de vehculos que llegan al peaje en el minuto /-simo. Sea X . Como la hiptesis alternativa favorece valores grandes de T, la regin crtica debe ser de la forma C = \T > k] . Bajo la hiptesis nula, la distribucin de T es 3^(5-0.5). Como la empresa desea tener un riesgo de tipo I de tamao no superior al 5%, el valor de k debe verificar que P(C I //0) < 0.05 , o de forma equivalente que P(T < k -1///0) > 0.95 . Consultando en las tablas de la distribucin de Poisson, obtenemos que k -1 > 5 y, por tanto, la empresa debe elegir k - 6 porque de esa manera minimiza la probabilidad del error de tipo II sujeto a la restriccin de que la probabilidad del error de tipo I no supere el 5%. Entonces la regin crtica es C = {T>6] y el tamao de C es X ( r > 6 / / / 0 ) = 0.042. b) La potencia del contraste es la probabilidad de rechazar H0 cuando //, es verdadera. Bajo // , la variable T sigue una distribucin de Poisson de parmetro X = 10 y P(T > 6) = 0.933. Por tanto, la potencia del contraste es 0.933. c) En la muestra T = 8 y el P-valor muestral es P(T>8/H0) = 0.0042. Puesto que el P-valor muestral es menor del 5%, se debe rechazar H0 . 17. Un mayorista frutero desea comprar una partida muy grande de melones si el 70% o ms de los melones pesan ms de tres kilos. Desea tener una probabilidad a lo sumo de 0.05 de equivocarse si rechaza la partida cuando realmente verifica la condicin requerida. Despus de pesar una muestra de 100 melones extrados al azar de la partida, encuentra que 60 pesan ms de 3 kg. a) Formular la hiptesis nula y la hiptesis alternativa. Especificar la regin crtica. Calcular el P-valor. Qu decisin tomar el mayorista? b) Calcular la probabilidad de aceptar la partida cuando la proporcin de melones que pesan ms de tres kilos es del 50%. c) Si el mayorista quiere rechazar la partida cuando tiene un 60% de melones que pesan ms de tres kilos con una probabilidad 0.90, determinar analticamente el tamao de muestra necesario.

128

Contrastes de hiptesis

Solucin a) Sea p la probabilidad de que un meln pese ms de tres kilos. El mayorista desea comprar la partida si p > 0.7 , de modo que el contraste a realizar considera la hiptesis nula HQ:p> 0.7 contra la hiptesis alternativa //,:/?< 0.7 . Como n = 100 es un tamao muestral grande, se puede realizar un contraste asinttico para la proporcin poblacional basado en el estadstico de prueba Z donde p es la proporcin muestral y pQ = 0.7 . La hiptesis nula debe rechazarse si la proporcin muestral de melones con peso mayor de 3 kilos es pequea, o de forma equivalente cuando el valor del estadstico de prueba Z0 es menor que una constante k. Como el comportamiento bajo HQ del estadstico de prueba Z0 es aproximadamente normal, la regin crtica de nivel de significacin a aproximadamente igual a 0.05 Como la proporcin muestral es p = 0.60, el valor muestral del estadstico de prueba es Zn = . ' ' =-2.182 y el

P-valor muestral es P(Z < -2.18) = 0.0146. Como el P-valor es menor que a=0.05, el mayorista frutero rechazar H0 , es decir, no comprar la partida. b) La probabilidad de aceptar la partida cuando la proporcin de melones que pesan ms de tres kilos es del 50% es igual a

c) La probabilidad de rechazar la partida cuando p = 0.6 es igual a

Si el mayorista desea que esta probabilidad sea igual a 0.90, el tamao muestral n ha de cumplir z n i n = 1-28 = , , de donde operando obtene-

mos 1.28V0.6 0.4 = -1.645-N/0/7-03+0.lV y, en consecuencia, el tamao muestral debe ser n =

Ejercicios

\ 29

18. Un proceso productivo genera componentes electrnicos cuya vida media es 50. En el departamento de investigacin se ha descubierto un nuevo mtodo que parece alargar la vida media de los componentes. El departamento de produccin decide contrastar el nuevo mtodo, para lo cual toma una muestra de 10 componentes fabricados por el nuevo mtodo, obteniendo las siguientes vidas: 57, 69, 106, 121, 201, 51, 77, 87, 12, 230. Suponiendo que la vida de los componentes fabricados por el nuevo mtodo sigue una distribucin exponencial y teniendo en cuenta que el doble de la suma de n exponenciales independientes de media uno sigue una distribucin X con 2n grados de libertad: a) Establecer las hiptesis nula y alternativa. Determinar la regin crtica de tamao 0.05. b) Para los resultados mustrales obtenidos es efectivo el nuevo mtodo? Calcular el P-valor. c) Si el nuevo mtodo consigue que la vida media de los componentes sea 100, cul es la potencia del contraste? Solucin a) Sea X la vida de un componente electrnico producido por el nuevo mtodo y ju la media de X. Suponemos que X ~ Exp(\'//). Para contrastar el nuevo mtodo consideramos como hiptesis nula HQ: // < 50 y como hiptesis alternativa //,://> 50. Sabemos que el estimador maximoverosmil de u es X. Como valores grandes de X apoyan H\, la regin crtica debe ser de la forma C = \ X > k \. Para que el tamao de la regin crtica sea igual al 5%, k debe cumplir que P(CI 7/0) < 0.05.

Como P(C///
lor de k es k 2.5-^0.05-20 =78.525 y la regin crtica es C = | X > 78.525j . b) La media muestral es ^=101.1. Como 101.1 pertenece a C, se acepta H } , es decir, concluimos que el nuevo mtodo es efectivo. El P-valor muestral es y cumple la acotacin 0.001 < P-valor < 0.01. c) Si // es 100, la potencia del contraste (probabilidad de rechazar 7/0) es

Usando unas tablas de la distribucin Ji-cuadrado se comprueba que 0.70 < n < 0.80. 19. Los siguientes datos son notas de un examen final de un curso de Estadstica impartido por el mismo profesor durante un periodo de tres aos. Ao 1: 4.9, 3.1,4.1, 2.6, 5.2, 3.9, 4.6, 4.0, 3.7, 5.8,4.3, 3.4, 5.4, 2.8,4.8,4.0, 2.2, 3.2, 3.5, 4.5

130

Contrastes de hiptesis

Ao 2: 5.4, 4.8, 3.6, 5.3,4.5, 3.1, 4.9, 4.2, 4.6, 4.4, 4.1, 5.1, 6.3,4.5, 5.9, 3.9, 5.0, 3.3, 4.7, 4.3, 5.7, 2.7, 3.7, 4.0, 4.6 Ao 3: 5.9, 5.1, 5.8,4.5, 5.3, 4.1, 5.0, 4.4, 3.8, 5.6, 6.8, 4.7, 6.4, 3.2, 5.5, 5.0,4.2, 6.2, 3.6, 4.9 Se supone que las notas de los tres aos siguen distribuciones normales con varianzas iguales. a) Contrastar, al 5% de significacin, la igualdad de notas medias en los tres aos. b) Aplicar, si procede, la etapa de agrupacin de medias del procedimiento FSD. Solucin a) Sean //,, // 2 Y ^3 las ntas medias de los aos 1, 2 y 3 respectivamente. Queremos contrastar H0:il = U2 = //3 contra H}:no H0. Los estadsticos resumen de los datos multiplicados por 10 se muestran en la siguiente tabla:
Ao 1 Ao 2 Ao 3

40

45.04 8.6626

50

s
La tabla ANO VA es Fuente Entre Dentro Total

9.6245

9.6245

Suma de cuadrados 1000.02 5320.96 6320.98

Grados de libertad
2

Cuadrado medio 500.012 85.8219

Razn F

P-valor 0.0048

5.83

62 64

Como el P-valor muestral es 0.0048 < 0.05, rechazamos la hiptesis nula de igualdad de medias al 5% de significacin, concluyendo que las medias (poblacionales) de las notas del examen son diferentes. El diagrama esquemtico aparece en la figura 19.1.

Figura 19.1.

Ejercicios

131

b) Puesto que se rechaza la hiptesis nula al 5% de significacin, procede aplicar la segunda etapa del procedimiento FSD. De la tabla ANOVA encontramos que la estimacin de la desviacin tpica combinada es S = V MSW = V85.822 = 9.230 y los grados de libertad "dentro" son 62. El valor crtico bilateral 5% es /o 025-02 = 1-98. Los dos tamaos de muestra ms grandes son 20 y 25. Por tanto, LSDmn =1.98-9.23-J 1 =5.483. Como los dos tamaos de muestra ms pe-

queos son 20 y 20, tenemos que LSD Es fcil comprobar que las diferencias entre las medias mustrales son Como las diferencias para los aos 1 y 2 y los aos 2 y 3 son ambas menores que LSDm-n, la media del ao 1 y la del ao 2 pertenecen al mismo grupo as como las de los aos 2 y 3. Por otra parte, la diferencia para los aos 1 y 3 excede LSDmax, de modo que la media del ao 1 y la del ao 3 pertenecen a distinto grupo. Se da, por tanto, la siguiente agrupacin curiosa: { ao 1, ao2 } < { ao2, ao3 }. Este resultado se interpreta diciendo que existe evidencia insuficiente en las muestras para detectar una diferencia sobre un periodo de un ao, pero la diferencia sobre el periodo de dos aos es significativa. Por tanto, se detecta una posible mejora en la enseanza del profesor sobre el periodo de los tres aos de estudio pero no sobre un periodo ms corto de tiempo. Las agrupaciones solapadas como la de este ejercicio son obviamente no deseadas porque dificultan la interpretacin, pero a veces son inevitables. 20. Un agricultor quiere probar cuatro fertilizantes en su campo de tomates. Selecciona parcelas del mismo tamao con suelo, drenaje y exposicin al sol similares. Prueba los fertilizantes A, B, C y D sobre 6, 8, 9 y 7 parcelas respectivamente obteniendo los siguientes rendimientos: Fertilizante A B C D Rendimiento 47, 42, 43, 46, 44, 42 51,58,62,49,53,51,50,59 37,39,41,38,39,37,42,36,40 42, 43, 42, 45, 47, 50, 48

Se supone que los rendimientos de los cuatro fertilizantes siguen distribuciones normales con varianzas iguales. a) Existe diferencia significativa en los rendimientos medios? b) Aplicar, si procede, la etapa de agrupacin de medias del procedimiento FSD. Solucin a) Sean hiptesis nula

los rendimientos medios. Deseamos contrastar la contra la hiptesis alternativa de que no

132

Contrastes de hiptesis

todas las medias son iguales. Observamos que k = 4, nA = 6, nB = 8 , nc = 9 nD =1 y = 30. Los estadsticos resumen aparecen en la siguiente tabla: Fertilizante

/ 1 2 3 4

"/
6 8 9 7

X,

s}
4.400 23.554 3.944 9.905

A B C D

44.000 54.125 38.778 45.286

Es fcil comprobar que la suma de cuadrados "entre" y la suma de cuadrados "dentro" son, respectivamente, y

La tabla ANO VA es Fuente Entre Dentro Total Suma de cuadrados 1015.51 277.859 1293.37 Grados de libertad
3 26 29

Cuadrado medio 338.503 10.6869

Razn F

P-valor
=0

31.67

Como la regin crtica del contraste es C = F0 / FQ > ^005-3 20} y F005.3 26 = 2.89 , rechazamos HQ al 5% de significacin y concluimos que no todos los fertilizantes tienen el mismo rendimiento medio. El diagrama esquemtico aparece en la figura 20.1.

Figura 20.1.

Ejercicios

133

b) Puesto que se rechaza la hiptesis nula al 5% de significacin, procede aplicar la segunda etapa del procedimiento FSD. Las cantidades mxima y mnima de la diferencia significativa mnima son, respectivamente:

Es fcil comprobar que las diferencias entre las medias mustrales son:

Luego los grupos son

This page intentionally left blank

CAPITULO 5 MTODOS ROBUSTOS Y NO PARAMTRICOS

1. INTRODUCCIN Existen dos criterios para juzgar o evaluar los procedimientos estadsticos inferenciales (tales como los intervalos de confianza y los contrastes de hiptesis): el criterio de validez y el criterio de sensibilidad. Para un intervalo de confianza, el requisito de validez exige que el intervalo de confianza contenga al parmetro de inters con una probabilidad al menos 1 - a. Sin embargo, en la prctica, este requisito puede no cumplirse cuando la distribucin de probabilidad de las observaciones es desconocida. Por ejemplo, los intervalos de confianza bajo normalidad pueden dejar de ser vlidos si la distribucin de las observaciones no es normal. La sensibilidad de un intervalo de confianza se refiere a la precisin; y una medida de la precisin, como ya sabemos, es la amplitud del intervalo: cuanto menor es la amplitud del intervalo, mayor es su precisin. Para un contraste de hiptesis sabemos que la probabilidad del error de tipo I no debe superar el nivel de significacin a prefijado. Este es un requisito de validez para todo contraste de hiptesis. En la prctica, si la distribucin de la poblacin no es normal, los contrastes clsicos (que suponen normalidad) pueden tener probabilidad del error de tipo I mayor que a. En estos casos decimos que dichos contrastes no son vlidos. La sensibilidad de un contraste de hiptesis se mide mediante la potencia del test (o tambin la probabilidad del error de tipo II, que es uno menos la potencia). Gran sensibilidad del test es equivalente a gran potencia, es decir, gran probabilidad de rechazar HQ cuando HQ es falsa, o lo que es lo mismo, gran capacidad del test para distinguir el verdadero valor del parmetro especificado por //, del especificado por H0 . Los mtodos clsicos de inferencia (vistos en captulos anteriores) suponen normalidad e igualdad de las varianzas. Cuando se aplican a problemas reales pueden aparecer algunas dificultades (datos atpicos, diferencias en las dispersiones,...). Cuando estos problemas se detectaron en el pasado, la primera respuesta fue crear

136

Mtodos robustos y no paramtricos

una coleccin nueva de mtodos aparentemente distintos llamados mtodos no paramtricos. A pesar de su atractivo terico, los mtodos no paramtricos carecen con frecuencia de la unidad de concepcin propia de los mtodos clsicos. Adems, el problema contemplado por los mtodos no paramtricos (la falta de validez) no es el problema principal de los mtodos clsicos. Tukey en 1960 observ que cuando existen valores atpicos en los datos (situacin muy frecuente en la prctica) los procedimientos clsicos tienen poca sensibilidad. Esta observacin favoreci el desarrollo de unos procedimientos estadsticos nuevos llamados mtodos robustos. Informalmente, un mtodo estadstico es robusto cuando sus propiedades de sensibilidad y validez cambian poco si la distribucin de las observaciones se desva poco de la supuesta en la construccin del mtodo (usualmente la distribucin normal). Una caracterstica atractiva de los mtodos robustos que presentaremos aqu es que se obtienen modificando los mtodos tradicionales de una manera intuitiva. Adems, estas modificaciones estn basadas en estimadores de clculo fcil. Por ejemplo, la media recortada es simplemente una media ordinaria con algunas de las observaciones (entre ellas las observaciones atpicas) eliminadas. Por otra parte, los mtodos basados en la transformacin potencia o en la transformacin rango consisten en transformar los valores mustrales y despus aplicar el procedimiento clsico a los valores transformados. Ejemplo 1.1. Ilustracin de la baja sensibilidad de un procedimiento clsico Una muestra de rentas familiares de un barrio ofreci los siguientes resultados: Renta anual (en millones de ptas.) Familia
5 1 4 2 2 3 8 4 6 5 4 6 2 7 5 8

40
9

17 10

11

12

En la figura 1.1 se presenta el grfico caja para esta muestra.

Figura 1.1.

137

Para un nivel de confianza del 95%, el intervalo de confianza clsico para u es 1.04 < JL < 14.96 y en la siguiente seccin veremos que el intervalo basado en la media recortada es 2.18 < // r < 7.06. Recordemos que para los intervalos de confianza buena sensibilidad significa intervalos estrechos. En este ejemplo el intervalo de confianza basado en la media muestral es mucho menos sensible que el intervalo basado en la media recortada. Como el atpico mayor es ms atpico de lo que ordinariamente encontramos en la prctica, este ejemplo es algo extremo, pero el mismo fenmeno ocurre, en menor grado, en varios problemas prcticos y con frecuencia pasa desapercibido y, por tanto, no se corrige. En este caso, puede que los anlisis efectuados resulten intiles. En las secciones restantes estudiaremos las siguientes familias de mtodos robustos: Mtodos basados en la media recortada Mtodos basados en las transformaciones potencia Mtodos basados en la transformacin rango. 2. MTODOS BASADOS EN LA MEDIA RECORTADA En este apartado presentamos contrastes de hiptesis para los problemas de una, dos y k muestras, e intervalos de confianza para la media recortada y la diferencia de medias recortadas. El mtodo de las medias recortadas consigue corregir los problemas causados por los atpicos, pero no es til por s mismo para tratar las diferencias en dispersin. Para mitigar el impacto de la desigualdad de dispersiones puede usarse la llamada correccin de Satterthwaite despus de un anlisis de medias recortadas o bien desde un principio si las muestras son razonablemente normales. 2.1. Intervalos de confianza y contrastes para una muestra Ilustraremos el clculo de intervalos de confianza para la media recortada utilizando los datos de renta familiar del ejemplo 1.1. El grfico tallo y hojas es el siguiente: O* 10.2(1 3 4 4 0 . 1 5 5 6[8] 1* I 1 .17 HII40 Como se ha visto en el captulo de intervalos de confianza, los lmites del intervalo de confianza clsico para la media son . El intervalo de

confianza basado en la media recortada se calcula exactamente de la misma manera, pero reemplazando el tamao muestral, la media y la desviacin tpica por el tamao

138

Mtodos robustos v no paramtricos

de la muestra recortada, la media recortada y la desviacin tpica recortada, respectivamente. Adoptaremos el criterio de seleccionar la fraccin de recorte igual al menor mltiplo del 5% que elimina todos los datos atpicos identificados por el grfico caja. Esta estrategia determina una fraccin de recorte del 10% para los datos de la renta familiar. El nmero de observaciones que deben recortarse en cada cola es 0.10-12= 1.2 que redondeamos por exceso a 2. Las hojas correspondientes a las observaciones que se han de recortar estn subrayadas en el anterior grfico tallo y hojas. El tamao de la muestra recortada es el nmero de observaciones que quedan despus del recorte, nT = 8. La media recortada es la media aritmtica de las observaciones de la muestra recortada, de modo que XT = 4.625 . Sin embargo, la desviacin tpica recortada no es la desviacin tpica de la muestra recortada, sino que se calcula usando la desviacin tpica de la muestra winsorizada. La muestra winsorizada se obtiene reemplazando los valores subrayados en el grfico tallo y hojas (que son los valores que se eliminan en la muestra original para obtener la muestra recortada) por los nmeros que aparecen recuadrados, que son el mnimo y el mximo de la muestra recortada. As, O y 2 deben reemplazarse por 2 en la cola inferior, y 17 y 40 por 8 en la cola superior. Obsrvese que la muestra winsorizada es una muestra artificial que tiene el mismo tamao que la muestra original. La desviacin tpica de la muestra winsorizada es Sw = 2.34 y la desviacin tpica recortada es

Los datos resumen nT, XT y ST sustituyen a n, X y S en el clculo del intervalo de confianza. El punto crtico de la t recortada es taii;nT-\ > de modo que para un nivel de confianza del 95% es ta/2.n _ ='0 025-8-1 =2.365. Por tanto, los lmites del intervalo de confianza para la media recortada (al nivel de confianza del 95%) son

Concluimos con una confianza del 95% que la renta media del barrio est entre 2.18 y 7.06 millones de pts. Es fcil comprobar que los lmites del intervalo de confianza clsico para la media al 95% son L = 1.04 y U = 14.96. Es obvio que el intervalo basado en la media recortada es mucho ms til para estimar el centro de la distribucin de rentas que el intervalo de confianza clsico. Debe enfatizarse que los intervalos de confianza basados en la media muestral y en la media recortada son para dos parmetros de posicin central diferentes: la media poblacional y la media recortada poblacional, respectivamente. Cuando la distribucin poblacional es simtrica, estas medidas son iguales. Sin embargo, para distribuciones asimtricas pueden ser algo diferentes. No obstante, en distribuciones con colas largas, plantear intervalos de confianza para la media recortada viene

139
motivado por el hecho de que, en general, en estos casos la media recortada proporciona una medida de posicin central ms razonable que la media. Los contrastes de hiptesis basados en la media recortada se construyen como en el captulo anterior reemplazando el estadstico t clsico por el estadstico recortado . As, para el ejemplo anterior, un test bilateral de la hiptesis de que la renta media para el barrio es 11 millones de pesetas debe rechazar H cuando ce=0.05. El valor del estadstico recortado es . Como tr, > 2.365, al nivel de significacin del 5% debemos rechazar la hiptesis de que la renta media es 11 millones de pts. 2.2. Contrastes e intervalos de confianza para dos muestras Ejemplo 2.1. Para medir las diferencias en intensidad entre las tormentas de verano ocurridas de junio a octubre y las ocurridas durante el resto del ao, se apunt para 12 veranos y 14 no-veranos el porcentaje de lluvia cada durante los primeros 5 minutos de la tormenta en perodos seleccionados al azar entre 1920 y 1995, obtenindose los siguientes resultados: Verano: 18.2, 80.0, 8.6, 45.0, 28.6, 20.7, 50.0, 21.2, 60.7, 34.6, 40.7, 6.7. No-verano: 23.8, 10.5, 14.3, 40.0, 16.1, 11.1, 5.0, 3.4, 8.3, 66.7, 15.0, 11.8, 18.2, 26.3. Queremos, en primer lugar, contrastar la hiptesis nula de igualdad de porcentajes promedio de lluvia en verano y no-verano. Para ello, vamos a ignorar, en principio, los anlisis exploratorios y usaremos directamente los contrastes de hiptesis clsicos. El mtodo clsico para dos muestras necesita la siguiente informacin resumen: Verano No-verano

n X S

12
34.5833 21.8612

14
19.3214 16.5916

El valor del estadstico tQ es tQ = 2.02. Para 24 grados de libertad, el P-valor para el test bilateral de no diferencia en medias es P-valor = 2 P(t24 ^ 2.02). En las tablas de la distribucin t de Student observamos que 0.025 < P(t24 > 2.02) < 0.05 . Por tanto, el P-valor pertenece al intervalo (0.05,0.10) y el contraste clsico no detecta diferencia en las medias para cualquier nivel de significacin de los usados habitualmente. Este sera el punto final de cualquier estudio clsico. Vamos a ver que la conclusin de este anlisis es discutible, cuando no, falsa. Como veremos, el

140

Mtodos robustos y no paramtricos

fallo en la deteccin de una diferencia en las medias es el resultado de usar el test t estndar cuando la informacin muestral sugiere que se violan las hiptesis sobre las que est basado. Es un fallo del anlisis, no de los datos. Este problema puede evitarse efectuando un anlisis exploratorio antes del anlisis inferencial de los datos. En la figura 2.1 aparece el diagrama esquemtico de las muestras bajo consideracin. El atpico en la muestra de "no-verano" sugiere que el supuesto de normalidad no es razonable. Comparando las longitudes de las cajas (recorridos intercuartlicos), parece que el supuesto de dispersiones iguales de las dos poblaciones tambin es cuestionable. La estrategia usual para intentar detectar dispersiones poblacionales distintas consiste en efectuar un contraste de hiptesis para la igualdad de las desviaciones tpicas, antes de realizar un test para las medias. Por desgracia, las dispersiones distintas estn con frecuencia vinculadas con formas serias de no-normalidad tales como distribuciones de colas largas. En estos casos los tests clsicos para contrastar el cociente de varianzas (basados en la distribucin F de Fisher) quedan afectados incluso ms seriamente que los tests t.

Figura 2.1.

Es fcil comprobar que en nuestro ejemplo el test F para la igualdad de desviaciones tpicas acepta la igualdad para todo nivel a aceptable (P-valor > 0.1). Esta conclusin se contradice con la que se deduce del diagrama esquemtico y esto se debe casi totalmente al atpico de la muestra de "no-verano". La siguiente etapa en un anlisis estndar de estos datos sera el uso del test t de dos muestras que conducira al resultado mostrado antes. Los contrastes de igualdad de dispersiones deben usarse con mucho cuidado por su capacidad potencial de generar conclusiones que inducen a error. En todo caso, el anlisis exploratorio basado en el diagrama esquemtico constituye una herramienta de diagnosis ms fiable. El test t de dos muestras basado en las medias recortadas se comporta mejor cuando las dispersiones, medidas por las longitudes de las cajas del diagrama esque-

141

mtico, no son muy diferentes. Suponiendo que ocurre as en nuestro ejemplo, ilustraremos a continuacin el procedimiento de contraste de igualdad de medias basado en las medias recortadas. Para abordar el problema de la desigualdad de dispersiones que se observa en las dos muestras, mejoraremos el procedimiento basado en las medias recortadas con la llamada correccin de Satterthwaite. Vamos a contrastar la hiptesis de que las intensidades medias de lluvia en los dos periodos del ao son iguales usando como medida de posicin central la media poblacional recortada con fraccin de recorte del 5%. Obsrvese que el 5% es la mnima fraccin de recorte (mltiplo del 5%) que elimina todos los atpicos indicados por el diagrama esquemtico. Los grficos tallo y hojas espalda con espalda para los valores mustrales multiplicados por 10 son los siguientes: Verano 86,67 No-verano

82 12,07 86 46 07 50 00 800. 607

0* 0. 1* 1. 2* 2. 3* 3. 4* 4. 5* HI

34 50,83 05, 11, 18,43 50, 61, 82 38 63 00

667

En la muestra de verano el tamao muestral es n = 12 y el nmero de observaciones recortadas en cada cola debe ser igual a 1 que es el resultado de redondear por exceso 0.05-12 = 0.6. Los valores a recortar estn subrayados en el grfico tallo y hojas. Para la muestra de no-verano, n ~ 14 y el nmero de valores recortados en cada cola es 0.05-14 = 0.7, que tambin redondearemos a 1. Los estadsticos resumen para las muestras recortadas son los siguientes: Verano
nT XT ST

No-verano
12

10

32.83
20.41

16.7 12.32

142

Mtodos robustos y no paramtricos

La expresin para la desviacin tpica (recortada) combinada es anloga a la del test t estndar de dos muestras, pero utiliza los estadsticos resumen recortados:

El valor del estadstico t de dos muestras es t Para 20 grados de libertad, el P-valor bilateral es P(\t2o - 2.29) y satisface las desigualdades 0.02 < P-valor < 0.05 . En consecuencia, la hiptesis de no diferencia en las intensidades medias de las tormentas debe rechazarse al 5% de significacin, y debemos concluir que la intensidad media es mayor en verano que en no-verano. Para cuantificar la diferencia en las medias poblacionales podemos construir un intervalo de confianza para la diferencia de medias recortadas. La expresin del intervalo de confianza para la diferencia de medias puede aplicarse a los estadsticos resumen recortados para obtener un intervalo al 95% de confianza para la diferencia en las medias recortadas con fraccin de recorte del 5%. La expresin del intervalo clsico es

Usando los estadsticos recortados obtenemos

donde O es la diferencia entre la media recortada poblacional de verano y la media recortada poblacional de no-verano. 2.3. Correccin de Satterthwaite para dispersiones desiguales Cuando las dispersiones de las dos poblaciones no son iguales es importante modificar el test t estndar porque en estos casos puede quedar afectada la sensibilidad del test y tambin puede resultar afectada su validez. Este efecto aumenta cuando los tamaos mustrales son diferentes. Cuando el diagrama esquemtico sugiere normalidad razonable pero dispersiones diferentes, puede aplicarse el mtodo de este apartado para corregir el test t estndar y el intervalo de confianza estndar. Cuando el diagrama esquemtico indica la existencia de atpleos, la correccin puede aplicarse al test t recortado y al intervalo de confianza recortado. El procedimiento de correccin consiste en reemplazar la expresin de la desviacin tpica (combinada) de la diferencia de medias mustrales (en el denominador del estadstico t) por la versin no combinada , y reempla-

143
zar los grados de libertad por otra expresin. Definiendo esviacin tpica es entonces SE = ^g\ + g libertad es v =
2

y la expresin para los grados de

.Si v no es un nmero natural, se re-

dondea al entero ms prximo. En los contrastes de hiptesis se utiliza el estadstico de v prueba tn = ' . Los intervalos de confianza se calculan usando los

lmites corregidos, obtenindose Vamos a aplicar la correccin de Satterthwaite a los estadsticos recortados del ejemplo 2.1 ya que el diagrama esquemtico sugera desigualdad de dispersiones y, adems, las desviaciones tpicas recortadas son bastante diferentes. Asignando el subndice 1 para denotar la muestra de verano y el subndice 2 para la de no-verano obtenemos rregida es La desviacin tpica coy los grados de libertad corregidos son valor que debe redondearse a 14. El estadstico f_ recortado y corregido es entonces t . Para 14 grados de liber-

tad, el P-valor bilateral de la hiptesis de igualdad de medias pertenece al intervalo (0.02,0.05). Por tanto, debemos rechazar la hiptesis de igualdad de medias al nivel de significacin del 5%, pero no al nivel del 1%. Esta conclusin coincide con la que se obtuvo despus de aplicar el test t recortado. Un intervalo al 95% de confianza para la diferencia de medias (recortadas al 5%) de intensidad de lluvia en verano respecto a no-verano tiene lmites (32.83-16.7) + 2.14 -7.37, donde 7.37 = SE y 2.14 = 0.o25;i4- Estos lmites son 0.36 y 31.9. As, con un 95% de confianza la intensidad media de las tormentas de verano excede a la de no-verano entre 0.36 y 31.9. 2.4. El problema de k muestras y el procedimiento FSD aplicado a medias recortadas El procedimiento FSD descrito en el captulo 4 se puede aplicar a los datos resumen de las muestras recortadas. El procedimiento resultante es una extensin inmediata del procedimiento de dos muestras que presenta un comportamiento excelente al preservar la validez y mejorar la sensibilidad cuando las distribuciones poblacionales tienen colas ms largas que las de una distribucin normal.

144

Mtodos robustos y no paramtricos

Ejemplo 2.2. Una empresa productora de pequeos electrodomsticos quera comparar los tiempos promedio de montaje de un cierto modelo de electrodomstico en cada una de sus tres factoras A, B y C. Para ello tom una muestra de tiempos de montaje (en minutos) en cada factora, obteniendo los siguientes datos: Factora A: 7.8, 7.9, 8.0, 8.1, 8.3, 8.4, 8.4, 8.5, 9.5. Factora B: 7.3, 7.9, 8, 8.1, 8.1, 8.2, 8.2, 8.6. Factora C: 7.4. 8.2, 8.4, 8.4, 8.5, 8.6, 8.6, 8.6, 8.8, 9.3. El anlisis de la varianza basado en los supuestos de normalidad e igualdad de dispersiones obtiene los siguientes resultados: Fuente Entre Dentro Total Suma de cuadrados 0.828444 5.05156 5.88 Grados de libertad 2 24 26 Cuadrado medio 0.414222 0.210481 Razn F 1.97 P-valor 0.1616

Por tanto, a un nivel de significacin del 5% el contraste clsico de k muestras no detecta diferencias entre los tiempos promedio de montaje. No obstante, en la prctica los supuestos de normalidad e igualdad de dispersiones deben explorarse usando la informacin muestral antes de efectuar el anlisis inferencial. La figura 2.2 muestra el diagrama esquemtico de los tiempos de montaje en las tres factoras.

Figura 2.2.

Como vemos, la informacin muestral sugiere que las distribuciones poblacionales no cumplen el supuesto de normalidad. El supuesto de igualdad de dispersiones de las distribuciones poblacionales tambin es discutible, aunque las diferencias en los recorridos intercuartlicos mustrales no son muy grandes. Para mitigar el problema de no normalidad, vamos a efectuar un anlisis de la varianza basado en los estadsticos recortados.

145

Para una fraccin de recorte del 5% los estadsticos recortados aparecen en la tabla siguiente:
A
nT XT ST

B 6

C 8

8.23
0.288

8.08 0.151

8.51
0.242

La tabla del anlisis de la varianza basada en los estadsticos recortados es la siguiente: Fuente Entre Dentro Total Suma de cuadrados 0.677 Grados de libertad
2

Cuadrado medio 0.338 0.057

Razn F

P-valor 0.0104

5.94

1.021 1.698

18 20

Por tanto, al nivel de significacin del 5% el anlisis de k muestras basado en las medias recortadas detecta diferencias entre los tiempos promedio de montaje. Entonces es pertinente realizar la segunda etapa del procedimiento FSD para agrupar las factoras. El mximo y el mnimo de la diferencia significativa mnima son, respectivamente,

Calculando las diferencias entre las medias recortadas mustrales, se obtiene la agrupacin {A, B}<{C). Como vemos, el mtodo basado en las medias recortadas ha detectado diferencias entre las medias, mientras que el mtodo clsico, falto de la suficiente sensibilidad, concluye que las tres medias son iguales. 2.5. Una aplicacin a diferencias apareadas El siguiente ejemplo ilustra la aplicacin de las medias recortadas a las diferencias apareadas.

146

Mtodos robustos y no paramtricos

Ejemplo 2.3. Se desea comprobar si las medias de los consumos domsticos de agua (en m3) durante los meses de Julio y Agosto son iguales. Se tom una muestra de 11 domicilios, resultando los siguientes datos de consumo: Domicilio
1 2 3 4 5 6 7 8 9 10 11

Julio

Agosto

Diferencia: (Julio-Agosto)

0.60 2.56 0.60 0.28 1.32 0.76 0.28 0.88 1.92 0.00 0.20

1.00 1.12 1.12 2.56 1.12 0.44 0.24 0.92 1.76 0.04 0.00

-0.40 1.44 -0.52 -2.28 0.20 0.32 0.04 -0.04 0.16 -0.04 0.20

Por la forma de obtener los valores mustrales, los consumos de agua en Julio y Agosto no se pueden suponer independientes pues corresponden al mismo domicilio. Contrastar la igualdad de medias de Julio y Agosto es equivalente a contrastar que la media de la diferencia de consumo entre Julio y Agosto es cero. El contraste clsico de la media de la diferencia supone normalidad de la variable diferencia y, por tanto, es conveniente explorar si este supuesto es vlido en este ejemplo. El grfico caja de las diferencias aparece en la figura 2.3.

Figura 2.3.

Los dos atpicos hacen conveniente un anlisis robusto. Para una fraccin de recorte del 5%, el intervalo al 95% de confianza para la media recortada poblacional

147

JUTD de la diferencia de consumo entre Julio y Agosto es -0.282 < UTD < 0.264. Este resultado se obtiene_utilizando los datos resumen nT = 9, DT =-0.0089 y ST = 0.355 en vez de n , D y SD en el intervalo de confianza estndar. Usando los datos resumen n = 11, D = -0.0836 y SD = 0.8853 obtenemos que el intervalo de confianza usual para la media de las diferencias UD (al 95% de confianza) es -0.68 < ID < 0.51. Ambos intervalos de confianza contienen el cero. En consecuencia, un valor de cero para la media y la media recortada de la poblacin de diferencias es consistente con los valores mustrales. As, en ambos casos concluimos que no existen diferencias entre los consumos medios de agua en los dos meses. Sin embargo se observa que el intervalo basado en la media recortada es ms preciso ya que tiene menor amplitud. 3. USO DE LAS TRANSFORMACIONES POTENCIA PARA HOMOGENEIZAR DISPERSIONES Cuando los datos de las k muestras son positivos y la dispersin aumenta conforme aumentan las medianas de las muestras, un mecanismo efectivo para homogeneizar las dispersiones consiste en reexpresar los datos mediante una transformacin potencia. La familia de transformaciones potencia est indexada por un parmetro real q. Dado q, el valor transformado de x es

Las transformaciones potencia son muy tiles por dos razones. En primer lugar porque son fciles de implementar mediante el ordenador o la calculadora manual. En segundo lugar porque una caracterstica observada con frecuencia en las distribuciones de datos positivos es que la variabilidad tiende a aumentar cuando el centro de la distribucin aumenta. Un atractivo adicional de las transformaciones potencia es que con frecuencia suavizan los atpicos. Las transformaciones potencia con ndice q < 1 (que son las que se usan cuando la dispersin aumenta con la mediana) disminuyen los valores grandes en mayor proporcin que el resto de valores, de modo que cuanto mayor es el valor, ms queda disminuido en comparacin con los otros. As, con frecuencia una transformacin potencia acerca los atpicos al centro. La ordenacin de los datos por magnitud no cambia en los datos transformados porque las transformaciones potencia son transformaciones montonas crecientes. Una caracterstica poco deseable de las transformaciones potencia es que dilatan la cola inferior de una distribucin, creando algunas veces atpicos cuando previamente no existan. Si esto ocurre, o quedan atpicos en la cola derecha de la distribucin, la transformacin puede seguirse de un anlisis de medias recortadas. Cuando la variabilidad se ha homogeneizado, la aplicacin del mtodo basado en las medias

148

Mtodos robustos y no paramtricos

recortadas funciona muy bien. Sin embargo, con frecuencia basta la transformacin potencia para alcanzar suficiente sensibilidad. Para seleccionar el ndice q de la transformacin potencia usaremos un mtodo de ajuste propuesto por Tukey. Este mtodo es fcil de aplicar cuando disponemos de las medianas y los recorridos intercuartlicos mustrales. Estas medidas resumen estarn disponibles porque se usan en el anlisis exploratorio que se ha de realizar antes del anlisis inferencial. El mtodo de Tukey consiste en elegir como ndice de la transformacin q = 1 - b, donde b es la pendiente de una recta que ajuste bien el diagrama de dispersin de los puntos de coordenadas (xj,yi) = (\n(M),ln(IQRi)]. Aqu M y IQRj denotan, respectivamente, la mediana y el recorrido intercuartlico de la muestra / . El mtodo ms conveniente para encontrar la pendiente de la recta es el mtodo de ajuste minimocuadrtico. La pendiente de la recta minimocuadrtica es Y est disponible en la mayora de programas de ordenador y calculadoras manuales. Una vez elegido el ndice de la transformacin potencia, cada valor muestral ser transformado mediante dicha transformacin y entonces aplicaremos un anlisis clsico de k muestras a los valores transformados. El siguiente ejemplo ilustra la aplicacin del mtodo de la transformacin potencia para contrastar la homogeneidad de las distribuciones. Ejemplo 3.1. Para cada ao, los valores del ndice de crecimiento de la produccin industrial de 6 pases se pueden considerar como una muestra de una variable estadstica. Durante el trienio 1992-94 se desea saber si el crecimiento medio anual es igual en los tres aos. Tras un anlisis estadstico se han obtenido los siguientes resultados:

1 18 2 39 3 4 1 5 6 7
8
9 10 11

19922 0 1

Grficos tallo y hojas


1993 3 0 1 2 29 3 4 0 5 2 6 6 7 1994 4 O 1 2 3 4 5
6

9 10 11 HI 14.1

8 8 9 2

7 16

10 11 7 HI 20.8

149

Estadsticos resumen
Ao

n
6 6 6

X
2.050 5.833 10.867

M
2.050 4.600 9.000

IQR

1992 1993 1994

1.397 1.800 4.347 3.700

5.124 4.100

Suponiendo que se cumplen los supuestos de normalidad e igualdad en las dispersiones, el test de la diferencia significativa mnima de Fisher (para cc=0.05) nos ofrece la siguiente tabla ANOVA: Fuente Entre Dentro Total Grados de libertad 2 15 17 Suma de cuadrados 234.763 235.522 470.285 Cuadrado medio 117.382 15.701 Razn F 7.476 P-valor 0.0056

La diferencia significativa mnima es

Las diferencias entre las medias mustrales cumplen X Por tanto, los grupos LSD son A la vista del diagrama esquemtico que se muestra en la figura 3.1 parece que son posibles tres grupos. Sin embargo, el anlisis estndar no ha sido capaz de separar las medias de 1992 y 1993. Se observa igualmente en el diagrama esquemtico que la variabilidad aumenta segn aumenta el centro de la distribucin, es decir, la longitud de las cajas aumenta con la mediana. Por tanto, es adecuado aplicar una transformacin potencia a los datos de este ejemplo.

Figura 3.1.

150

Mtodos robustos y no paramtricos

En la siguiente tabla recogemos la informacin necesaria para aplicar dicha transformacin potencia.

Ao

M
2.050 4 . 6 0 0 9.000

IQR
1.800
3.700

ln(M)
0.71784 1.5261 2.1972

ln(IQR) 0.58779 1.3083

1992 1993 1994

4.100

1.411

El ajuste minimocuadrtico de \n(IQR) sobre ln(M) conduce a una recta de pendiente b = 0.5677 . Entonces q -1 - b = 0.4323, de modo que q = 0.5. En consecuencia, la transformacin potencia ser T(x) = x'5 = -Jx . Aplicando a los datos la anterior transformacin, obtenemos los siguientes estadsticos resumen:

Ao

1992

1993

1994

w X

6
1.32517 0.593887

6
2.29843 0.812818

6
3.23371 0.701254

Al aplicar el procedimiento de la diferencia significativa mnima de Fisher a los datos transformados obtenemos la tabla ANO VA siguiente: Fuente Entre Dentro Total Grados de libertad
2

Suma de cuadrados 10.9289 7.52565 18.4546

Cuadrado medio 5.46447 0.50171

Razn F
10.89

P-valor 0.0012

15 17

La diferencia significativa mnima es:

Las diferencias entre las medias mustrales son X Por tanto, los

grupos

LSD

son

151

Como vemos, la transformacin potencia ha logrado separar el grupo {1992,1993} que el contraste clsico, falto de sensibilidad, no es capaz de separar. La figura 3.2 muestra el diagrama esquemtico para los datos transformados. Podemos observar que la transformacin potencia elegida consigue homogeneizar las dispersiones.

Figura 3.2.

En este ejemplo, el atpico de la cola derecha podra haberse tratado mediante un anlisis de medias recortadas en vez de un anlisis estndar. Otra alternativa es el anlisis de rangos, que estudiaremos en la siguiente seccin. 4. MTODOS BASADOS EN LA TRANSFORMACIN RANGO La transformacin rango es una transformacin que resuelve simultneamente varias formas de no-normalidad. Por esta propiedad, los mtodos, basados en la transformacin rango tienden a usarse como alternativas generales a los procedimientos clsicos. Aunque sta es una estrategia segura desde el punto de vista de la robustez de validez, no es siempre la ptima en trminos de sensibilidad. No obstante, los mtodos basados en la transformacin rango son los mtodos robustos ms fciles de encontrar implementados en los programas de ordenador. El enfoque que daremos a los mtodos basados en la transformacin rango consistir en aplicar los mtodos de contraste clsicos a los rangos de los datos. Se ha comprobado que cuando el test t de dos muestras se aplica a los rangos, se obtiene un test equivalente esencialmente al test no paramtrico de rango-suma de Wilcoxon para dos muestras. El anlisis de la varianza aplicado a los rangos proporciona una alternativa prxima al test de Kruskal-Wallis. Por ltimo, el test t de diferencias apareadas aplicado a los rangos no tiene contrapartida no paramtrica pero su comportamiento es al menos tan bueno como el test de rango con signo de Wilcoxon.

152

Mtodos robustos y no paramtricos

4.1. Rangos y un mtodo para calcularlos Se llama rango de un dato al nmero de orden (creciente) que ocupa en la muestra. Para aplicar la transformacin rango disponemos los datos en orden creciente y les asignamos los rangos 1, 2, 3, ... desde el mnimo hasta el mximo. Por ejemplo, si los valores mustrales originales son 45, 89, 44, 74 y 103, al nmero 44 se le asigna el rango 1, al 45 el rango 2, al 74 el rango 3, al 89 el rango 4 y al 103 el rango 5. El proceso de asignar rangos se efecta fcilmente sobre un grfico tallo y hojas. Dejando algo de espacio entre tallos, el rango de cada valor muestral se escribe en la parte superior derecha de su hoja (de la misma forma que se escribe un exponente de una potencia). Cuando una muestra contiene un valor repetido, a estas observaciones ligadas se les asigna la media de los rangos que recibiran si fueran diferentes. Por ejemplo, a los dos 44 del conjunto de datos 44, 89, 44, 89 y 89 se les asigna el rango (1 + 2) / 2 = 1.5 (abreviado por 1' en el siguiente grfico tallo y hojas), mientras que a los tres 89 se les asigna el rango (3+ 4 +5)73 = 4. Obsrvese que si el nmero de observaciones ligadas es impar, el rango asignado es el valor central de los rangos posibles, mientras que si el nmero de observaciones ligadas es par se les asigna la media de los dos rangos centrales.
4 5 6 7 8

4r4r

4 9 949

4.2. Una aplicacin de la transformacin rango para un problema de dos muestras Para efectuar un test t de dos muestras sobre los rangos, las observaciones originales se combinan en un solo grupo y se asignan los rangos a los datos combinados. Despus se separan los rangos en los mismos dos grupos que ocupaban los datos originales. Por ejemplo, si la observacin que recibe el rango 1 procede del grupo 2, entonces 1 ser asignado al grupo de rangos 2, etc. En consecuencia, se formarn dos nuevos grupos que contendrn los rangos de los datos que formaban los grupos originales. Un mtodo conveniente para calcular los rangos manualmente sin perder la pista de los grupos se presenta en el siguiente ejemplo que utiliza los datos del ejemplo 2.1. Ejemplo 4.1. Vamos a efectuar un test t de dos muestras sobre los rangos de los porcentajes de lluvia cada en los periodos de verano y no-verano. Los datos originales aparecen en el siguiente grfico tallo y hojas:

153

Verano 86,67 82 12,07 86 46


07 50 00 800,607 O* 0. 1* 1. 2* 2. 3* 3. 4* 4. 5* HI

No-verano
34 50, 83 05,11,18,43 50,61,82 38 63 00

667

La transformacin rango puede efectuarse directamente sobre este grfico tallo y hojas. Sin embargo, vamos a colocar las observaciones en la forma de un grfico tallo y hojas en paralelo para ilustrar un mtodo til en problemas de k muestras. Se coloca cada muestra en una columna y se asignan los rangos fila a fila. Cuando se completa el proceso, los rangos ya estn en el grupo (columna) apropiado y los estadsticos resumen de los rangos se pueden calcular directamente de los grficos tallo y hojas. Tallo
O* 0. 1* 1.

Verano

No-verano
34'

67 , 86 8212'

502, 834 056, II 7 , 188, 439 50', 61", 8212'


3816

2*
2. 3* 3.

0714,1215

8618 4619
0721 5022 OO23 60724, 80026

6317

4* 4. 5* HI

OO20

66725

154

Mtodos robustos y no paramtricos

Puede comprobarse que los estadsticos resumen de los rangos son (recurdese que 12'=12.5, etc.):

n
Verano No-verano
12 14

X
16.875 10.6071

S
7.29298 6.92315

El valor del estadstico t0 de dos muestras basado en los rangos es

donde S

El P-valor del contraste bilateral de la hiptesis de igualdad de las intensidades medias de las tormentas es P-valor = 2 P(t24 ^ 2.25). En las tablas de la t de Student encontramos que 0.01 < P(t24 > 2.25) < 0.025, de modo que 0.02 < P-valor < 0.05 . Por tanto, a un nivel de significacin del 5%, debe rechazarse la hiptesis de igualdad de las intensidades medias de las tormentas y concluimos que la intensidad media en verano es mayor que en no-verano. Si efectuamos un anlisis exploratorio de los datos originales resulta claro el motivo de usar un contraste robusto. El diagrama esquemtico de las muestras originales aparece en la figura 4.1 y el de los rangos en la figura 4.2. Despus de la transformacin rango vemos que el diagrama esquemtico de los rangos sugiere mayor normalidad y mayor igualdad de dispersiones que el diagrama esquemtico de los valores mustrales originales.

Figura 4.1.

155

Figura 4.2.

Como ya se ha analizado en el ejemplo 2.1, la aplicacin del test t de dos muestras a los datos originales conduce a la aceptacin de la hiptesis nula de igualdad de las intensidades promedio al nivel 0.05. Vemos pues que el contraste clsico concluye que la diferencia en las medias mustrales no es lo suficientemente grande para considerar que las distribuciones son diferentes. Sin embargo, las muestras presentan informacin suficiente para detectar la diferencia en las distribuciones, pero esta diferencia debe medirse con sumo cuidado. Esto es, debemos utilizar un procedimiento como el basado en la transformacin rango para que se cumplan las hiptesis subyacentes al test t. Las formas especficas de las hiptesis para rangos se han omitido por la siguiente razn. Hasta ahora, todas las hiptesis se referan a las medias poblacionales de los datos originales o, implcitamente, a las medias poblacionales de las variables transformadas. Sin embargo, esta convencin no puede aplicarse a los rangos. No existe ninguna variable definida para todos los elementos de la poblacin que al muestrear ofrezca los rangos observados en la muestra. El rango asignado a un elemento especfico depende de los tamaos mustrales y del valor original del elemento comparado con aquellos elementos mustrales que le acompaan. Por tanto, no existe una media poblacional de rangos. No obstante, como estamos acostumbrados a considerar los cambios de distribuciones en trminos de medias, conviene crear ficticiamente una media poblacional de rangos JUR para describir las hiptesis sobre rangos. De esta forma, la hiptesis de igualdad de las intensidades medias de las tormentas puede escribirse como HO:JURV = fJRNV. Esta convencin es til pero no debe incluirse en los informes. Puede concluirse que el resultado encontrado en el anlisis es vlido para el promedio de las poblaciones involucradas, sin especificar qu se entiende por promedio. Esta estrategia proporcionar una imagen intuitiva de la naturaleza de las diferencias de las distribuciones.

156

Mtodos robustos y no paratntricos

4.3. Un ejemplo de k muestras En el siguiente ejemplo aplicaremos el anlisis de rangos a los datos de tiempos de montaje del ejemplo 2.2. Ejemplo 4.2. La forma del grfico tallo y hojas para realizar la transformacin rango de los datos de tiempos de montaje es: Tallo
7* 7. 8* 8. 9* 9.

Factora A 8394'
O6 I 9 3'4 416' 416'

Factora B
3
1

Factora C
42
212 416' 416'
5,9' 622' 622' 622<
326

94' O6' I 9 I 9 212 212


622<

519'
5
27

gzs

Los estadsticos resumen para los rangos son: Factora


A B C

n 9
8

X
12.944 9.563 18.500

S
7.85988 6.41671 7.22649

10

Aplicando el procedimiento de la diferencia significativa mnima de Fisher a los rangos obtenemos en la primera etapa que la tabla del anlisis de la varianza es: Fuente Entre Dentro Total Grados de libertad
2

Suma de cuadrados 370.059 1252.44 1622.5

Cuadrado medio 185.03 52.185

Razn F

P-valor 0.0448

3.55

24 26

Como P-valor < 0.05, se rechaza HQ (al 5% de significacin). Procede entonces realizar la segunda fase del procedimiento FSD. La diferencia significativa mnima es

157

y sus valores mximo y mnimo son, respectivamente,

Las medias mustrales de rangos son de forma que Luego los grupos LSD son: Vemos que existe solapamiento entre grupos. El motivo puede ser que en este caso la transformacin rango no funciona demasiado bien ya que no logra normalizar las muestras (el diagrama esquemtico de los rangos, mostrado en la figura 4.3, indica que los grficos caja de los rangos siguen conteniendo atpicos). En este caso el mtodo basado en la transformacin rango es peor que el basado en la media recortada.

Figura 4.3. 4.4. Una aplicacin a diferencias apareadas Cuando en un problema de muestras apareadas el anlisis exploratorio de las diferencias detecta atpicos, puede aplicarse un procedimiento basado en los rangos para contrastar la igualdad de las distribuciones. Primero los datos apareados se combinan en un solo grupo y se les aplica la transformacin rango. Despus se forma un conjunto de rangos apareados reemplazando cada observacin de la configuracin apareada original por su rango. Por ltimo se efecta el anlisis de diferencias apareadas sobre los rangos apareados. Vamos a aplicar este mtodo a los datos de consumo de agua del ejemplo 2.3. Ejemplo 4.3. La transformacin rango de los datos del ejemplo 2.3, en unidades por 100, se efecta mediante la siguiente forma en paralelo del grfico tallo y hojas. Observe-

158

Mtodos robustos y no paramtricos

mos que este proceso destruye el apareamiento, por lo que antes de continuar se debe volver a establecer el apareamiento original. Tallo
O*

Julio
00'

Agosto

OO1', 043
245
448

Ot
Of Os 0. 1* t If _

204,286', 286'

609', 609', 76" 8812 3218


___

9213 OO14, 12'6, 1216, 1216

1.
2* 2t 2f

9220

56^'

5621'

En la tabla siguiente aparecen los rangos reapareados y sus diferencias para cada familia. Por ejemplo, los rangos para la familia 1, que tena un consumo en Julio de 0.60 y en Agosto de 1.00, son 9.5 y 14, respectivamente, y su diferencia D, es -4.5.

Familia 1 2 3 4 5 6 7 8 9 10 11

Julio Agosto 9 5 1 4 21.5 16 9 5 1 6 6 5 2 L 5 18 16 11 ~ 8 6^5 5 12 13 20 19 L5 3 4 1.5

Diferencias ()) ^45 5.5 ^5 -15.0 2 3.0 L5 ^LO 1.0 ^L5 2.5

159
Los datos resumen para las diferencias de rangos ( D ) son = 11, D = -1.182 y SD = 5.728. Por tanto, el valor del estadstico 0 de diferencias apareadas es . El P-valor bilateral para 11-1 = 10 grados de libertad es mayor del 50%. En consecuencia, concluimos como en el ejemplo 2.3 que no existe evidencia de una diferencia entre las medias de consumo de agua de los dos meses. 4.5. Un mtodo de diferencias apareadas basado en los rangos con signo Una forma ms tradicional de tratar los datos apareados es formar los rangos con signo de las diferencias. Un test t aplicado a los rangos signados es equivalente (aproximadamente) al test de rango con signo de Wilcoxon, que es un procedimiento no paramtrico clsico. Para formar los rangos signados partimos directamente de las diferencias mustrales originales D = X\-X2- Se calculan los rangos de los valores absolutos de estas diferencias. Despus se aplican a los rangos los signos de las diferencias originales. As, por ejemplo, si D = 125-13.4 = -0.9 y el valor absoluto 0.9 tiene rango 3 entre los valores absolutos de las diferencias mustrales, entonces la diferencia original se sustituye por -3 en la muestra de rangos signados. Finalmente se aplica a la muestra de rangos signados un test t estndar para contrastar H0:/j. - O. El mtodo se ilustra en el siguiente ejemplo. Ejemplo 4.4. Vamos a aplicar el mtodo del rango signado a los datos de consumo de agua del ejemplo 2.3. Las diferencias mustrales originales, sus valores absolutos y los rangos signados son: Diferencias mustrales -0.40 Valor absoluto de las diferencias 0.40 Rango del valor absoluto de las dif. 8 Rangos signados -8

1.44 -0.52 -2.28 0.20 0.32


004

1.44 0.52 2.28 0.20 0.32 0.04 0.04 0.16 0.04 0.20

10
9

10 -9
-11 5.5 7 2

11
5.5 7 2 2 4 2 5.5

-0.04 0.16 -0.04 0.20

-2
4

-2
5.5

160

Mtodos robustos y no paramtricos

Observemos que este mtodo y el mtodo del apartado anterior son diferentes. En el apartado anterior se formaron los rangos de los datos originales y el conjunto de datos analizado era el de las diferencias de los rangos. Aqu, primero se calculan las diferencias de los datos originales y despus se transforman las diferencias en "rangos signados". Comprese la ltima columna de la tabla anterior con la ltima columna de la tabla del ejemplo 4.3. Estos son los valores a los que se les aplica el test t en los dos mtodos. Los datos resumen de los rangos signados son = 11, ^=0.1818 y SR= 7.093. El valor del estadstico t es / . El P-valor para el

test bilateral con 11-1 = 10 grados de libertad es mayor del 50%. La conclusin es la misma que la obtenida en el ejemplo 4.3.

Ejercicios

161

EJERCICIOS

1. En dos hospitales de una misma provincia se est probando la eficacia de un nuevo frmaco que segn indica el fabricante baja la fiebre, en promedio, ms de un grado centgrado media hora despus de haber sido administrado a un paciente adulto. El medicamento ha de ser administrado cuando la temperatura es como mnimo de 38C. Los dos hospitales prueban el nuevo frmaco en sus pacientes adultos obteniendo los siguientes resultados: Hospital General Paciente
1 2 3 4 5 6 7 8

Cuando se administra el frmaco

Media hora despus

39.5 38.8 39.9 38.6 38.2 38.8 39.5 38.2


Hospital Comarcal

37.9 37.0 37.1 37.3 36.9 37.7 37.7 38.0

Paciente
1 2 3 4 5 6 7 8 9

Cuando se administra el frmaco

Media hora despus

38.4 38.7 38.6 38.5 38.3 38.4 38.9 39.2 38.6

37.0 37.2 36.9 36.9 37.0 37.2 38.0 37.1 37.2

a) Usando slo los datos del hospital general y suponiendo que la variable diferencia de temperatura es normal, contrastar si la afirmacin del fabricante es verdadera a un nivel de significacin del 5%. b) Analizar exploratoriamente si se cumplen los supuestos clsicos en los dos hospitales. Contrastar, utilizando procedimientos robustos adecuados, si el promedio de bajada de la temperatura es el mismo en ambos hospitales.

162

Mtodos robustos y no paramtricos

Solucin a) Las muestras del hospital general son muestras apareadas. Denotemos por D la variable (temperatura antes)-(temperatura despus). Se quiere contrastar //0://D < 1 contra H{\nD>\. La muestra de las diferencias es: Paciente
D. 1 1.6 2 1.8 3 2.8 4 1.3 5 1.3 6 1.1 7 1.8 8 0.2

Los estadsticos resumen son: D = 1.4875 y SD = 0.7376 . El estadstico de prueba es /0 = zarse HQ = 1.87. Para un nivel de significacin del 5%, debe recha-

si el estadstico de prueba pertenece a la regin crtica

Como el valor muestral del estadstico de prueba no pertenece a C, se acepta H0 . b) Usaremos el subndice 1 para el hospital general y el subndice 2 para el hospital comarcal. En consecuencia, D{ = (temperatura antes)-(temperatura despus) en el hospital general y D2 = (Temperatura antes)-(Temperatura despus) en el hospital comarcal. Se quiere contrastar HQ\/J.D =/J.D contra //:// , de forma equivalente, HQ:JUD -/Dj =0 contra Las muestras de las diferencias son: H. General: 0.2, 1.1, 1.3, 1.3, 1.6, 1.8, 1.8, 2.8. H. Comarcal: 0.9, 1.2, 1.3, 1.4, 1.4, 1.5, 1.6, 1.7, 2.1. El diagrama esquemtico para estas muestras aparece en la figura 1.1.

Figura 1.1.

La aparicin de atpicos con una frecuencia mayor de la que cabe esperar en distribuciones normales sugiere que las distribuciones poblacionales de las diferencias no son normales. Adems, la desigualdad de los recorridos intercuartlicos

Ejercicios

163

mustrales sugiere que las distribuciones poblacionales de las diferencias no tienen la misma dispersin. Parece adecuado aplicar un contraste basado en las medias recortadas con la correccin de Satterthwaite, o bien un contraste basado en la transformacin rango. Consideremos primero el contraste basado en las medias recortadas. Comprobamos que una fraccin de recorte del 5% es suficiente para eliminar los atpicos de las dos muestras. En efecto, para el hospital general el 5% de 8 es igual a 0.4, que redondeado por exceso es 1. Para el hospital comarcal el 5% de 9 es igual a 0.45, que redondeado por exceso es 1. Las muestras recortadas y las muestras winsorizadas para el hospital general y el hospital comarcal son las siguientes: Hospital General Muestra recortada Muestra winsorizada
1.1 1.1 1.1 1.3 1.3 1.3 1.3 1.6 1.6 1.8 1.8 1.8 1.8 1.8

Hospital Comarcal Muestra recortada Muestra winsorizada


1.2 1.2 1.2 1.3 1.3 1.4 1.4 1.4 1.4 1.5 1.5 1.6 1.6 1.7 1.7 1.7

Los estadsticos recortados de las dos muestras aparecen en la siguiente tabla: Hospital General Comarcal
XT

1.483 1.443

sw

ST

nT 6 7

0.3105

0.3674 0.2244

0.194

El estadstico de prueba (usando la correccin de Satterthwaite) es Suponiendo //o verdadera, /0 sigue aproximadamente una distribucin t de Student con

gra-

dos de libertad. Usando los estadsticos recortados obtenemos t El P-valor muestral es 2- P(t% > 0.232), que es mayor que los niveles de significacin habituales. Por tanto, se acepta //0 y concluimos que las medias de descenso de temperatura en los dos hospitales son iguales. Realicemos a continuacin el contraste basado en la transformacin rango. La siguiente tabla presenta la asignacin de rangos a los valores mustrales:

164

Mtodos robustos y no paramtrcos

H. general H. comarcal

0.21 0.92

l.l 3 1.24

1.36 1.36

1.36 1.48-5

1.611-5 1.48-5

1.8R5 1.814-5 2.817 1.510 1.6"-5 1.713 2.116

Los estadsticos resumen para las muestras de rangos son:

n
H. general H. comarcal El estadstico de 8 9 prueba es

~X_ 9.1875 8.83

S
5.9578 4.4088 con

Sustituyendo en estas frmulas los estadsticos resumen de los rangos obtenemos o

El P-valor muestral es 2 P(t\ * > 0.1417) que es muy grande. Luego de nuevo aceptamos HQ , es decir, concluimos que los dos hospitales registran el mismo descenso medio de temperatura. El diagrama esquemtico para rangos se muestra en la figura 1.2. Este grfico sugiere que no existen diferencias en los centros de las distribuciones de las diferencias, lo que est de acuerdo con la conclusin obtenida en el contraste basado en la transformacin rango.

Figura 1.2.

Obsrvese que la transformacin rango ha normalizado las muestras (no aparecen atpicos en los grficos caja) aunque las dispersiones son algo diferentes. 2. Se quiere comparar la resistencia a la oxidacin de 3 diferentes tipos de pintura industrial. Se aplic la pintura en 15 trozos de 10 cm2 y se anot en cada caso el

Ejercicios

165

tiempo hasta la oxidacin, en horas, obtenindose para los diferentes tipos de pintura los resultados siguientes: Tipo A: 484,841,484,676,900,961; Tipo B: 64,256,625,100,64; Tipo C: 576,1089,2116,784; La tabla ANOVA para estos datos es: Fuente Entre Dentro Total Suma de cuadrados 1910375.1 1846716.9 3757092.0 Grados de libertad 2 12 14 Cuadrado medio 955187.56 153893.07 Razn F 6.207 P-valor 0.0141 M = 758.5 M = 100.0 M = 936.5 /?/? = 416.0 IQR = 192.0 IQR = 922.5

Los grficos caja mltiples para los datos originales y para los datos transformados mediante rangos aparecen en las figuras 2.1 y 2.2, respectivamente.

Figura 2.1.

Figura 2.2.

166

Mtodos robustos y no paramtricos

Consideramos un nivel de significacin del 1%. a) Suponiendo vlidos los supuestos clsicos, se pueden considerar iguales las medias de tiempo en los distintos tipos de pinturas? A la luz de los grficos caja, qu supuestos clsicos parecen violarse? Es adecuado aplicar un mtodo basado en la transformacin rango? Proponer razonadamente un mtodo de contraste alternativo al de la transformacin rango. b) Aplicar el mtodo escogido en el apartado anterior y poner de manifiesto (con mtodos exploratorios) su validez. Realizar el procedimiento FSD. Solucin a) Las hiptesis del contraste son H():/LIA = UB = fj.c y //,:no H Q . En la tabla ANO VA se observa que P-valor > 0.01. En consecuencia, el contraste clsico no rechaza H() y, por tanto, considera iguales las medias poblacionales. El diagrama esquemtico de las observaciones originales sugiere que se incumplen los supuestos de normalidad e igualdad de dispersiones. Aunque es adecuado aplicar un mtodo basado en la transformacin rango, no lo aplicaremos ya que, como vemos en el diagrama esquemtico de los rangos, esta transformacin no consigue igualar las dispersiones ni tampoco normaliza las muestras (sigue existiendo un atpico despus de la transformacin rango). Puesto que se observa en las muestras originales un aumento de la dispersin con la mediana, parece ms adecuado el mtodo de la transformacin potencia. b) Los estadsticos resumen de los valores originales aparecen en la tabla siguiente: Tipo A B C M 758.5 100.0 936.5 IQR 416.0 192.0 922.5 ln(M) 6.631 4.605 6.842 \n(IQR) 6.031 5.257 6.827

La pendiente de la recta de regresin minimocuadrtica de In(IQR) sobre ln( M) es 6 = 0.57. Por tanto, el parmetro de la transformacin de potencia es q = 1 - b = 0.43 = 1 / 2 . En consecuencia, la transformacin potencia que usamos convierte los valores originales en sus races cuadradas. Los datos transformados son: A: 22, 29, 22, 26, 30, 31 B: 8, 16, 25, 10, 8 C: 24, 33, 46, 28 El procedimiento de la diferencia significativa mnima de Fisher aplicado a los datos transformados, en su primera etapa, ofrece la siguiente tabla ANO VA: Fuente Entre Dentro Total Suma de Cuadrados 910.45 565.283 1475.73 Grados de libertad 2 12 14 Cuadrado Medio 455.225 47.1069 Razn F 9.66 P-valor 0.0032

Ejercicios

\ 67

Como vemos, el P-valor es muy pequeo y conduce al rechazo de H0, lo que concuerda con el diagrama esquemtico de los valores transformados (Fig. 2.3). Como se rechaza H0 , procede realizar la segunda etapa del procedimiento FSD para agrupar las medias. Los valores mximo y mnimo de la diferencia significativa mnima son, respectivamente,

_ Las medias mustrales de los datos transformados son Jf = 32.75. Es fcil comprobar que la nica diferencia menor que LSDmin es Adems, LSDAE = LSDmm <XP-XB< LSDmw. Por tanto, los grupos LSD son

Figura 2.3.

3. En las cuatro panaderas que tiene un pueblo pequeo se quiere comprobar si cierta marca de pan integral se vende por igual. Para ello hemos tomado muestras del nmero diario de paquetes vendidos de dicha marca, obteniendo los siguientes resultados: Panadera A: 10, 10, 11, 12, 13, 13, 14, 18 Panadera B: 9, 11, 13, 13, 13, 15, 17 Panadera C: 8, 10, 12, 12, 12, 16, 18, 20, 20 Panadera D: 11, 11, 11, 12, 12, 12, 13, 13, 14, 14 Los estadsticos resumen de las muestras son los siguientes: Panaderas
A B C D

S
2.6 2.6 4.4 1.2

Q}

Q3

IQR
3.0 2.0 6.0 2.0

12.6 13.0 14.2 12.3

10.5 12.0 12.0 11.0

12.5 13.0 12.0 12.0

13.5 14.0 18.0 13.0

168

Mtodos robustos y no paramtcos

a) Admitiendo que se cumplen los supuestos clsicos, analizar, para un nivel de significacin del 5%, si se vende el mismo nmero medio de paquetes de pan integral en las cuatro panaderas. b) Resolver de nuevo el apartado a) utilizando mtodos robustos. Solucin a) La tabla del anlisis de la varianza es: Fuente Entre Dentro Total Suma de cuadrados Grados de libertad
3

Cuadrado medio 6.48001 8.51769

Razn F

P-valor

19.44
255.531 274.971

0.76

0.52

30 33

Como el P-valor es mucho mayor que el 5%, el contraste clsico acepta //0, es decir, las cuatro panaderas venden el mismo nmero medio de paquetes de pan integral. b) La figura 3.1 presenta el diagrama esquemtico de las muestras. Observamos que no hay atpicos pero s que existe desigualdad de dispersiones. Sin embargo, no parece adecuado aplicar una transformacin potencia ya que la dispersin no es creciente con la mediana. Parece, pues, que el nico mtodo aplicable es la transformacin rango.

Figura 3.1.

Ejercicios

169

En la siguiente tabla se muestra la asignacin de rangos a los valores mustrales:


A B C D 104 104 II
8 4

II8

12 14

13 2I 13 12
21 l4

1321
15 16
28 29

14 26
17

I g 3..5

9 8

2 1

13 12

2I l4

13
12

21
l4

30

10

18

315

20 335

20 335
14 26 14 26

II 8

II8

II8

12 l4

12 l4

12 14

13 2I

13 21

La tabla ANO VA para los rangos es la siguiente: Fuente Entre Dentro Total Suma de cuadrados 78.7138 3122.79 3201.5 Grados de libertad
3

Cuadrado medio 26.2379 104.093

Razn F

P-valor
0.8

0.25

30 33

Ahora el P-valor es ms grande que en el contraste clsico. El contraste basado en la transformacin rango acepta tambin la hiptesis nula de igualdad de las medias del nmero de paquetes vendidos en las cuatro panaderas. 4. Se desea saber si en tres zonas A, B y C de una ciudad los consumos medios de agua, en metros cbicos, durante un mes son iguales. Para ello se eligen al azar nueve viviendas en cada una de las tres zonas y se mide el consumo de agua en m3 durante dicho periodo. Los resultados obtenidos aparecen en los siguientes grficos tallo y hojas en paralelo:
A 1 2 3 4 5 6 7 HI B 1 2 3 4 5 6 7

568 O 1 28 100

69 1689 9
0 2

c 1 2 3 4 5 6 7

35567 0148

a) Analizar si se cumplen los supuestos clsicos para contrastar la igualdad de los consumos promedio. Qu mtodos robustos parecen adecuados en este caso? b) Efectuar un anlisis de la varianza usando los datos reexpresados mediante rangos. Si procede, aplicar la segunda etapa del procedimiento FSD para agrupar las zonas segn el consumo medio de agua.

170

Mtodos robustos y no paramtricos

Solucin a) Los estadsticos resumen de cada muestra aparecen en la siguiente tabla: Zona A B
C

n 9 9
9

X 48.56 33.33

M 41.00 28.00

S 27.62 17.90

IQR 35.50 24.50

18.78

17.00

4.89

7.50

La figura 4.1 muestra el diagrama esquemtico. Este diagrama sugiere que no se cumple el supuesto de normalidad por la existencia de valores atpicos en mayor proporcin de la que cabe esperar en muestras normales. Tampoco parece cumplirse el supuesto de igualdad de dispersiones poblacionales dado que los recorridos intercuartlicos mustrales son bastante diferentes. El diagrama esquemtico sugiere que la dispersin crece con la mediana y que las distribuciones son asimtricas por la derecha. Los mtodos de contraste que parecen ms adecuados son el mtodo de la transformacin potencia y el mtodo basado en la transformacin rango.

Figura 4.1.

b) El siguiente esquema ilustra la asignacin de rangos a los valores de la muestra combinada.

A
5 '2
6

| B
6 4.5

| c
97
6

31

52.5

5 2.5

6 4.5

?6

13.5

g 16

19.5

13.5

^^7

Q8

I95

4"

8 16

Q 19 _

9 20

21

2 23

g 24

Q22

7 25

2 26

no27

Ejercicios

171

La tabla ANOVA de los rangos es la siguiente: Fuente Entre Dentro Total Suma de cuadrados 811.722 822.278 1634.0 Grados de libertad
2

Cuadrado medio 405.861 34.2616

Razn F

P-valor 0.0003

11.85

24 26

Como el P-valor es menor que los niveles de significacin usados habitualmente, se debe rechazar la hiptesis nula de igualdad de los consumos medios. La figura 4.2 presenta el diagrama esquemtico de los rangos. Observamos que la transformacin rango ha funcionado muy bien porque ha normalizado las muestras y adems las dispersiones de los rangos de las tres zonas son similares.

Figura 4.2.

Como se han detectado diferencias significativas en los consumos medios, procede aplicar la segunda etapa del procedimiento FSD para agrupar las zonas. Tomando un nivel de significacin a=0.05, la diferencia significativa mnima es

Los rangos cumplen que XA = 20.06 , XE = 15.17 y Xc = 6.78 . Como XB - XA = 4.89 < LSD y Xc - XB = 8.39 > LSD, la agrupacin obtenida es {A, B} > CJ Como vemos, el mtodo robusto sugiere que la media de consumo de la zona C es menor que la de las zonas A y B, y que las zonas A y B tienen el mismo consumo medio.

172

Mtodos robustos y no paramtricos

5. Se quiere comparar la resistencia media al rozamiento de dos tipos de neumtico de moto. Para evitar que el tipo de moto influya en los resultados se mont en cada moto un neumtico de cada tipo (no se considera significativa la diferencia entre la rueda delantera y la rueda trasera). Una vez terminada la prueba se midi el grosor del neumtico para evaluar el desgaste. Las medidas de desgaste en milmetros para 10 motos fueron: Moto Tipo A TipoB
1 2 3 4 5 6 7 8 9

10 12 11

10 12

11 13

14 16

17 13

18 17

16 10

14 10

12 11

30 11

a) Qu supuestos son necesarios para la validez del contraste clsico? Efectuar el contraste clsico y acotar el P-valor. b) Realizar el anlisis exploratorio de las muestras e indicar qu supuestos clsicos parecen no cumplirse. Efectuar el contraste utilizando los mtodos robustos adecuados. Solucin a) Denotemos por XA el desgaste del neumtico tipo A y por XB el desgaste del neumtico tipo B. Por la forma de realizar el experimento, XA y XB son variables dependientes. Se trata de muestras apareadas y, por tanto, el contraste que debemos plantear es HQ./HD - O contra H{\/J.D * O , siendo jUD = / / A - / / B la media de la variable diferencia D - XA - XE . Suponiendo que D sigue una distribucin normal, el estadstico de prueba para muestras apareadas es t Suponiendo que HQ es verdadera, 0 sigue una distribucin t de Student con n -1 grados de libertad. Las diferencias mustrales son: Moto Diferencias
1 2 3 4 4 5 1 6 6 7 4 8 1 9

10
1

-2

-2

-2

19

Se puede comprobar que D = 3 y SD = 6.27 . Entonces el valor muestral del estadstico de prueba es t0 = = 1.51 y el P-valor muestral es

2- P(t9 >L5l). Se puede comprobar usando las tablas de la distribucin t que 0.1 < P-valor < 0.2. Como el P-valor es mayor que los niveles de significacin habituales, se acepta la hiptesis nula.

Ejercicios

173

b) La figura 5.1 presenta el grfico caja de las diferencias mustrales. La existencia de un atpico sugiere que la poblacin de diferencias no sigue una distribucin normal. Los mtodos robustos que parecen ms adecuados son un mtodo basado en la media recortada de las diferencias y un procedimiento para muestras apareadas basado en rangos.

Figura 5.1.

En primer lugar aplicaremos el procedimiento de la media recortada. Una fraccin de recorte del 5% es suficiente para eliminar el atpico observado en el grfico caja. El tamao de la muestra recortada es n r =10-l-l = 8.La muestra recortada es -2, -2, 1, 1, 1, 4, 4, 6 y XT= 1.625. Para calcular la desviacin tpica recortada necesitamos la muestra winsorizada, que es -2, -2, -2, 1, 1, 1, 4,4, 6, 6. La varianza winsorizada es s'L =10.01 y la desviacin tpica recortada resulta Para la muestra recortada, el valor
del

estadstico

de

prueba

es

Como

el contraste basado en las medias recortadas acepta la igualdad de las medias del desgaste en los dos tipos de neumtico. Aplicaremos por ltimo el procedimiento basado en la transformacin rango. El siguiente esquema muestra la asignacin de rangos para la muestra apareada.

174

Mtodos robustos y no paramtricos

Tipo A

Tipo B

10

102
II55
12 9
14 13.5

102
II55 II55

II55
129
1413.5

129

13 " 5 13 " 5 16 155 17 l 7 5 18 l9 16 l 5 5 17 l7-5

302()
La siguiente tabla presenta la muestra apareada de rangos y las diferencias de rangos: Moto Tipo A TipoB Rangos A Rangos B D (Dif. Rangos)

10 12 11
9 5.5 3.5

10 12
2 9

11 13
5.5

14 16

17 13

18 17 19

16 10

14 10

12 11
9 5.5 3.5

30 11 20
5.5

13.5 17.5 15.5


-2

15.5
2

13.5
2

11.5
-6

11.5
6

17.5
1.5

-7

13.5

11.5

14.5

Es fcil comprobar que los estadsticos resumen de las diferencias de rangos son D = 3.9 y SD = 7.63 . El estadstico de prueba para el contraste basado en rangos es Se puede comprobar que el P - valor es superior a los niveles de significacin utilizados habitualmente. Por tanto, el contraste basado en la transformacin rango acepta que las medias de desgaste de los dos tipos de neumtico son iguales. 6. Para comparar la eficacia acadmica de dos Institutos, A y B, se dise un experimento que requera el uso de diez pares de alumnos gemelos idnticos que hubieran terminado recientemente la EGB. Los gemelos de cada pareja haban pertenecido a la misma clase en cada uno de los cursos. Se eligi un alumno al azar de cada pareja y se asign al Instituto A, mientras que el otro se asign al Instituto B. Al terminar COU se aplic a cada gemelo del experimento una prueba de aprovechamiento. Las puntuaciones obtenidas se muestran en la siguiente tabla:

Ejercicios

175

Pareja de gemelos Instituto A Instituto B

10 60 47

75 59

80 75

65 90

70 55

86 74

50 52

63 56

81 72

86 89

Si la eficacia acadmica de cada Instituto se mide mediante la puntuacin media de la prueba de aprovechamiento: a) Contrastar mediante un contraste clsico la hiptesis de igualdad de eficacia acadmica para los dos Institutos a un nivel de significacin del 5%. Analizar exploratoriamente si se cumplen los supuestos requeridos por el contraste clsico efectuado. Si no se cumplen, qu mtodos de contraste parecen adecuados? Por qu? b) Aplicar los procedimientos adecuados y comparar los resultados de los contrastes efectuados. Cul es la conclusin? Solucin a) Se trata de una muestra apareada ya que las puntuaciones de cada par de gemelos son variables aleatorias dependientes. Planteamos, por tanto, la muestra de las diferencias. Sea D = (puntuacin Instituto A)-(puntuacin Instituto B). Queremos contrastar la hiptesis de igualdad de las medias de las puntuaciones, es decir, la hiptesis uD=0. Por tanto, planteamos el contraste de // 0 :// D =0 contra H\.fJiD = O . Los resultados mustrales de la variable diferencia son los siguientes: Pareja de gemelos Diferencia

2 5

3 -25

7 7

8 9

10 13

16

15

12

-2

-3

Se puede comprobar que D = 4.7 y SD = 12.32. El valor muestral del estadstico de prueba es r
como con

traste clsico acepta la hiptesis nula. La figura 6.1 presenta el grfico caja de las diferencias. Este grfico sugiere que la variable diferencia no sigue una distribucin normal ya que existe un atpico. El estudio exploratorio sugiere que los mtodos adecuados son el de la media recortada y el de la transformacin rango, dado que estos mtodos corrigen el problema de no normalidad.

Figura 6.1.

\ 76

Mtodos robustos y no paramtricos

Primero consideraremos el mtodo de contraste basado en la media recortada. Una fraccin de recorte del 5% es suficiente para eliminar el atpico observado en el grfico caja. El tamao de la muestra recortada es nT = 10-1-1 = 8 . La muestra recortada es -3, -2, 5, 7, 9, 12, 13 y 15, y XT = 1. Para calcular la desviacin tpica recortada necesitamos la muestra winsorizada, que es -3, -3, -2, 5, 7, 9, 12, 13, 15 y 15. La varianza winsorizada es S^ =53.1 y la desviacin tpica recortada resulta . Para la muestra recortada, el valor del estadstico de prueba es como et

contraste basado en las medias recortadas rechaza la igualdad de puntuaciones medias en los dos institutos. En segundo lugar, realizaremos el contraste basado en la transformacin rango. En la siguiente tabla se muestra la asignacin de rangos en la muestra combinada de puntuaciones de los dos Institutos.

| A
4 5 6
7

| B
47'
2

50

596, 554, 523, 56 5


75 13 - 5 , 74 12 , 72"

659, 638, 607


75 135 , 70 10

8
9

80 15, 86 175 , 81 l6, 86 175

89 l9
9020

En la siguiente tabla se presentan la muestra apareada de rangos y las diferencias de rangos, denotando los rangos de A mediante RA y los de B mediante RE . A I *A I B I RE I D = RA-RB

75

13.5

59

7.5

80 65 70 86 50 63 81 86 60

15 9 10 1 7 . 5

75 90 55 74 52 56 72 89 47

13.5 20 4 12

1.5 -11 6 5.5


-1 3 5 -1.5 6

2 8 16 1 7 . 5 7 |

3 5 11 19 1

Ejercicios

177

Es fcil comprobar que D =2.1 y SD = 5.53. El valor del estadstico de prueba para la muestra de las diferencias de rangos es t Como

/o < 0.025-9 = 2-26, el contraste basado en la transformacin rango acepta la igualdad de puntuaciones medias en los dos Institutos. En este ejercicio observamos que los dos contrastes aplicados conducen a conclusiones diferentes. El contraste basado en las medias recortadas detecta diferencia entre las puntuaciones medias, mientras que el contraste basado en rangos concluye que las puntuaciones medias son iguales. 7. Se desea saber si un alimento enriquecido para animales tiene mayor efecto sobre el incremento de peso medio que el alimento habitual. Para ello se administr a un grupo de 10 animales el alimento habitual (H) y a otro grupo de 8 animales el alimento enriquecido (E). El aumento de peso de cada animal en los dos grupos se da a continuacin: Habitual Enriquecido 8 4 57 88 64 90 66 105 71 119 78 132 91 152 94 176 99 118

a) Qu conclusin se obtiene con un contraste clsico de igualdad de medias? b) Qu problemas presentan estos datos para la validez de un contraste clsico de igualdad de medias? Qu procedimientos de contraste son adecuados? Por qu? c) Contrastar la igualdad de medias de aumento de peso con los dos alimentos usando los procedimiento adecuados elegidos en el apartado b). Comentar y comparar los resultados obtenidos en este ejercicio. Solucin a) Queremos contrastar la hiptesis nula HO:JLIH = ]UE contra H^fi^ < fJ,E, que es equivalente a contrastar / / 0 : / / H - / / E = 0 contra / / 1 : / / H - / / E < O . E 1 contraste clsico supone que los aumentos de peso en las dos poblaciones siguen distribuciones normales con dispersiones iguales. Para efectuar este contraste, los estadsticos resumen necesarios se dan en la siguiente tabla: Alimento H n 10 X 74.60 S 29.96

108.2

51.8

El estadstico de prueba es

sien-

178

Mtodos robustos y no paramtricos

e1 p valor

muestral es /*(/16 < -1.729) > 0.05 . Luego, al 5% de significacin, el contraste clsico acepta la igualdad de los aumentos de peso medio de los dos alimentos. b) El diagrama esquemtico se muestra en la figura 7.1. La presencia de valores atpicos en las dos muestras sugiere que las distribuciones poblacionales no son normales. Los recorridos intercuartlicos de las dos muestras son bastante diferentes, lo que sugiere que las dispersiones poblacionales son diferentes. Los contrastes robustos adecuados son el basado en las medias recortadas con la correccin de Satterthwaite y el basado en la transformacin rango.

Figura 7.1.

c) Aplicaremos en primer lugar el contraste basado en las medias recortadas. Es suficiente aplicar una fraccin de recorte del 5% para eliminar todos los atpicos. Las muestras recortadas son:
H E

57 88

64 90

66
105

71
119

78
132

91
152

94

99

Las muestras winsorizadas son:


H E

57 88

57 88

64 90

66
105

71
119

78
132

91
152

94
152

99

99

Los estadsticos resumen son: Alimento


H E

nT
8 6

XT

Sw

ST

77.5
114.3

16.92 27.31

19.2 32.3

Ejercicios

\ 79

El estadstico de prueba con la correccin de Satterthwaite viene dado por la expresin siendo El valor que toma dicho esta. Bajo la

dstico para los estadsticos recortados es ?

hiptesis nula, el estadstico 0 sigue aproximadamente una distribucin t de Student con v = = 7.62 = 8 grados de libertad (siendo Como valores pequeos del estadstico de prueba apoyan la hiptesis alternativa, el P-valor muestral es P(tv <tQ) = P(8 < -2.48) y cumple 0.01 < P-valor < 0.025 . Por tanto, al 5% de significacin, el contraste basado en medias recortadas acepta que la media del incremento de peso con el alimento enriquecido es mayor que con el alimento habitual. Aplicaremos por ltimo el mtodo basado en la transformacin rango. La asignacin de rangos se muestra en la siguiente tabla: Habitual Enriquecido 82 4! 573 888 644 909 665 10513 71 6 11915 787 13216 9110 9411 9912 11814

152" 17618

El diagrama esquemtico de los rangos aparece en la figura 7.2. Observamos que no existen atpleos y que las dispersiones son similares. Los estadsticos resumen de los rangos son: Alimento H
E

n 10
8

X S 7.40 4.12
12.13 5.77

El estadstico de prueba para los rangos es

siendo

El P-valor muestral es

y cumple 0.025 < P - valor < 0.05. Luego, al 5% de significacin, el contraste basado en rangos rechaza la hiptesis nula de igualdad de medias y acepta que el alimento enriquecido logra un aumento de peso medio mayor que el alimento habitual.

180

Mtodos robustos y no pararntricos

Figura 7.2.

Los dos contrastes robustos detectan que el alimento enriquecido tiene mayor efecto sobre el incremento medio de peso que el alimento habitual. Esta conclusin est de acuerdo con lo que sugiere el diagrama esquemtico de los valores originales (figura 7.1). Sin embargo, el contraste clsico, dada su falta de sensibilidad (motivada por el incumplimiento de los supuestos en que se basa), no consigue encontrar diferencias significativas en las medias de las dos muestras. 8. En un estudio sobre la conservacin del jamn se quiere estudiar el contenido de residuos de cido srbico. Para ello, se tom una muestra de 8 jamones tratados con una solucin de cido srbico y se midi el contenido de residuos un da despus de ser tratados y a los 60 das. Los resultados obtenidos fueron los siguientes: Jamn Un da despus 60 das despus 1 224 116 2 270 96 3 400 239 4 444 329 5 590 437 6 660 597 7 1400 689 8 680 576

Hallar un intervalo de confianza de nivel 0.95 para la reduccin media de los residuos de cido srbico en los 60 das basado en el procedimiento robusto de la media recortada con la fraccin de recorte oportuna. Comparar dicho intervalo con el intervalo clsico, es decir, el intervalo construido suponiendo que se cumple el supuesto de normalidad en la variable diferencia. Solucin La muestra de las diferencias (reducciones en los 60 das) es: Jamn Diferencia (X) 1_ 108 2 174 3 161 4 115 5 153 6 63 7 711 8 104

Ejercicios

181

Se puede comprobar fcilmente que la muestra de diferencias contiene un atpico mayor (el valor 711). Esto sugiere que la variable diferencia no es normal. Una fraccin de recorte del 5% es suficiente para eliminar dicho atpico. Los estadsticos resumen de las diferencias son: Fraccin de recorte 0% 5% n 8 6 XT 198.62 135.83 Sw 210.17 31.78 ST 210.17 37.61

El intervalo para la media es Usando los estadsticos recortados al 5% obtenemos que el intervalo robusto es mientras que el intervalo clsico es

La mayor precisin del intervalo robusto con respecto al intervalo clsico se pone de manifiesto al comprobar que la amplitud del intervalo clsico es ms de cuatro veces mayor que la del intervalo robusto. 9. Un empresario dispone de tres fbricas A, B y C para embotellar aceite. La etiqueta de las botellas indica que el contenido medio de aceite es 1000 mi. El empresario recibi una queja de una organizacin de consumidores que afirma que el contenido medio de aceite de sus botellas es menor de 1000 mi. Para investigar la veracidad de esta afirmacin, el empresario invit a los representantes de la organizacin a tomar una muestra de botellas en cada una de las fbricas. Los contenidos de aceite, en mi., de las botellas de las muestras fueron los siguientes: A: 989 995 996 996 997 997 998 B: 989 992 994 995 996 998 999 1000 1001 C: 993 994 997 998 998 999 999 1003 a) Analizar exploratoriamente las muestras de cada fbrica y realizar para cada una de ellas el contraste ms adecuado para analizar la veracidad de la afirmacin de los consumidores (utilizando un nivel de significacin =0.05). b) Supongamos que deseamos contrastar si en las tres fbricas se est llenando en promedio la misma cantidad de aceite. Analizar exploratoriamente los datos para efectuar dicho contraste. Plantear y realizar el contraste mediante el procedimiento ms adecuado usando un nivel de significacin del 5%.

182

Mtodos robustos y no paramtricos

Solucin a) El contraste a realizar en cada fbrica considera como hiptesis nula H0:ju> 1000 y como hiptesis alternativa //,://< 1000 , donde J. es el contenido medio de aceite. Los estadsticos resumen de las tres muestras aparecen en la siguiente tabla:
|
A

n
X

B ~ 9
996
996

C 8
997.625
998

995.429
996

M
S Q{
Q3

2.992 995.5
997 1.5

3.937 994
999 5

3.114 995.5
999 3.5

IQR

El diagrama esquemtico se presenta en la figura 9.1. El grfico caja de la muestra de la fbrica A presenta un atpico (el valor 989) que sugiere no normalidad en los contenidos de aceite de la fbrica A. Sin embargo, los grficos caja para las fbricas B y C sugieren normalidad. En consecuencia efectuaremos en la fbrica A un contraste basado en la media recortada y en las fbricas B y C contrastes clsicos. Para el contraste de la fbrica A aplicaremos una fraccin de recorte del 5%. La muestra recortada es 995, 996, 996, 997 y 997, y la muestra winsorizada es 995, 995, 996, 996, 997, 997 y 997. Los estadsticos recortados son nT = 5, XT = 996.2 Y El estadstico de prueba es

te para la fbrica A concluye que la media (recortada) es menor de 1000 mi. Para la fabrica B el estadstico de prueba es t Como media es menor de 1000 mi. Para la fabrica el contraste para la fbrica B concluye que la Observamos que

de modo que en la fbrica C tambin se acepta la hiptesis alternativa. Luego la informacin muestral apoya la veracidad de la afirmacin de la organizacin de consumidores en las tres fbricas.

Ejercicios

183

Figura 9.1.

b) Para decidir si los contenidos medios de aceite en las tres fbricas son iguales, consideramos el contraste de HQ\HA= JLB- nc contra //j:no// 0 . El diagrama esquemtico (figura 9.1) sugiere desigualdad de las dispersiones poblacionales, adems de la no normalidad ya indicada para el contenido de la fbrica A, de modo que el anlisis de la varianza clsico no es adecuado. En su lugar efectuaremos un anlisis de la varianza de los rangos de los datos originales. La tabla ANOVA para los rangos es la siguiente: Fuente Entre Dentro Total Suma de cuadrados 85.4638 1052.04 1137.5 Grados de libertad Cuadrado medio 42.7319 50.097 Razn F P-valor 0.4404

2 21 23

0.85

Observamos que el estadstico de prueba FQ = 0.85 < F0 05.2 21 = 3.47 y, por tanto, el contraste basado en la transformacin rango acepta la igualdad de las medias de los contenidos de aceite en las tres fbricas.

This page intentionally left blank

CAPITULO 6 BONDAD DE AJUSTE

1. INTRODUCCIN El objetivo de los denominados contrastes no paramtricos es estudiar si son aceptables las hiptesis hechas sobre modelos de distribuciones poblacionales. Por ejemplo, se ha visto que para contrastar la igualdad de las medias de dos poblaciones se daban por supuestas algunas condiciones tales como normalidad, independencia, aleatoriedad de las muestras,... Estas hiptesis se pueden ratificar mediante tcnicas de contraste llamadas no paramtricas. En este captulo presentaremos contrastes no paramtricos que pueden usarse para probar una hiptesis relativa a una nica poblacin a partir de la informacin proporcionada por una muestra. Estas pruebas son de bondad de ajuste o conformidad de una distribucin emprica a una distribucin terica. En el caso tpico, con una muestra tomada al azar, contrastamos la hiptesis de que la muestra procede de una poblacin con una distribucin especificada. En tal caso, el contraste puede contestar preguntas como las siguientes: Hay una diferencia significativa de posicin (tendencia central) entre la muestra y la poblacin? Hay una diferencia significativa entre las frecuencias observadas en la muestra y las frecuencias tericas calculadas en base a alguna hiptesis? Hay una diferencia significativa entre las proporciones observadas y las esperadas? Es razonable creer que la muestra procede de una poblacin de forma o aspecto especificado? Es razonable creer que la muestra es una muestra al azar de alguna poblacin conocida? Presentaremos dos pruebas de bondad de ajuste para contrastar la validez de un modelo: el test Ji-cuadrado y el test de Kolmogorov-Smirnov. El mtodo general, muy similar al estudiado en los contrastes paramtricos, se basa en elegir un estadstico de prueba que mida las diferencias entre los valores obtenidos en una muestra y los valores esperados bajo la hiptesis del modelo terico poblacional. Despus el valor muestral del estadstico de prueba se comparar con un punto crtico para decidir si se acepta o se rechaza la hiptesis relativa al modelo poblacional.

186

Bondad de ajuste

2. TEST JI-CUADRADO En esta seccin presentamos el test de significacin ms antiguo, el test X de Karl Pearson para la bondad de ajuste, que apareci publicado en 1900. A pesar de su edad, este test todava es importante hoy y se utiliza mucho en la prctica. El test Ji-cuadrado es aplicable tanto para v.a. continuas como para v.a. discretas pero requiere un tamao muestral mayor que 30. En primer lugar consideramos una hiptesis nula //0 que especifica completamente la distribucin poblacional. El test Ji-cuadrado primero agrupa los valores de la variable en k clases o categoras, y despus para cada categora compara la frecuencia absoluta muestral con la frecuencia esperada calculada suponiendo verdadera la hiptesis nula. Para ilustrar el funcionamiento de este test, consideramos un conjunto de datos que se utiliz como prueba en un caso real de tribunal. Los datos constituyen una muestra aleatoria de 1336 individuos del jurado de un distrito judicial grande. Se puso en tela de juicio la justicia de la representacin de los distintos grupos de edad de los jurados. La estrategia consisti en discutir la representatividad del conjunto de individuos de los que se extraen los jurados, comparando la distribucin de la edad en el jurado con la distribucin de edad en el distrito (que es conocida a travs de los datos censales). Como el nmero de individuos del jurado era grande, se tom una muestra aleatoria para efectuar el estudio. Los valores de la edad se clasificaron en grupos. La siguiente tabla presenta la frecuencia observada y la proporcin censal para cada grupo de edad. Grupo de edad (aos) Frecuencia observada
23 96 134 293 297 380 113
2

Proporcin censal

18-19 20-24 25-29 30-39 40-49 50-64 65 o ms


Total

0.061 0.150 0.135 0.217 0.153 0.182 0.102


1

1336

Para formular el problema en trminos de un contraste de hiptesis, la hiptesis nula de no discriminacin de edad puede expresarse como la hiptesis de que las proporciones (poblacionales) del jurado, denotadas por p-[,...,p1, son iguales a las proporciones censales correspondientes, es decir, HQ:/?] =0.061,p2 =0.150,...,p7 =0.120. La hiptesis alternativa que adoptamos aqu es que existe alguna diferencia entre las proporciones verdaderas y las proporciones hipotticas, es decir, que al menos una de las igualdades especificadas por H0 es falsa. En consecuencia, la hiptesis alternativa es H: no HQ . As, el test de

187

estas hiptesis debe ser capaz de detectar cualquier desviacin entre las proporciones poblacionales verdaderas y las proporciones hipotticas. El test Ji-cuadrado se basa en la idea de medir la distancia entre los valores de los parmetros reales y los valores de los parmetros hipotticos mediante una suma de cuadrados. Si las proporciones hipotticas se representan simblicamente por pf para / = !,...,&, donde k es el nmero de categoras de la variable en cuestin (en el ejemplo, k = 7), entonces una medida de la diferencia entre los parmetros verdaderos y los hipotticos es , donde las w son pesos positivos y cada diferencia aparece elevada al cuadrado para evitar que signos contrarios compensen la medida global, ya que el inters se centra en la cuanta de la desviacin y no en su direccin o signo. Esta suma ponderada de cuadrados es cero si y slo si todas las proporciones poblacionales coinciden con las proporciones hipotticas correspondientes. As, la hiptesis nula HQ corresponde al valor cero de la suma de cuadrados y la hiptesis alternativa H\ a cualquier valor positivo. Como las proporciones poblacionales p son desconocidas, stas deben estimarse mediante la muestra. Si O representa la frecuencia (absoluta) observada para la z-sima categora de la variable y n es el tamao muestral, entonces la estimacin natural de la proporcin poblacional p es la proporcin muestral p = O / n . Esta estimacin debe sustituir a p en la anterior suma de cuadrados para construir el estadstico de prueba del contraste de HQ contra //, . Como valores grandes de la suma de cuadrados favorecen //(, la regla apropiada consiste en rechazar H0 si la suma de cuadrados excede alguna constante. Para seleccionar la constante, necesitamos conocer la distribucin del estadstico de prueba bajo HQ o bien disponer de una buena aproximacin a dicha distribucin. Por costumbre y conveniencia el estadstico de prueba se escribe en trminos de las frecuencias absolutas en vez de las frecuencias relativas. Esto se consigue multiplicando los trminos de la suma de cuadrados por el tamao muestral n. Los nmeros resultantes E = np se llaman frecuencias esperadas y representan la frecuencia absoluta que esperamos encontrar, en promedio, en la categora z-sima (en una muestra de tamao ri) suponiendo que H0 es verdadera. Fijando w. = n2 /E. se obtiene el estadstico de prueba Este estadstico se llama

estadstico Ji-cuadrado, ya que bajo H0 su distribucin muestral puede aproximarse muy bien mediante una distribucin Ji-cuadrado de Pearson. Los grados de libertad de la distribucin Ji-cuadrado son iguales al nmero de categoras menos 1, es decir, v = k -1. El motivo de restar una unidad al nmero de categoras para obtener los grados de libertad es que las variables O (/ = !,...,) no son independientes al estar relacionadas por la restriccin lineal Ol+...+Ok - n y, por tanto, solamente k -1 de dichas variables son independientes. El test Ji-cuadrado consiste en rechazar H0 si %^ > c, donde c se determina de modo que la probabilidad aproximada del error de tipo I sea igual al nivel de significacin prefijado a. En consecuencia, c = %2a.v. Para el ejemplo del jurado,

188

Bondad de ajuste

como k = 1, tenemos v = 6. Para un nivel de significacin del 5%, el valor de c es 2'o.os; 6 = 12.59 . Por tanto, el test Ji-cuadrado rechaza //0 si %Q > 12.59 . Es fcil -j comprobar que el valor del estadstico Ji-cuadrado es %Q = 231.26. Como este valor es mayor que 12.59, debemos rechazar HQ . Es decir, al 5% de significacin concluimos que las verdaderas proporciones del jurado difieren de las del distrito. Tambin se puede calcular el P-valor asociado al estadstico de prueba mediante la frmula P-valor = P(%v > %Q). El P-valor indica el mnimo nivel de significacin para el que se tendra que rechazar HQ. La demostracin matemtica de la distribucin asinttica de %Q est fuera del alcance de este libro. Sin embargo, para k = 2, la distribucin asinttica resultante se sigue fcilmente del teorema central del lmite. En efecto, si k = 2, entonces O2 = n-Ol y Pi+p2 = I- Por tanto

De los resultados de la seccin 8 del captulo 1 se deduce que, bajo H0, el


estadistico

madamente una distribucin

normal estndar para n grande. Por tanto, bajo // 0 , %Q es aproximadamente una variable aleatoria Ji-cuadrado con un grado de libertad. Varios investigadores han sugerido reglas para garantizar que la distribucin Ji-cuadrado aproxime bien la distribucin del estadstico %Q bajo //0 . Una de estas reglas es que todas las frecuencias esperadas de las categoras deben ser mayores o iguales que 1. Nosotros emplearemos una regla ms estricta (usada con frecuencia) que exige que todas las categoras tengan frecuencias esperadas mayores o iguales que 5. En caso de que la muestra no cumpla esta regla, para que la aproximacin sea buena es necesario recurrir a la estrategia de combinar (agrupar) categoras, lo que al reducir el nmero de categoras implica una reduccin del nmero de grados de libertad. En algunas aplicaciones la hiptesis nula HQ no especifica completamente la distribucin y para determinar las frecuencias tericas pf se requiere estimar algunos parmetros desconocidos a partir de la muestra. Si en estos casos se usa el mtodo de estimacin de la mxima verosimilitud, entonces se puede seguir utilizando el estadstico Ji-cuadrado pero hay que tener presente que cada parmetro estima-

189

do reduce un grado de libertad. Por tanto, v = k - r 1, donde r es el nmero de parmetros estimados usando la informacin muestral. 3. TEST DE KOLMOGOROV-SMIRNOV El contraste de Kolmogorov-Smirnov es un test de bondad de ajuste cuya hiptesis nula especifica completamente la funcin de distribucin terica. Sin embargo, a diferencia del test Ji-cuadrado, el test de Kolmogorov-Smirnov compara la funcin de distribucin terica con la distribucin de frecuencias acumuladas observada, sin necesitar agrupar los valores de la variable en categoras. El test de KolmogorovSmirnov es vlido para v.a. continuas y es ms conveniente que el test Ji-cuadrado pues no requiere ninguna eleccin arbitraria de clases o categoras en las que agrupar los valores de la variable. Adems, tiene la ventaja de que se puede aplicar en muestras pequeas. Para facilitar la descripcin del test de Kolmogorov-Smirnov empezamos recordando algunas propiedades de la funcin de distribucin emprica, funcin que describe el comportamiento de la distribucin de frecuencias acumuladas mustrales. La funcin de distribucin emprica de una m.a.s. X,...,Xn se defini (seccin 4, capitulo 2) como Fn(x)N = nmero de X.menores o iguales que x . La funcin n

F W (JC) definida de esta manera se puede considerar como la funcin de distribucin de una distribucin discreta que asigna probabilidad 1 / n a cada observacin muestral. Se prob que la proporcin Fn(x) de observaciones de la muestra que son menores o iguales que x es un estimador consistente para F(x), Vx E R, donde F(x) denota la funcin de distribucin poblacional. Esta propiedad expresa el hecho de que en cada punto x la funcin de distribucin emprica Fn(x) converge en probabilidad a la verdadera funcin de distribucin F(x) de la distribucin de donde se seleccion la muestra aleatoria. Intuitivamente, una versin suavizada de Fn(x) en la que se eliminen los saltos proporcionar una estimador razonable de F ( x ) . Supongamos que deseamos contrastar la hiptesis de que la muestra procede de una poblacin de tipo continuo con funcin de distribucin F0(x) frente a la alternativa general de que la verdadera funcin de distribucin no es F 0 ( x ) . Bajo H0 , se espera que para cualquier valor de x, Fn(x) aproxime bien a FQ(x), es decir, las diferencias entre Fn(x) y F 0 ( x ) , para una muestra suficientemente grande, sern pequeas. La prueba de Kolmogorov-Smirnov considera la mayor de estas diferencias entre Fn(x} y F O (JC) como estadstico de prueba. Especficamente, el estadstico de Kolmogorov-Smirnov es La distribucin muestral de Dn bajo HQ es conocida e independiente de la distribucin F0(x) que provisionalmente se ha atribuido a la poblacin. Esto se debe a que por el teorema de la transformacin integral si la v.a X es continua entonces Y=F(X) siempre tiene una distribucin 7(0,1), con lo que

190

Bondad de ajuste

sup

sup

tiene la misma distribucin de pro-

babilidad cualquiera que sea F Adems, como consecuencia de la consistencia de la funcin de distribucin emprica Fn(x) para la funcin de distribucin terica F(x), bajo HQ el estadstico Dn converge en probabilidad a 0. Esto es, el valor de Dn tender a ser pequeo si la hiptesis nula HQ es cierta y tender a ser grande si la verdadera funcin de distribucin es distinta de F0(x). Por tanto, un procedimiento de contraste razonable para verificar la hiptesis nula de que la muestra procede de la distribucin continua F0(x) al nivel de significacin a consiste en utilizar la regin crtica C = [Dn > c}, donde c es una constante apropiada tal que P(Dn >c/HQ) = a.Siel valor muestral del estadstico Dn pertenece a la regin crtica C, se rechaza la hiptesis nula. Los valores crticos c para diferentes niveles de significacin y distintos tamaos mustrales se recogen en la tabla 3.1. Para aplicar el test de Kolmogorov-Smirnov en la prctica se siguen las siguientes etapas: 1) Se ordenan los valores de la muestra en orden creciente, obtenindose 2) Se calcula la funcin de distribucin emprica de la siguiente forma:

3) Se calcula el valor del estadstico

Para calcular Dn, se calcula para cada valor muestral

Entonces, D

4) Fijado el nivel de significacin a, se busca en la tabla 3.1 el valor c para que P(Dn>c/HQ) = a. Si Dn >c, se rechaza H0 En la figura 3.1 se ilustran grficamente para un ejemplo las distancias . La mayor de estas dos distancias se denota median-

19]_
te D W (JC (/) ) en la descripcin que hemos realizado de las etapas del test de Kolmogorov-Smirnov. El estadstico Dn se define como la mayor de las discrepancias Dn(x(}),i=l,...,n. Tabla 3.1. Puntos crticos del test de Kolmogorov-Smirnov
Tamao muestral n Nivel de significacin, a

0.20
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
25 30 35

0.15
0.925 0.726 0.597 0.525 0.474 0.436 0.405 0.381 0.360 0.342 0.326 0.313 0.302 0.292 0.283 0.274 0.266 0.259 0.252 0.246

0.10
0.950 0.776 0.642 0.564 0.510 0.470 0.438 0.411 0.388 0.368 0.352 0.338 0.325 0.314 0.304 0.295 0.286 0.278 0.272 0.264

0.05
0.975 0.842 0.708 0.624 0.565 0.521 0.486 0.457 0.432 0.410 0.391 0.375 0.361 0.349 0.338 0.328 0.318 0.309 0.301 0.294

0.01
0.995 0.929 0.828 0.733 0.669 0.618 0.577 0.543 0.514 0.490 0.468 0.450 0.433 0.418 0404 0.392 0.381 0.371 0.363 0.356

0.900 0.684 0.565 0.494 0.446 0.410 0.381 0.358 0.339 0.322 0.307 0.295 0.284 0.274 0.266 0.258 0.250 0.244 0.237 0.231

0.21 0.19 0.18


1.07/V

0.22 0.20 0.19


1.14/V

0.24 0.22 0.21


1.22/Vw

0.27 0.24 0.23


1.36/Vw

0.32 0.29 0.27


1.63/V

>35

192

Bondad de ajuste

Figura 3.1.

4. COMPARACIN DE LOS CONTRASTES Hemos presentado dos procedimientos de contraste de la bondad del ajuste para una muestra. En esta seccin comparamos estos dos procedimientos sealando las ventajas y desventajas de cada contraste en trminos de los criterios de validez y sensibilidad. Para probar una hiptesis acerca de si la muestra procede de una distribucin poblacional especfica podemos usar uno de los dos tests de bondad de ajuste: el test Ji-cuadrado o el test de Kolmogorov-Smirnov. El test Ji-cuadrado se recomienda para modelos discretos (variables categricas). Para modelos continuos, el P-valor del contraste Ji-cuadrado depende mucho de la eleccin de las clases o categoras en las que se agrupe la variable. En distribuciones continuas se recomienda utilizar el test de Kolmogorov-Smirnov ya que no requiere ninguna eleccin arbitraria de intervalos de clase pues trata las observaciones mustrales separadamente. De esta manera el test de Kolmogorov-Smirnov, a diferencia del test Ji-cuadrado, no pierde informacin por la agrupacin en intervalos de clase. Con una variable continua, si la muestra es pequea y, por consiguiente, las categoras adyacentes deben combinarse para que la distribucin del estadstico Ji-cuadrado pueda aproximarse apropiadamente, el test Ji-cuadrado tiene menor potencia (menor sensibilidad) que el test de Kolmogorov-Smirnov. Adems, para muestras muy pequeas, la prueba Ji-cuadrado no ser adecuada, mientras que la de Kolmogorov-Smirnov s lo es. El test Ji-cuadrado deber usarse cuando los datos estn en categoras discretas y cuando las frecuencias esperadas sean suficientemente grandes. Cada frecuencia

193

esperada deber ser 5 o mayor para que sea adecuada la aproximacin Ji-cuadrado del estadstico de prueba bajo la hiptesis nula. El test de Kolmogorov-Smirnov deber usarse cuando se puede suponer que la variable bajo consideracin tiene una distribucin continua. Sin embargo, si se usa cuando la distribucin poblacional es discreta, el error de la aseveracin resultante de probabilidad se dirige a la seguridad. Es decir, si se usa la tabla de valores crticos del estadstico de Kolmogorov-Smirnov, que supone que la funcin de distribucin de la poblacin es continua, para probar una hiptesis acerca de una variable discreta, la prueba es conservadora: al rechazar la hiptesis nula con esta prueba podemos confiar plenamente en esa decisin. La distribucin del estadstico de Kolmogorov-Smirnov no se conoce en el caso de ciertos parmetros desconocidos de la poblacin cuya estimacin se hace a partir de la muestra. Sin embargo, se ha comprobado que si en tales casos se aplica el test de Kolmogorov-Smirnov, el uso de los puntos crticos de la tabla 3.1 conduce a una prueba conservadora. Esto es, si el valor del estadstico de Kolmogorov-Smirnov es mayor que el punto crtico de la tabla 3.1, confiadamente podemos rechazar la hiptesis nula y concluir con gran seguridad que hay una diferencia significativa entre la distribucin muestral y la terica especfica. En los casos donde deban estimarse algunos parmetros a partir de la muestra, el test Ji-cuadrado puede modificarse fcilmente reduciendo el nmero de grados de libertad. Sin embargo, como hemos indicado, para el test de Kolmogorov-Smirnov no se conocen modificaciones semejantes.

194
EJERCICIOS

Bondad de ajuste

1. En un experimento biolgico se subdividi un milmetro cuadrado de cultivo de levadura en 400 cuadrados de la misma rea, y se registr el nmero de clulas de levadura en cada cuadrado de la subdivisin. La tabla siguiente resume los resultados obtenidos: Nmero de clulas Frecuencia observada

0 129

1 137

2 83

3 38

4 10

5 2

6 1

>6 0

Se sabe que si las clulas de levadura estuvieran distribuidas aleatoriamente sobre el rea examinada, el nmero de clulas por cuadrado seguira una distribucin de Poisson. Contrastar al nivel de significacin a = 0.05 si el nmero de clulas por cuadrado sigue una distribucin de Poisson. Solucin Sea X la variable nmero de clulas por cuadrado. Queremos contrastar la hiptesis nula H0: X tiene distribucin de Poisson con parmetro A contra la alternativa //,: no HQ. Puesto que la hiptesis nula no especifica totalmente la distribucin de X (A es desconocido), debemos estimar A. El estimador mximo ve- 1 -r-a rosmil de A es = X = > x, -O/ , donde k es el nmero de categoras. La informacin necesaria para estimar A se recoge en la siguiente tabla:

0
2

*/
1

3 4 5 6

Oi 129 137 83 38 10 2 1

ti'Oi

0 137 166 114 40 10 6

Es fcil comprobar que = 1.2 . La regla de adecuacin para la aproximacin a la distribucin X del estadstico de prueba XQ , que exige que todas las frecuencias esperadas sean mayores o iguales que 5, nos obliga a combinar las categoras en las que x es 4, 5, 6 o ms. La siguiente tabla muestra para la nueva agrupacin los clculos necesarios para realizar el contraste.

Ejercicios

195
x

o,
129 137
83 38 13

1
2 3 4, 5, 6 o ms

P? 0.3012 0.3614

E, 120.48 144.56

0.2169 0.0867 0.0338

86.76 34.68 13.52

(Oi-Ei)2/E 0.60250996 0.39536248 0.16295067 0.3178316 0.02

A partir de estos datos obtenemos el valor del estadstico Ji-cuadrado


=1.49865. Los grados de libertad son v = A - r - l = 5 - l - l = 3 y el P-valor es P(%1 > 1.49865) e (0.5,0.75). Como el P-valor es mayor que el nivel de significacin a=0.05, se debe aceptar la hiptesis nula, es decir, el nmero de clulas por cuadrado sigue una distribucin de Poisson. 2. Un departamento de polica municipal registr el nmero de accidentes de trfico en los que hubo daos personales durante 60 maanas de das laborables. Los resultados fueron los siguientes: Nmero de accidentes Frecuencia observada

0 17

1 17

2 16

3 7

4 2

5 1

>5 0

Contrastar la hiptesis de que la variable nmero de accidentes de trfico en los que hay daos personales durante un da laborable sigue una distribucin de Poisson. Usar un nivel de significacin ce=0.05. Solucin Sea X la variable nmero de accidentes de trfico en los que hay daos personales en una maana laborable. Queremos contrastar la hiptesis nula HQ: X tiene distribucin de Poisson con parmetro A contra la hiptesis alternativa Hl:noH0. Puesto que la hiptesis nula no especifica totalmente la distribucin de X (A es desconocido), debemos estimar A. El estimador maximoverosmil de A es
}:

, siendo k el nmero de categoras. La informacin necesaria

para estimar A se recoge en la siguiente tabla:

196
x

Bondad de ajuste

o
17 17 16 7 2 1 0

xrOi

1
2 3 4 5 >5

0 17 32 21 8 5 0

Es fcil comprobar a partir de aqu que /I = 1.4. En este caso es conveniente combinar las categoras 3, 4, y 5 o ms para garantizar que la aproximacin Ji-cuadrado es buena. Los clculos necesarios para realizar el contraste son los siguientes:

o,
17 17 16 10

P?
0 . 2 4 6 6 0.3452 0.2417 0.1665

Ef
14.796 20.712 14.502

(Oi-Etf/E, 0.32830603 0.66526381 0.15473755 1.001E-05

1
2
3, 4, 5 o ms

9.99

A partir de aqu obtenemos que

Los grados de

libertad s o n v = - r - l = 4-l-l = 2 y P-valor = P( > 1.1483) e (0.5,0.75). Como el P-valor es mayor que el nivel de significacin a=0.05, se acepta que X sigue una distribucin de Poisson. 3. El mismo departamento del ejercicio anterior registr tambin el nmero de personas lesionadas en accidentes de trfico ocurridos en un da laborable con los siguientes resultados: Nmero de heridos Frecuencia observada

0 17

1 8

2 9

3 8

4 10

5 4

6 2

7 2

>7 0

Decidir si los datos proceden de una distribucin Poisson a un nivel de significacin del 5%.

Ejercicios

197

Solucin Sea X la variable nmero de personas lesionadas en accidentes de trfico en una maana laborable. Queremos contrastar la hiptesis nula 7/0: X tiene distribucin de Poisson con parmetro A contra la alternativa //,: no H0 . Puesto que bajo HQ A es desconocido, debemos estimarlo. El estimador maximoverosmil de A es . La informacin necesaria para estimar A se recose en la siguiente tabla:
x

O;

17
8 9 8

*,..0/ 0
8

1
2 3 4 5 6 7

18 24 40 20 12 14

10
4 2 2

El estimador maximoverosmil de A es En este caso, despus de combinar las categoras 5, 6, y 7 o ms con el objeto de obtener que las frecuencias esperadas de todas las clases sean al menos 5, obtenemos los siguientes resultados:

*/

o,
17 8 9 8 10

P?
0.10365713 0.23495616 0.26628365 0.20119209 0.11400885 0.07990213

E, 6.21942772

1
2 3 4
>5

14.0973695 15.9770188 12.0715253 6.84053099 4.79412776

(Oi-Eif/E 18.6867255 2.63722354 3.04680062 1 .37325796 1.45927917 2.14379285

El valor observado del estadstico de prueba es

IOS

grados de libertad son v= k-r-\ = 6-1-1 = 4 y el P-valor es P(z1 ^ 29.347) < 0.005. Como el P-valor es menor que el nivel de significacin a=0.05, se rechaza la distribucin de Poisson a dicho nivel de significacin del 5%.

198

Bondad de ajuste

4. De los 83 accidentes registrados en el ejercicio 2, 22 ocurrieron en lunes, 13 en martes, 11 en mircoles, 12 en jueves y 25 en viernes. Son coherentes estos resultados con la hiptesis de que los accidentes tienen la misma probabilidad de ocurrir en cualquier da de la semana laboral al nivel de significacin ce=0.05? Solucin Queremos contrastar la hiptesis nula H0:pf =1/5 (/' = 1,2,3,4,5), siendo pf la probabilidad de que ocurra un accidente el da /-simo (/ = 1 para lunes, etc.), contra la hiptesis alternativa //j: no H0. Los clculos necesarios se recogen en la siguiente tabla:
*/ 22 13 11 12 25

o,
22 13 11 12 25

Lunes Martes Mircoles Jueves Viernes

rf 0.2
0.2 0.2 0.2 0.2

E, 16.6

(Oi-E^/E, 1.75662651 0.78072289 1.88915663 1.2746988 4.25060241

16.6 16.6 16.6 16.6

Obtenemos para el estadstico Ji-cuadrado un valor Los de libertad son v=k-\-5-1-4 y el P-valor es Como el P-valor es menor que el nivel de significacin cc=0.05, los datos no son coherentes con la hiptesis nula. grados

5. Un experimento consiste en lanzar 6 veces una moneda y anotar el nmero de caras. La tabla siguiente muestra las frecuencias observadas en 210 repeticiones del experimento. Nmero de caras Frecuencia observada
0 3 1 2 3 580 4 5 6 2

19

49

57

22

Estudiar si los resultados estn de acuerdo con la hiptesis de que las monedas estn equilibradas al nivel de significacin a =0.05. Solucin Sea X la variable aleatoria nmero de caras al lanzar 6 veces una moneda. Queremos contrastar la hiptesis nula H0: La moneda est equilibrada, que es equivalente a H0:X sigue una distribucin binomial con parmetros n = 6 y p - 1/2 . La hiptesis alternativa es H}:no H0. Los datos resumen, combinando

Ejercicios

199

las categoras O y 1 por un lado y las categoras 5 y 6 por otro lado, se recogen en la siguiente tabla:
x

o
22 49 58 57 24

O 1 2 3 4 566

P 0.109375 0.234375 0.3125 0.234375 0.109375

E, 22.96875 49.21875 65.625 49.21875 22.96875

(0-Ei)2/E 0.04085884 0.00097222 0.8859528 1.23017857 0.04630102

Obtenemos para el estadstico Ji-cuadrado un valor con grados de libertad v= -1 = 5-1 = 4 y P-valor Como el P-valor es mayor que 0.05, se acepta que la moneda est equilibrada al nivel de significacin a=0.05. 6. Se lanzaron 12 dados 26306 veces. Cada vez se anot el valor de la variable X = nmero de dados en los que sali un 5 o un 6. Los resultados obtenidos se muestran en la siguiente tabla:

*/ o

0
185

10 14

11

12

1149 3265 5475 6114 5194 3067 1331

403 105

Contrastar que los dados estn equilibrados al nivel de significacin a=0.05. Solucin Queremos contrastar la hiptesis nula //0:Los dados estn equilibrados, que es equivalente, si las pruebas son independientes, a H0:X sigue una distribucin binomial con parmetros n-\2 y /? = 1 / 3 (siendo p la probabilidad de obtener 5 6). La hiptesis alternativa es //,:no HQ. Combinando las categoras 10, 11 y 12, se obtienen los siguientes resultados:

200

Bondad de ajuste

*l
0

o
185 1149 3265 5475 6114 5194 3067 1331 403 105 18

1
2 3 4 5 6 7 8 9 10, 11 12

rf 0.00770735 0 . 0 4 6 2 4 4 0 8 0.12717122 0.21195203 0.23844604 0.19075683 0.11127482 0.04768921 0.01490288 0.00331175 0.0005438

E,

(0-Eif/Ei

202.74946 1216.49676 3345.3661 5575.61016 6272.56143 5018.04915 2927.19533 1254.51229 392.03509 87.1189088 14.3053208

1.55385541 3.74502678 1.93064357 1.81547927 4.00820749 6.1694699 6.67715753 4.66346196 0.30667985 3.67008067 0.95423615

El estadstico Ji-cuadrado es ^o = 35.49, con grados de libertad v = * - l = ll-l = 10y P-valor = P(x\Q > 35.49) < 0.005. Como el P-valor es menor que 0.05, se rechaza que los dados estn equilibrados al nivel de significacin del 5%. 7. Para los datos de altura de 60 nios, tenemos la siguiente distribucin de frecuencia construida a partir de 8 intervalos de clase de igual amplitud: Intervalo de clase [16.35, 17.25[ [17.25, 18.15[ [18.15, 19.05[ [19.05, 19.95[ [19.95, 20.85[ [20.85, 21.75[ [21.75, 22.65[ [22.65, 23.55] Frecuencia observada
4 7

Marca de clase

16.8 17.7 18.6 19.5 20.4 21.3 22.2 23.1

12
8 6

11
9 3

Contrastar si los datos proceden de una distribucin normal al nivel de significacin a=0.05.

Ejercicios

201

Solucin Sea X la variable aleatoria altura. Queremos contrastar la hiptesis nula //0: X sigue distribucin normal con media u y varianza o2 contra la alternativa H}: no H0. Puesto que // y <r2 son desconocidos, deben estimarse a partir de la informacin muestral. Los estimadores maximoverosmiles de i y a2 son, respectivamente, O, . Se puede

comprobar fcilmente que las estimaciones de /u y e2 son Jf = 19.935 y "2 =3.253. Los datos resumen, combinando las dos primeras categoras y las dos ltimas, se recogen en la siguiente tabla:

Intervalos <18.15

rf
0.1611645 0.1506579 0.1914851 0.1907084 0.1488320 0.1571317

o,
11 12 8 6 11 12

E
9 . 6 6 9 9 9.0395 11.4891 11.4425 8 . 9 2 9 9 9 . 4 2 7 9

(0-E,f/E 0.18296 0.96961 1.05960 2.58867 0 . 4 7 9 8 7 0.70171

18.15 , 19.05 19.05 , 19.95


19.95 , 20.85 20.85,21.75 >21.75

Obtenemos que el estadstico Ji-cuadrado es

con gra-

dos de libertad v = - r - l = 6-2-l = 3y P-valor = P(%\ > 5.98) e (0.1,0.25). Come el P-valor es mayor que 0.05, se acepta que los datos proceden de una distribucir normal al nivel de significacin a=0.05. 8. El tiempo de vida de 80 motores tiene la siguiente distribucin de frecuencias Tiempo hasta fallo (aos) Frecuencia de fallos

[0,1)
34

U, 2) 26

[2,3)
8

[3,4)
6

4 o ms 6

Se puede asumir que el tiempo hasta el fallo sigue una distribucin exponencial al nivel de significacin a=0.05? (Asumir que el ltimo intervalo es [4,5) al computar la media muestral). Solucin Sea X la variable aleatoria tiempo de vida. Queremos contrastar la hiptesis nula H0: X sigue una distribucin exponencial con media // contra la alternativa

202

Bondad de ajuste

//!: no H0. Puesto que ju es desconocido, debe ser estimado a partir de la informacin muestral. El estimador maximoverosmil de // es , donde x

son las marcas de clase de cada intervalo. La estimacin de u resulta

Bajo la hiptesis nula, la funcin de distribucin de la variable X es F(x) = 1 - e'xl^ . Sustituyendo // por su estimacin, podemos aproximar las probabilidades hipotticas p f . Por ejemplo, . Las dems probabilidades se calculan de la misma manera. Los datos resumen se recogen en la siguiente tabla: Intervalos

o,
34 26 8 6

P?
0 . 4 7 5 4 2 2 0 7 0.24939593 0.1308276 0.06862927 0.07572513

E
38.0337659 19.951674 10.4662078 5.4903416 6.0580104

0, 1 1, 2 2, 3 3, 4 4, 5

(0,-Eif/E, 0.42781111 1.83354273 0.58112556 0.04731066 0.00055550

Obtenemos para el estadstico Ji-cuadrado un valor con grados de libertad v = A:-r-l = 5-l-l = 3 y P-valor = P(zl ^ 2.89) e (0.25,0.50). En consecuencia, como el P-valor es mayor que 0.05, se acepta que los datos proceden de una distribucin exponencial al nivel de significacin a=0.05. 9. La distribucin muestral de una variable X es la siguiente: Intervalos
0

Frecuencia
1 7

-0.2

0.2 - 0.4 0.4 - 0.6 0.6 - 0.8

10 18 14

0.8-1

Verifiqese a un nivel de significacin del 2% si la muestra procede de una poblacin continua con funcin de distribucin

Ejercicios

203

Solucin Queremos contrastar la hiptesis nula //0: X tiene funcin de distribucin F(x) contra la alternativa H\: no // 0 . Combinando las dos primeras categoras se obtienen los resultados mostrados en la siguiente tabla: Intervalos

o
8

0.0, 0.4 0.4, 0.6 0.6, 0.8 0.8, 1.0

P? 0.16

E, 8

0.0000 0.0000 1.1429 0.8889

10 18 14

0.20 0.28 0.36

10 14 18

El valor del estadstico Ji-cuadrado es ^

Los grados de

libertad son v= k -1 = 4 -1 = 3 y P-valor = P(%\ > 2.031) e (0.50,0.75). Como el P-valor es mayor que 0.02, al nivel de significacin a=0.02 se acepta que la muestra procede de una poblacin con funcin de distribucin F(x) = x si O < x < 1. 10. Sea la siguiente muestra aleatoria de 25 observaciones (ordenadas de menor a mayor): -2.46, -2.11, -1.23, -0.99, -0.42, -0.39, -0.21, -0.15, -0.10, -0.07 , -0.02, 0.27, 0.4, 0.42, 0.44, 0.7, 0.81, 0.88, 1.07, 1.39, 1.4, 1.47, 1.62, 1 1.76. Incluir en una tabla los valores correspondientes de la funcin de distribucin emprica y de la funcin de distribucin normal tipificada. Contrastar la hiptesis de que dicha muestra aleatoria procede de una distribucin normal tipificada frente a la alternativa de que la muestra aleatoria fue seleccionada de alguna otra distribucin continua (usando el nivel de significacin a=0.05). Solucin Queremos contrastar la hiptesis nula de que la muestra procede de una distribucin normal tipificada. Usamos el test de Kolmogorov-Smirnov. La informacin necesaria para realizar dicho contraste aparece en la siguiente tabla:

204

Bondad de ajuste

i 1 2 3
4

i/n 0.04 0.08 0.12

F0(X) 0.007 0.017 0.109

\i/n-FQ(X)\ 0.033 0.063 0.011

\(i-l)/n-F0(X)\ 0.007 0.023 0.029

-2.46 -2.11 -1.23

-0.99
-0.42 -0.39

0.16
0.20 0.24

0.161
0.337 0.348

0.001
0.137 0.108

0.041
0.177 0.148

5 6
7

-0.21
-0.15 -0.10 -0.07 -0.02 0.27 0.40 0.42 0.44 0.70

0.28
0.32 0.36 0.40 0.44 0.48 0.52 0.56 0.60 0.64

0.417
0.440 0.460 0.472 0.492 0.606 0.655 0.663 0.670 0.758

0.137
0.120 0.100 0.072 0.052 0.126 0.135 0.103 0.070 0.118

0.177
0.160 0.140 0.112 0.092 0.166 0.175 0.143 0.110 0.158

8 9 10 11 12 13 14 15 16
17 18

0.81 0.88
1.07

0.68 0.72
0.76

0.791 0.811
0.858

0.111 0.091
0.098

0.151 0.131
0.138

19
20

1.39
1.40 1.47 1.62 1.64 1.76

0.80
0.84 0.88 0.92 0.96 1.00

0.918
0.919 0.929 0.947 0.949 0.961

0.118
0.079 0.049 0.027 0.011 0.039

0.158
0.119 0.089 0.067 0.029 0.001

21 22 23 24 25

En esta tabla F0(x) es la funcin de distribucin normal tipificada, es decir, F0(Xi) = &(Xi). Segn la tabla de puntos crticos del test de Kolmogorov-Smirnov, para n = 25 y a=0.05 se obtiene un valor crtico c = 0.27. El valor del estadstico de prueba coincide con el mximo de los valores que aparecen en las dos ltimas columnas de la tabla, y es Dn = 0.177. Como Dn es menor que c = 0.27, se acepta que la muestra procede de una distribucin N(Q, 1) al nivel de significacin a=0.05.

Ejercicios

205

11. Contrastar la hiptesis de que los 25 valores mustrales siguientes constituyen una muestra aleatoria de una distribucin uniforme sobre el intervalo (0,1) al nivel de significacin a=0.05. 0.42 0.06 0.88 0.4 0.9 0.38 0.78 0.71 0.57 0.66 0.48 0.35 0.16 0.22 0.08 0.11 0.29 0.79 0.75 0.82 0.3 0.23 0.01 0.41 0.09 Solucin La informacin necesaria para realizar el contraste de Kolmogorov-Smirnov aparece en la siguiente tabla: i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 ~ ^ > ~~21 ~ ~23 ~^4 25 ' ' ' ' ' ' '

x,

i/n
~ ~ ~

F0(x)

\i/n-F0(X)\

\(i-l)/n-F0(X)\

' ' ' '

0.01 0.06 0.08 0.09 Ol 0.16 O22 0.23 0.29 0.30 0.35 0.38 0.40 0.41 0.42 (X48 O57 0.66 O71 O 7 5 0/78 O79 O82 O88 0.90

~ ~

~ ~ ~

0.04 0.08 0.12 0.16 O20 0.24 O28 0.32 0.36 0.40 0.44 0.48 0.52 0.56 0.60 ( X 6 O68 0.72 O76 0.80 O84 0.88 O92 O96 1.00

0.01 0.03 O01 0.06 0.02 0.02 0.08 0.04 " 0.00 0.09 0.07 0.03 O 1 O 0 9 O05 ~0.16 0.08 0.04 O 2 2 O 0 6 O2 0.23 0.09 " 0.05 0.29 0.07 " 0.03 0.30 0.10 ' 0.06 " 0.35 0.09 ~ 0.05 "~0.38 0.10 ' 0.06 "~0.40 0.12 ' 0.08 ~~0.41 0.15 ' 0.11 ~ 0.42 0.18 ' 0.14 4 O 4 8 0.16 0.12 O57 6 7 T I 0 . 0 7 ~ 0.66 0.06 0.02 0.71 0.05 ~ 0.01 ~ 0.75 0.05 0.01 0.78 0.06 ~ 0.02 ~ 0.79 ~ 0.09 ' 0.05 0.82 ~ 0.10 ~ 0.06 0.88 0.08 0.04 0.90 0.10 0.06

206

Bondad de ajuste

En esta tabla FQ(x) es la funcin de distribucin de la distribucin uniforme en el intervalo (0,1), es decir, FQ(X) = x. Para n = 25 y a=0.05, el valor del punto crtico del test de KolmogorovSmirnov es c = 0.27. Como Dn = 0.18 < c = 0.27 , se acepta que la muestra procede de una distribucin U (0,1) al nivel de significacin a=0.05. 12. Contrastar la hiptesis de que los 50 valores que aparecen a continuacin constituyen una muestra aleatoria de una distribucin normal con media 26 y varianza 4 al nivel de significacin a=0.05. 25.088 25.996 26.560 24.432 26.303 24.317 29.263 28.478 24.078 24.466 26.615 26.516 25.844 23.593 23.016 29.778 27.924 23.896 27.228 25.153 25.468 28.240 26.964 24.644 27.378 29.585 21.579 26.020 27.433 25.893 27.453 25.980 23.382 26.849 25.351 22.147 25.320 23.750 23.341 26.796 23.845 30.432 25.282 26.801 23.601 28.352 28.129 24.904 28.923 24.743

Solucin Los resultados necesarios para realizar el contraste de Kolmogorov-Smirnov aparecen en la siguiente tabla: i
x

i/" 0.02 O04 O06 (X08 OJO O12 0.14 O16 ~0.18 0.20 O22 ~0.24 ~0.26 (X28

^o(*) 0.014 0.027 0.068 0.092 0.095 0.114 0.115 0.130 0.141 0.146 0.168 0.200 0.217 0.222

i/n-FQ(Xi)\ 0.006 0.013 0.008 0.012 0.005 0.006 0.025 0.030 0.039 0.054 0.052 0.040 0.043 0.058

|(/-l)/H-F 0 (x,.)| 0.014 0.007 0.028 0.032 0.015 0.014 0.005 0.010 0.019 0.034 0.032 0.020 0.023 0.038

1 21.579 2 22.147 3 23.016 4 23.341 5 23.382 6 23.593 7 23.601 8 23.750 9 23.845 10 23.896 ~TI24.078 12 24.317 13 24.432 ~~L424.466

Ejercicios

207

15 24.473 16 24.644 ~~1724.904 18 25.088 19 25.153 20 25.282 ~~21 25.320 22 25.351 23 25.468 24 25.844 25 25.893 ~26 25.980 27 25.996 28 26.020 ~29 26.303 30 26.516 31 26.560 32 26.615 33 26.796 ~1$426.801 35 26.849 36 26.964 ~1$727.228 ~1$827.378 ~59 27.433 40 ~ 27.453 41 ~ 27.924 ~^2 28.129 ~^328.240 ~^4 28.352 ^5 28.478 ~~46 28.923 ~* 29.263 ^8 29.585 ~49 29.778 ~~50 30.432

0.30 0.32 034 0.36 0.38 0.40 O42 0.44 O46 0.48 ~ 0.50 O52 O540. O56 O58 O600. 0.62 0.64 0.66 O68 0.70 0.72 ~ O74 O76 0/78 0.80 ~ 0.82 O84 O86 O88 O90 O92 O94 O96 O98 LOO

0.223 0.249 ~ 0.292 0.324 0.336 0.360 0.367 0.373 ~ 0.395 0.469 0.479 0.496 499 0.504 0.560 602 0.610 0.621 0.655 0.656 0.664 0.685 0.730 0.755 0.763 0.766 0.832 ~ 0.856 0.869 0.880 0.892 0.928 0.949 0.963 0.971 0.987

0.077 0.071 0.048 0.036 0.044 0.040 0.053 0.067 0.065 0.011 0.021 0.024 O041 0.056 0.020 0.002 0.010 0.019 0.005 0.024 0.036 0.035 0.010 0.005 0.017 0.034 0.012 0.016 0.009 0.000 0.008 0.008 0.009 0.003 0.009 0.013

"

"

~~

0.057 0.051 0.028 0.016 0.024 0.020 0.033 0.047 0.045 0.009 0.001 0.004 0.021 0.036 0.000 0.022 0.010 0.001 0.015 0.004 0.016 0.015 0.010 0.015 0.003 0.014 0.032 0.036 0.029 0.020 0.012 0.028 0.029 0.023 0.011 0.007

208

Bondad de ajuste

En esta tabla F0(jc7-) es la funcin de distribucin de la distribucin normal de


media 26 y varianza 4 es decir

Para = 50 y a=0.05, el valor del punto crtico del test de KolmogorovSmirnov es c = 0.192 . Como Dn = 0.077 < 0.192, se acepta que la muestra procede de una distribucin jV(26,4) al nivel de significacin a=0.05. 13. Una muestra de 26 observaciones extradas al azar de una poblacin ofreci los resultados siguientes: 0.5; 0.86; 0.56; 0.22; 0.38; 0.32; 0.21; 0.94; 0.1 0.92; 0.1; 0.48; 0.05; 0.46; 0.51; 0.38; 0.32; 0.02; 0.19; 0.32; 3.65; 0.56; 0.86; 0.39. Contrastar la hiptesis nula de que la distribucin de la poblacin es U(0,l) al nivel de significacin a=0.05. Solucin Los clculos necesarios para realizar el contraste de Kolmogorov-Smirnov aparecen en la siguiente tabla: i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
x

l n

F x

v( "> 0 . 0 2 0 . 0 5 0 . 0 7 0.10 0.14 0 . 1 9 0.21 0 . 2 2 0 . 2 4 0.32 0.32 0.32 0 . 3 8 0.38 0 . 3 9 0 . 4 6

\i/n-F0(x)\ 0.018 0.027 0.045 0.054 0.052 0 . 0 4 1 0.059 0.088 0.106 0.065 0.103 0.142 0.120 0.158 0.187 0.155 | 0.174 0.192

|(/-l)/-F 0 O,)| 0 . 0 2 0 0.012 0.007 0.015 0.014 0 . 0 0 2 0.021 0 . 0 4 9 0.068 0.026 0.065 0.103 0.082 0.120 0.148 0.117 | 0.135 0.154

0 . 0 2 0 . 0 5 0 . 0 7 0.10 0.14 0.19 0.21 0 . 2 2 0 . 2 4 0.32 0.32 0.32 0 . 3 8 0.38 0 . 3 9 0 . 4 6

0.0385 0.0769 0.1154 0.1538 0.1923 0.2308 0.2692 0.3077 0.3462 0.3846 0.4231 0.4615 0 . 5 0 0 0 0.5385 0.5769 0.6154

0 . 4 8 0.6538 0 . 4 8 | 0 . 5 0 | 0.6923 | 0.50

Ejercicios

209

19 20 21 22 23 24 25 26

0.51 0.56 0.56 0.65 0.86 0.86 0.92 0.94

0.7308 | 0.7692 0.8077 0.8462 0.8846 0.9231 0.9615 1.0000

0.51 0.56 0.56 0.65 0.86 0.86 0.92 0.94

O221 0.209 0.248 0.196 0.025 0.063 0.042 0.060

0.182 0.171 0.209 0.158 0.014 0.025 0.003 0.022

En esta tabla F((x) es la funcin de distribucin de la distribucin uniforme en el intervalo (0,1), es decir, F0(x) = x. Para n = 26 y a=0.05, el valor del punto crtico del test de Kolmogorov-Smirnov es c = 0.26. Como Dn = 0.248 < c = 0.26 , se acepta que la muestra procede de una distribucin t/(0,l) al nivel de significacin a=0.05. 14. Una muestra aleatoria de 20 observaciones proporcion los valores siguientes: 0.46,0.14, 2.46, -0.32, -0.07, 0.29, -0.29, 1.3,0.24, -0.96,0.06, -2.53, -0.53, -0.19, 0.54, -1.56, 0.19, -1.19, 0.02, 0.53. Contrastar la hiptesis de que la muestra procede de una distribucin normal tipificada al nivel de significacin =0.05. Solucin Los datos resumen para realizar el contraste de Kolmogorov-Smirnov aparecen en la siguiente tabla: i 1 2 3
4

*/ -2.53 -1.56 -1.19


-0.96

// 0.05 0.10 0.15


0.20

FoM 0.006 0.059 0.117


0.169

\i/n-F0(X)\ 0.044 0.041 0.033


0.031

|(/-l)/-F 0 (jf,.)| 0.006 0.009 0.017


0.019

5 6 7 8 9 10

-0.53 -0.32 -0.29 -0.19 _o.07 0.02

0.25 0.30 0.35 0.40 0.45 0.50

0.298 0.374 0.386 0.425 0.472 0.508

0.048 0.074 0.036 0.025 0.022 0.008

0.098 0.124 0.086 0.075 0.072 0.058

210

Bondad de ajuste

11 | 12 13 14 15 16 17 18 19 20

0.06 | 0.14 0.19 0.24 0.29 0.46 0.53 0.54 1.30 2.46

0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00

0.524 0.556 0.575 0.595 0.614 0.677 0.702 0.705 0.903 0.993

0.026 0.044 0.075 0.105 0.136 0.123 0.148 0.195 0.047 0.007

0.024 0.006 0.025 0.055 0.086 0.073 0.098 0.145 0.003 0.043

En esta tabla FQ(x) es la funcin de distribucin de la distribucin normal tipificada, es decir, F0(x) = O(jc,). Para = 20 y =0.05, el valor del punto crtico del test de KolmogorovSmirnov es c = 0.294. Como Dn = 0.195 < c = 0.294, se acepta que la muestra procede de una distribucin ,/V(0,l) al nivel de significacin a=0.05. 15. En un banco se registr el tiempo de servicio (en minutos) a 15 clientes elegidos al azar, y se obtuvieron los siguientes resultados: 7, 3, 2, 7, 5, 4, 9, 15, 6, 1, 6, 8, 10, 1, 2. Contrastar a un nivel de significacin del 5% la hiptesis de que el tiempo de servicio es exponencial con media 5 minutos. Solucin La siguiente tabla presenta los resultados de los clculos necesarios para realizar el contraste de Kolmogorov-Smirnov. i 1 2 3 4 5 6 7 8 9 x, 1 1 2 2 3 4 5 6 6 Un 0.0667 0.1333 0.2000 0.2667 0.3333 0.4000 0.4667 0.5333 0.6000 F0(*,.) 0.181 0.181 0.330 0.330 0.451 0.551 0.632 0.699 0.699 \i/n-F0(X)\ 0.115 0.048 0.130 0.063 0.118 0.151 0.165 0.165 0.099 [ |(/-l)//i-F0Qof 0.181 0.115 0.196 0.130 0.185 0.217 0.232 0.232 0.165

Ejercicios

211

10 11 12 13 14 15

7 7 8 9 10 15

0.6667 0.7333 0.8000 0.8667 0.9333 1.0000

0.753 0.753 0.798 0.835 0.865 0.950

0.087 0.020 0.002 0.032 0.069 0.050

0.153 0.087 0.065 0.035 0.002 0.017

En esta tabla FQ(x) es la funcin de distribucin de la distribucin exponencial con media 5, es decir, FQ(X) = 1 exp( x /5). El valor del estadstico de prueba es Dn =0.232. Para n = 15 y a = 0.05, el valor del punto crtico del test de Kolmogorov-Smirnov es c = 0.338. Como Dn - 0.232 < c = 0.338 , se acepta que la muestra procede de una distribucin Exp(\/5) al nivel de significacin a=0.05. 16. El tiempo de fallo (en horas) de 10 pilas de transistor se registr con los siguientes resultados: 28.9, 15.2, 28.7, 72.5, 48.6, 52.4, 37.6, 49.5, 62.1, 54.5. Contrastar a un nivel de significacin del 5% la hiptesis de que los tiempos de fallo proceden de una distribucin exponencial con media 45 minutos. Solucin Los datos resumen para realizar el contraste de Kolmogorov-Smirnov aparecen en la siguiente tabla: i 1 2 3 4 5 6 7 8 9 10
x

iln 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

o(*/) 0.287 0.472 0.474 0.566 0.660 0.667 0.688 0.702 0.748 0.800

\iln-FQ(x}\ 0.187 0.272 0.174 0.166 0.160 0.067 0.012 0.098 0.152 0.200

|(/-l)/-F 0 (x ; .)| 0.287 0.372 0.274 0.266 0.260 0.167 0.088 0.002 0.052 0.100

15.2 28.7 28.9 37.6 48.6 49.5 52.4 54.5 62.1 72.5

En esta tabla F0(x) es la funcin de distribucin de la distribucin exponencial con media 45, es decir,

212

Bondad de ajuste

El valor del estadstico de prueba es Dn = 0.372. Para n = 10 y =0.05, el valor del punto crtico del test de Kolmogorov-Smirnov es c = 0.410. Como Dn = 0.372 < c = 0.410, el test de Kolmogorov-Smirnov acepta que el tiempo de fallo sigue una distribucin Exp(l/45) al nivel de significacin del 5%.

CAPITULO 7 CONTROL DE CALIDAD

1. INTRODUCCIN En este captulo estudiaremos el control estadstico de la calidad de un proceso de fabricacin como aplicacin inmediata de los captulos de estimacin y contraste de hiptesis. Las tcnicas estadsticas de control de la calidad se desarrollaron inicialmente para procesos industriales. Si un proceso existe cuando se combinan unos elementos de entrada (inputs) para dar como resultado un elemento de salida (output), se entiende que cualquier actividad empresarial, tanto en el sector industrial como en el de servicios, es un proceso y por tanto se le pueden aplicar las tcnicas estadsticas de control de calidad. Decimos que un producto tiene calidad si es adecuado para el uso. Una empresa produce productos de alta calidad si cumplen las demandas del mercado. Si los productos de una empresa son de calidad pobre la empresa sufrir una prdida de ventas. En un proceso de fabricacin se puede observar que no todos los productos finales son iguales, aunque lo sean las condiciones iniciales. Esto sugiere modelizar un proceso de fabricacin con una variable aleatoria que identifica la caracterstica de calidad. Para controlar la variable de calidad se construye un grfico de control (o carta de control), que es la representacin grfica en el tiempo del funcionamiento del proceso comparado con unos lmites calculados estadsticamente. Se pueden construir varios tipos de cartas de control. Si la caracterstica de calidad es una variable medible (variable cuantitativa), como por ejemplo la longitud, el peso, etc., el control de calidad se llama control por variables y usa grficos de control para medidas de tendencia central (generalmente la media aritmtica X) y de variabilidad (usualmente la desviacin tpica S o el rango R ), ya que la calidad de un producto frecuentemente puede resumirse en trminos de estas dos medidas. Si la caracterstica de calidad es una variable cualitativa (variable categrica), como ocurre cuando un artculo se clasifica como defectuoso o no defectuoso, el control de

214

Control de calidad

calidad se llama control por atributos y requiere un grfico de control para controlar la fraccin de defectuosos (/>). Finalmente, si la caracterstica de calidad es el nmero de defectos c que aparecen en una unidad, el control de la calidad se llama control por nmero de defectos. An cuando el proceso de produccin est funcionando correctamente son inevitables variaciones aleatorias en la calidad del producto. La variabilidad de una caracterstica de calidad en un proceso de fabricacin puede atribuirse a dos tipos de causas: no asignables y asignables. Las causas de variabilidad no asignables son aleatorias, imprevisibles e inevitables, y estn siempre presentes, produciendo una variabilidad homognea y estable que es predecible al ser constante. Por ejemplo, pequeos cambios en la materia prima, la vibracin de las mquinas e instrumentos de medida, etc., producen una proporcin de elementos defectuosos constante a largo plazo que no tiende a aumentar ni a decrecer. En cambio, las causas asignables son causas de variabilidad que pueden descubrirse y corregirse y que intervienen slo en determinados momentos produciendo una variabilidad que no es constante: por ejemplo, el fallo de una mquina, un lote de materia prima mala, etc., dan como resultado un proceso inestable sobre el que no se puede predecir la variabilidad de las caractersticas de salida. Cuando un procedimiento de fabricacin funciona libre de toda causa asignable se dice que est bajo control estadstico. Es decir, un proceso de produccin est bajo control estadstico si la variabilidad de la caracterstica de calidad es aleatoria al proceder slo de causas no asignables, en cuyo caso la media no se desva y la dispersin no aumenta ni disminuye en el transcurso del tiempo. Cuando el proceso no est bajo control estadstico es porque ha aparecido alguna causa asignable que puede dar lugar a variaciones importantes de la variable de calidad, siendo sus valores futuros impredecibles. Las situaciones de control estadstico y de no control estadstico se ilustran en la figura 1.1.

Figura 1.1.

215

Para detectar si existen causas asignables de variacin que afectan a un proceso y poder identificarlas, se establece un esquema de control de calidad para dicho proceso. Este control requiere tomar, a lo largo del tiempo, una sucesin de pequeas muestras del producto. Si la variable de calidad es una variable medible se suelen tomar muestras de 4 5 observaciones, mientras que si la variable de calidad es cualitativa los tamaos mustrales son ms grandes. Para obtener un registro razonable del funcionamiento del proceso productivo y poder iniciar el control estadstico de la calidad es necesario disponer de 25 o ms muestras. A partir de estas muestras se determinan un lmite de control inferior y un lmite de control superior para una medida resumen de la variable de calidad. Estos lmites de control tienen como objetivo reflejar la variacin de la medida resumen de calidad cuando la nica variabilidad existente procede de causas no asignables, es decir, cuando el proceso est bajo control estadstico. Para facilitar el control, los lmites de control se dibujan en un grfico de control. Como es posible que en el momento de extraer alguna de las muestras el proceso estuviera fuera de control es importante no utilizar en el clculo de los lmites de control aquellas muestras afectadas por causas asignables.

Figura 1.2. Ejemplo de proceso fuera de control (arriba) y bajo control (abajo).

216

Control de calidad

En la figura 1.2 estn representadas dos cartas de control, correspondientes a dos procesos de produccin, construidas extrayendo 25 muestras en intervalos regulares de tiempo. En la primera carta de control se observa que la octava muestra se encuentra fuera de los lmites de control. Cuando en una muestra hay, como en este ejemplo, cambios de la calidad fuera de lo normal, se considera muy probable la aparicin de causas asignables, que hacen que el sistema quede fuera de control. Dicho de otro modo, este valor extremo es extremadamente extrao para un proceso que est bajo control y probablemente no es resultado de la variabilidad aleatoria sino que puede deberse a alguna causa asignable. Esta muestra se desecha y se calculan nuevos lmites de control con el resto de muestras. Los nuevos lmites de control calculados con las 24 muestras restantes pueden utilizarse, si ninguna de ellas cae fuera de los nuevos lmites, para establecer si son correctas otras muestras tomadas de la lnea de produccin en el futuro. As es posible controlar el proceso e identificar y eliminar las causas asignables que puedan aparecer. En la segunda carta de control de la figura 1.2 se observa un patrn de puntos distribuidos ms o menos aleatoriamente alrededor de la lnea central de la carta y generalmente alejados de los lmites de control. Estas circunstancias sugieren que el proceso estaba bajo control en el momento de tomar todas las muestras. En este caso es posible establecer la capacidad del proceso de produccin para cumplir las especificaciones de diseo. Si el proceso resulta ser capaz de producir bienes o servicios de acuerdo a los requisitos, entonces la produccin puede continuar en su estado actual y debe controlarse regularmente mediante grficos de control. Una vez determinados los lmites de control se comienzan a tomar muestras a intervalos fijos de tiempo. Para cada muestra se calcula la medida resumen de la variable de calidad y el valor obtenido se representa en el grfico de control. Si dicho valor est comprendido entre las lneas lmites de control se concluye que el proceso est bajo control. En cambio si el valor del estadstico resumen se sale fuera de las lneas de control se concluye que ha aparecido alguna causa asignable (el proceso est fuera de control) y entonces se hace necesario revisar el proceso en busca de algn posible desajuste que se ha de corregir. La frecuencia con que deben tomarse las muestras depende de las caractersticas del proceso de produccin. Al fijar una determinada frecuencia de muestreo, el objetivo es detectar la aparicin de causas asignables de variabilidad tan pronto como sea posible para que puedan ser corregidas cuanto antes. Si la frecuencia del muestreo es muy alta, la rapidez en la deteccin de cambios en el proceso es mayor, pero tambin es mayor el coste de la inspeccin. En la prctica se debe establecer un equilibrio adecuado entre la frecuencia de muestreo y el coste de muestreo. En general, al comienzo del estudio del proceso se suelen tomar muestras a intervalos muy cortos con el fin de detectar posibles cambios o inestabilidades en el proceso. Una vez que el proceso se va estabilizando, el intervalo de toma de muestras puede ir aumentando. Pasado algn tiempo, cuando el proceso haya evolucionado, deben recalcularse los lmites de control de los grficos. Tambin deben hacerse comprobaciones peridicas sobre la capacidad del proceso. El control de la calidad de un proceso de produccin tiene como objetivos:

217

1) Descubrir las causas asignables que aparecen en el proceso lo antes posible. Este objetivo es equivalente a contrastar H0 : el proceso est bajo control, frente a //! : existe alguna causa asignable. 2) Medir la capacidad del proceso para producir artculos buenos. 3) Determinar las causas de variabilidad y de esta forma mejorar el proceso de produccin reduciendo la variabilidad en la calidad del producto. 2. CONTROL DE CALIDAD DE FABRICACIN POR VARIABLES 2.1. Introduccin Supongamos que la calidad de un producto en un proceso de fabricacin est descrita por una caracterstica medible X cuyo valor especificado de diseo es u .El intervalo de tolerancia tcnico, denotado como ju + L = \_LT\, LT2], es el rango de valores que son vlidos para X. Los lmites del intervalo de tolerancia tcnico son establecidos por la direccin. Supongamos que el proceso se ajusta de manera que la distribucin de X en la fabricacin est centrada en u. Supongamos adems que cuando el proceso de fabricacin est bajo control la caracterstica de calidad sigue una distribucin normal con media u y desviacin tpica a. De este modo, bajo control, X ~ N(JU, a2). El objetivo del control estadstico de la calidad es mantener el proceso en estado de control comprobando que los parmetros que definen la distribucin de la variable de calidad X permanecen constantes a lo largo del tiempo. Cuando el proceso est bajo control P(JL-?> a<X<n + 3 o) = 0.9973, de modo que bajo control el 99.73% de los artculos producidos estarn en el intervalo [/J-3 <7,u + 3 cr]. Este intervalo se denomina intervalo de tolerancia natural del proceso. Sus lmites, llamados lmites 3 (7 de tolerancia natural, describen la naturaleza del proceso productivo, son los lmites de calidad que puede esperarse que satisfaga el proceso en estado de control. Por esta razn, si la caracterstica de calidad es una variable continua, la capacidad del proceso se define como 6 veces la desviacin tpica de la distribucin de la caracterstica de calidad en condiciones de control estadstico. Luego la capacidad del proceso es 6cr y coincide con la amplitud del intervalo de tolerancia natural del proceso. Para determinar si el proceso cumple los estndares para los cuales se dise es necesario comparar los lmites de tolerancia natural entre los que el proceso funcionar habitualmente con los lmites de especificacin tcnica fijados por la direccin. En muchas ocasiones ocurre, y es deseable, que el centro del intervalo de tolerancia natural (la media del proceso) est muy cerca del centro del intervalo de tolerancia tcnico (el valor especificado de diseo). Este hecho permite conocer la capacidad del proceso o adecuacin del producto al fin para el que est concebido, comparando los lmites // + 3(7 y u + L. El ndice de capacidad del proceso, que se denota por IC, se define como el cociente entre la amplitud del intervalo de tolerancia tcnico y la amplitud del intervalo de tolerancia natural, es decir, IC = (LT2 -L7j)/6<7. Cuanto mayor es el ndice de capacidad, menor es la probabilidad de fabricar productos

218

Control de calidad

que no cumplen la especificacin tcnica. Un proceso con IC<\ no se considera aceptable pues no es capaz de cumplir las especificaciones fijadas. Lo deseable es que el intervalo de tolerancia natural caiga holgadamente dentro del intervalo de tolerancia tcnico para poder decir entonces que el proceso de produccin es capaz de cumplir las especificaciones. En este caso, cuando el proceso est bajo control al menos el 99.73% de la produccin cumple las normas especificadas por el tcnico. El criterio ms utilizado es considerar que el proceso es aceptable slo cuando IC> 1.33. Esto implica que la capacidad del proceso no debe ser mayor del 75% de la amplitud del intervalo de tolerancia tcnico. Si IC < 1.33, entonces se deben tomar acciones apropiadas para reducir la variabilidad no asignable. Estas acciones se deben dirigir a cambiar el proceso o el producto con el fin de producir un producto que cumpla las especificaciones tcnicas. Una vez determinada la capacidad del proceso y comprobado que es aceptable se establecen los grficos para controlar el proceso en el futuro. Los grficos de control por variables ms usados son los diseados para registrar las medidas de tendencia central (media) y de variabilidad (desviacin tpica o rango). El tamao de las muestras suele ser n = 4 5. La frecuencia de inspeccin por muestreo ser menor cuanto mayor sea el ndice de capacidad. Cada vez que alguna de las medidas resumen (media, desviacin tpica o rango) se sale de sus respectivos lmites de control se considera que el proceso se ha desajustado por la aparicin de alguna causa asignable. Es entonces fundamental revisar cuanto antes el proceso de fabricacin en busca de causas asignables que deben ser eliminadas para que el proceso retorne al estado de control. 2.2. Parmetros conocidos Como se ha indicado, bajo control estadstico la caracterstica de calidad X cumple que X ~ N(ju, <7 2 ). En este apartado se describen los lmites de las cartas de control para la media, la desviacin tpica y el rango para el caso en que los parmetros n y cr son conocidos y, en consecuencia, la capacidad del proceso es conocida. 2.2.7. Lmites de control para la media Si X ~ N(ju, cr 2 ), entonces la media muestral X de una m.a.s. de tamao n cumple que En otras pala-

bras, si el proceso est bajo control, entonces un promedio de slo 27 por cada 10000 valores de testarn fuera del intervalo Los lmites de este

intervalo se llaman lmites de control tapara la media. El lmite inferior se llama lmite de control inferior para X y se denota por LCL^ , mientras que el

219

lmite superior Si

e llama lmite de control superior y se denota por

entonces los lmites de control para la media son

Para facilitar el control, los lmites para la media muestral se representan en un grfico similar a los grficos de la figura 1.2. En este grfico la escala vertical se asigna a los valores de las medias, dejando la escala horizontal para el tiempo entre las distintas tomas de datos. La lnea central esta situada en \i y las dos lneas paralelas representan los lmites de control. 2.2.2. Lmites de control para la desviacin tpica Supongamos que en cada muestra la variabilidad de la caracterstica de calidad se mide por la desviacin tpica muestral S. Si X ~ N(ju,a ) (el proceso est bajo control estadstico), puede comprobarse que la media y la desviacin tpica de la desviacin tpica muestral son, respectivamente,

El intervalo de control 3(7 para S es

con B Bajo control estadstico, (obsrvese que segn la desigualdad de Chebichev esta probabilidad es mayor o igual que 0.89). En consecuencia, cuando el proceso est bajo control casi todas las muestras de tamao n tendrn desviaciones tpicas dentro de los lmites de control para S. El hecho de que alguna desviacin tpica muestral se salga de sus lmites de control constituye un fuerte indicio de que cuando se extrajo la muestra exista alguna causa asignable que afectaba a la variabilidad del proceso. En estos casos, el proceso debe ser revisado, y si se detectan causas asignables deben ser eliminadas. 2.2.3. Lmites de control para el rango Supongamos que se decide controlar la variabilidad del proceso mediante el rango muestral R. Si X ~ N(ju,(72) (el proceso est bajo control estadstico), puede comprobarse que entonces la media y la desviacin tpica del rango muestral se pueden escribir, respectivamente, como E ( R } = d2oy cjR=d^a, donde d2 y d3 son constantes que dependen del tamao muestral. Adems, bajo control estadstico se cumple que P(E(R)-3&R < R < E(R) + 3<7R] = 1. En consecuencia, el intervalo de control 3cr para R es [LCLR,UCLR] = ff(d2 +3d3)=[<jD\,(jD2], donde D, = d2-3d3 y >2 = / 2 +3/ 3 .

220

Control de calidad

2.3. Parmetros desconocidos Cuando se decide implantar el control estadstico de la calidad en un proceso de fabricacin lo ms comn es que los parmetros /z y <J sean desconocidos. Estos parmetros definen la situacin de control y es necesario estimarlos antes de iniciar el control de la calidad. Para este fin, se toman varias muestras de la lnea de produccin de modo que cada muestra corresponda a un tiempo diferente y adems se pueda suponer que en la produccin de los artculos de una misma muestra actan los mismos factores. El nmero de muestras, que se denota por k, suele ser mayor o igual que 25 y el tamao muestral n es 4 5. Entonces se calculan para cada muestra j (j = !,...,&) la media aritmtica X y la desviacin tpica S (o el rango Rj si la variabilidad se va a controlar mediante esta medida de dispersin). Recurdese que para una muestra de tamao n estas medidas resumen se calculan mediante

Para estimar la media del proceso se usa // = X = !^ <j se realiza mediante o = , donde o = !

. La estimacin de

. Otra manera de estimar

(7 consiste en usar el rango muestral. En este caso, la estimacin de Jes o = con . Suponiendo que todas las muestras corresponden a situaciones de control estadstico, se puede comprobar que estos estimadores son insesgados para sus respectivos parmetros. Sin embargo, en la prctica no se sabe si todas las muestras se han obtenido en momentos de control, por lo que las estimaciones obtenidas usando todas las muestras se consideran como preliminares o provisionales. Si en las frmulas de los lmites de control para X y S (o R) descritas en el apartado de parmetros conocidos se sustituyen // y a por sus estimaciones provisionales ju y O se obtienen lmites de control provisionales. Si la variabilidad se mide usando la desviacin tpica, entonces sustituyendo i y respectivamente, obtenemos por una parte que los lmites de control para la media muestral son
3S,

donde

por otra parte que el intervalo de control para la desviacin tpica es

donde B

221

De forma anloga, si la variabilidad se mide usando el rango, entonces sustiluyendo fi y <J por control para la media son intervalo de control 3apara R es , respectivamente, encontramos que los lmites de Adems, el

donde D Para decidir si las k muestras se han obtenido en momentos en que el proceso estaba bajo control se comprueba si cada X y S (o R.) est dentro de sus correspondientes lmites de control provisionales. Si alguna medida resumen cae fuera de sus lmites de control, entonces se eliminan las muestras correspondientes, se recalculan las estimaciones de fj y o (usando slo las muestras no eliminadas) y con estas estimaciones se obtienen nuevos lmites de control. Este proceso se repite tantas veces como sea necesario hasta que todas las medidas resumen de las muestras no eliminadas estn dentro de sus respectivos lmites de control. Con las estimaciones finales de // y o se puede estudiar la capacidad del proceso y decidir si el proceso tiene el potencial suficiente para producir bienes o servicios de acuerdo a las especificaciones tcnicas. Para estimar la capacidad del proceso se sustituye la desviacin tpica (7 por su estimacin final. Una vez estimada la capacidad del proceso se comparan los lmites de tolerancia natural con los lmites de tolerancia tcnica, se calcula el ndice de capacidad y se selecciona la frecuencia de muestreo. Si la capacidad del proceso es aceptable, los lmites de control provisionales calculados con las estimaciones finales de f y o se convierten en lmites de control definitivos y se usan para controlar el proceso en el futuro. Estos lmites de control expresan el comportamiento de las medidas resumen de la variable de calidad cuando la nica fuente de variacin es debida a causas no asignables y permiten detectar la aparicin de causas asignables de variacin en el futuro. 2.4. Resumen Las expresiones para las lneas centrales y los lmites de control de las cartas de control por variables se presentan en la tabla 2.1. Todas las constantes que aparecen en las diferentes expresiones de las cartas de control para medias, desviaciones tpicas y rangos, se ofrecen calculadas para distintos tamaos de muestra en la tabla 2.2.

222

Control de calidad

Tabla 2.1. Tabla resumen del control por variables Parmetros conocidos Carta para Lnea central u c4<7 d2a Lmites de control // + A a B5o,B6o D^o, D2a Parmetros desconocidos Lnea central X S R Lmites de control
=

Medias Desviaciones tpicas Rangos

X+A3S _ X+A2R B3S,B4S

D3R,D4R

Tabla 2.2. Constantes usadas en las cartas de control


n
Estimacin de ff c4 /2 3 Cartas de medias A 2 A3 A Cartas de/? Dl A, D 3
4

10

15

20

25

0.798

0.886 0.921 0.940 2.326 0.864 0.577

0.952 0.959 2.534 2.704 0.848 0.833

0.965 2.847 0.820

0.969 2.970 0.808 0.337

0.973 3.078 0.797 0.308

0.982 3.472 0.755 0.223 0.789 0.775 1.207 5.737 0.348

0.987

0.990

1.128 1.693 2.059 0.853 0.888 0.880

3.735 3.931 0.729 0.709 0. 0.606

1.880 1.023 0.729 2.659

0.483 0.419 0.373

0.180 0.680

1.954 1.628 1.427 1.287

1.182 1.099 1.032 0.975

2.121 1.732 1.500 1.342 1.225 1.134 1.061 1.000 0.949 O 3.686 O 0 0 0 0 0.205 0.387 5.307 0.546 5.394 0.687 5.469

0.671 0.600 1.548 5.922 1.8 6.058

4.358 4.698 0 0 2.282 0 0

4.918 5.078 5.203 O O 0.076

0.136 0.184 0.223

0.414 0.459 1.541

D 3.267 53 O

2.575

2.115 2.004 O 2.089 0 O

1.924 1.864 1.816 1.777 1.652 1.586 0.284 0.428

Cartas de 5
4

0.030 0.118 0.185 0.239

0.510 0.565 1.435 0.559

B 3.267 B5 B6 O

2.568 2.266 0

1.970 1.882 1.815 1.761 1.716 1.572 1.490 0.029 0.113 0.179 0.232 0.276 0.421 0.504

2.606

2.276 2.088

1.964 1.874 1.806 1.751 1.707 1.669 1,544 1.470 1.420

223

3. CONTROL DE CALIDAD POR ATRIBUTOS En esta seccin suponemos que la caracterstica de calidad es un atributo que un artculo puede o no poseer y que permite clasificarlo en correcto o defectuoso. En este caso la calidad se controla mediante una carta de control para la proporcin de artculos defectuosos del proceso de fabricacin. Suponemos que bajo control estadstico la proporcin de artculos defectuosos es p. Entonces la capacidad del proceso para producir artculos no defectuosos se mide mediante la proporcin de artculos no defectuosos fabricados en estado de control, de modo que la capacidad del proceso se define como 1 - p. Si p es conocido, el control de la calidad se realiza midiendo la fraccin de artculos defectuosos en muestras de tamao n elegidas al azar a intervalos fijos de tiempo. Denotemos por d el nmero de artculos defectuosos en una muestra de tamao n. Entonces la fraccin de artculos defectuosos, que denotamos por p, es
, d p = . El control de la calidad por atributos se puede realizar mediante una carta n de control para la fraccin muestral de defectuosos o mediante una carta de control para el nmero de defectuosos.

3.1. Cartas de control para la fraccin de defectuosos Bajo control estadstico, el nmero de artculos defectuosos en una muestra de tamao n sigue una distribucin B(n,p) y la fraccin de artculos defectuosos cumple que E(p) - p y cr~ = ,/ . En consecuencia, si p es conocido los

lmites de control 3cr para la fraccin de defectuosos en una muestra de tamao n * Si p es desconocido, antes de iniciar el control de calidad se toman k muestras de tamao n, donde k > 25 y n > 50. Entonces p se estima mediante con d el nmero de defectuosos encontrados en la /-sima muestra, i=l,...,k. Los lmites de control tentativos para la proporcin muestral de defectuosos son Si alguno de los valores cae fuera de los lmites de control tentativos, entonces se supone que en el momento de extraer las muestras correspondientes a estos pi operaba alguna causa asignable, se eliminan estas muestras y se recalculan el estimador de p y los lmites de control tentativos para p . El procedimiento se repite hasta que todos

224

Control de calidad

los pi usados para construir el grfico de control caen dentro de los lmites de control. A partir de ese momento los lmites de control se convierten en definitivos y se usan para controlar el proceso en el futuro. 3.2. Cartas de control para el nmero de defectuosos Supongamos que en vez de controlar la calidad mediante un grfico de control para p se decide usar un grfico de control para el nmero de defectuosos d. Si p es conocido, los lmites de control para d son , mientras que si p es desconocido los lmites de control para d son LCL 4. CONTROL DE CALIDAD POR NMERO DE DEFECTOS Una aplicacin habitual del control de calidad consiste en inspeccionar una unidad ya terminada y contar el nmero de defectos o imperfecciones de determinado tipo. En este caso la variable de calidad es el nmero de defectos (no conformidades) por unidad de inspeccin, que se denota por c. Supongamos que bajo control estadstico la variable de calidad c sigue una distribucin de Poisson con media ., es decir, c~P/>( .). La capacidad del proceso se mide por /I. Por tanto, bajo control estadstico se tiene que E(c) = y Por el teorema central del lmite, c sigue aproximadamente una distribucin N(A, A). Si A es conocido, el control de la calidad se realiza midiendo la variable c en unidades de inspeccin elegidas al azar a intervalos fijos de tiempo. Los lmites de la carta de control para c son L Cuando el valor de c en una unidad de inspeccin se sale fuera de los lmites de control, el proceso productivo se revisa en busca de alguna causa asignable. Si el valor de c est dentro de los lmites, el proceso contina sin revisin hasta que se toma la siguiente unidad de inspeccin. Si es desconocido, entonces es necesario estimar este parmetro. Para ello se toman k (&>25) unidades de inspeccin. Entonces A se estima mediante , con c el nmero de defectos en la z'-sima unidad de inspeccin, i=l,...,k. Suponiendo que el proceso estaba bajo control en el momento de tomar las k muestras, se tiene que E(c) = . En este caso, los lmites de control para c son

Ejercicios

225

EJERCICIOS 1. En un determinado proceso productivo se quiere establecer una carta de control para la proporcin de defectuosos utilizando muestras de tamao 100 tomadas de hora en hora. El nmero de defectuosos encontrados en 20 muestras fue 3, 2, 1, 2, 3, 2, 1, 1, 2, 4, 2, 1, 1, 3, 2, 2, 1, 3, 1, 3 (el nmero total de defectuosos fue 40). a) Obtener los lmites de control 3crpara la proporcin de defectuosos. Est el proceso productivo bajo control estadstico? b) Si el proceso est bajo control cuando produce un 2% de defectuosos, calcular la probabilidad de concluir errneamente que no lo est. c) Si el proceso se desajusta pasando a producir un 10% de defectuosos, cul es la probabilidad de detectar el desajuste en a lo sumo las tres primeras muestras despus de haberse producido? Cul es el tiempo medio necesario para detectar el desajuste? d) Si se sabe que bajo control estadstico la probabilidad de defectuoso p es menor de 0.05 y se quiere estimar p mediante la proporcin muestral con un error menor que 0.01 y una confianza al menos de 0.99, cul es el nmero total de observaciones que se necesitan? Solucin a) La estimacin de la probabilidad de defectuoso es tamao comn de las muestras. As, tentativos para la proporcin de defectuosos son donde d es y los lmites de control

el nmero de defectuosos en la muestra z, k es el nmero de muestras y n es el

Como p no puede ser negativa, Sea d = nmero de defectuosos en muestras de tamao 100. Los lmites 3(7
para d son

Como todos los d de las muestras para iniciar el control pertenecen a [0,6.2], aceptamos que el proceso productivo est bajo control estadstico, y tomamos los lmites de control tentativos como vlidos para controlar la calidad del proceso productivo.

226

Control de calidad

b) Sea S el suceso concluir que el proceso est fuera de control al tomar una muestra de tamao 100. La probabilidad pedida es P(S/p = 0.02), probabilidad del error de tipo I del procedimiento estadstico. Como S es equivalente a d > 6.2 , donde d ~ 5(100, p), la probabilidad de concluir errneamente que el proceso est fuera de control es P(S/p = 0.02) = P(d >6.2/p = 0.02) = P(d>l/p = 0.02). Utilizando que, cuando p = 0.02, d sigue aproximadamente una distribucin de Poisson con parmetro A = 100-0.02 = 2 , obtenemos que c) Si el proceso se desajusta (se sale de control estadstico) deseamos que nuestro procedimiento nos lleve a descubrir el desajuste con alta probabilidad. El proceso productivo se para y revisa cuando la proporcin muestral se sale de los lmites de control para p. El suceso detectar el desajuste en las tres primeras muestras es equivalente a detectar el desajuste en la primera muestra o en la segunda muestra o en la tercera muestra. La probabilidad de detectar el desajuste en una muestra es 0.87. En consecuencia, la probabilidad de detectar el desajuste en a lo sumo las tres primeras muestras es ^(detectar en la primera)+P(no detectar en la primera y detectar en la segunda)+P(no detectar en la primera y no detectar en la segunda y detectar en la tercera) = 0.87 + 0.13 0.87 + 0.13 0.13 0.87 = 0.998 . Como el nmero de muestras necesario para detectar el desajuste sigue una distribucin geomtrica con probabilidad de xito 0.87, el nmero medio de muestras necesario es 1/0.87 = 1.149 . Teniendo en cuenta que las muestras se toman de hora en hora, el tiempo medio necesario para detectar el desajuste es 1.149 horas = 1 hora y 9 minutos, d) Por el teorema central del lmite sabemos que para n grande se cumple que . Por tanto,

P(S/p = 0.02) = P(d>l/A = 2) = l-P(d< 6/A = 2) = 1-0.9955 = 0.0045.

donde Z~#(0,l). Deseamos que P\ Z < 0.01 / Luego

o,

equivalentemente,

> 0.99 . Puesto que p < 0.05, entonces p(\ -p)< 0.05 0.95 . , y para que

basta con elegir un tamao muestral n tal que lo que conduce a

Ejercicios

227

de donde n > 0.05-0.95-2582 = 3161.79 . El tamao de muestra necesario es, pues, 3162. 2. Para controlar la calidad de los fusibles fabricados por cierta empresa se decide inspeccionar diariamente 50 fusibles escogidos al azar de la produccin durante un perodo inicial de 20 das. El nmero de fusibles defectuosos encontrados cada uno de los das fue: 2, 3, 7, 3, 2, 2, 1, 4, 2, 3, 4, 1, 3, O, 1, 2, 1, 1, 2, 1. a) Utilizando los lmites de control adecuados, est previsiblemente el proceso bajo control estadstico? Si no lo est, estabilizar razonablemente el proceso y proponer una estimacin de la proporcin de fusibles defectuosos. Qu lmites son adecuados para extender el grfico de control a perodos posteriores? b) Supongamos que el proceso est bajo control estadstico cuando los parmetros de la caracterstica de calidad son los calculados en a). Si tras un desajuste en la mquina la fraccin de defectuosos aumenta en 0.01, qu probabilidad hay de que dicho cambio se detecte en la primera muestra tras el desajuste? Solucin a) Con 20 muestras de tamao 50 tenemos que = 50, k = 20 y p = -^ = 0.045. 20-50 Los lmites de la carta de control para el nmero de fusibles defectuosos son [LCLd,UCLd] = np + 3^np(l-p) - [0,6.65]. Observamos, pues, que el proceso parece no estar bajo control ya que en la tercera muestra se han observado 7 fusibles defectuosos y este valor est fuera de los lmites de control. Por tanto, eliminamos esta muestra y recalculamos nuevos lmites. Ahora = 50, k = 19 y 38 p= = 0.04. Los nuevos lmites de control para d-np sern 19-50 \LCLd,UCLd~\ = [0,6.157]. Ya que d toma valores enteros, los verdaderos lmites para d sern [LCLj,UCLd] = [0,6] Puesto que ninguna muestra cae fuera de estos lmites, utilizaremos stos para el posterior control estadstico del proceso. b) Si la fraccin de defectuosos aumenta en 0.01, entonces p = 0.04 + 0.01 = 0.05 . Por tanto, d ~ 5(50,0.05) y con la aproximacin de Poisson d~y>(2.5). La probabilidad de detectar este cambio ser P(d > 7) = 0.0142 , que es una probabilidad pequea. 3. En una fbrica de llantas se sabe que bajo control estadstico la proporcin de llantas defectuosas es p = 0.07 . Se desea controlar la calidad de las llantas producidas en el futuro usando cada da una muestra de 50 llantas. a) Cules son los lmites 3<rde la carta de control para la proporcin de llantas defectuosas? Si el sistema de fabricacin est bajo control estadstico, cul es la probabilidad de concluir equivocadamente que el proceso est fuera de control?

228

Control de calidad

b) Si el proceso pasa a producir un 8% de llantas defectuosas, cul es la probabilidad de que para advertir por primera vez este cambio se necesiten a lo sumo tres muestras? Solucin a) Los lmites para la carta de control de la proporcin de llantas defectuosas son Usando la aproximacin de Poisson a la binomial, . Por tanto, la probabilidad de concluir equivocadamente que el proceso est fuera de control es b) Si ahora p = 0.08, entonces /~3a(4). Por tanto, la probabilidad de detectar el cambio en una muestra es P(p > 0.1781 p- 0.08) = P(d > 8.912 / A = 4) = 0.021. Detectar el cambio en a lo sumo tres muestras significa: detectarlo en la 1a muestra o no detectarlo en la 1a y s en la 2a o no detectarlo en la 1a ni en la 2a y s en la 3a. Por tanto la probabilidad de detectar el cambio en tres muestras, a lo sumo, es 4. Para montar el control de calidad en una fbrica de ladrillos se tomaron 25 muestras de 5 ladrillos y se midi la resistencia a la presin, resultando que la media de las 25 medias mustrales fue X = 210 y la media de las 25 desviaciones tpicas mustrales fue S = 15.8. a) Calcular los lmites 3cr de las cartas de control para las medias mustrales y para las desviaciones tpicas mustrales. Suponiendo que bajo control los parmetros del proceso son iguales a las estimaciones mustrales, calcular la probabilidad de que se detecte una disminucin en la resistencia media a la presin de 10 unidades. b) Si el sistema de fabricacin est bajo control al nivel encontrado en el apartado a), qu proporcin de ladrillos verifica los lmites de especificacin tcnica 200 + 45 ? Solucin ) Tenemos que k = 25 y n = 5. Los lmites para la carta de medias son para la carta de desviaLa probabilidad de que se ciones tpicas son [ detecte una disminucin en la resistencia media a la presin de 10 unidades es

b) La proporcin de ladrillos dentro de la especificacin tcnica, suponiendo que el sistema est bajo control en

Ejercicios

229

5. Para controlar la calidad en la produccin de tuercas, se establece un proceso de control que consiste en muestrear a determinada hora de la jornada laboral 100 tuercas de la produccin y anotar cuntas son defectuosas (no cumplen los criterios de calidad exigidos por la normativa vigente). Los resultados de los 30 primeros das de muestreo fueron 1, 2, 1, O, 1, 2, 1, 1, 2, O, 1, 2, 5, 1, O, 2, 1, O, 1, 9, 2, 1, O, 2, 1, O, 8, 1, O, 1 (en total se encontraron 49 tuercas defectuosas). a) Llevar el proceso a control estadstico encontrando lmites de control vlidos para extender a perodos siguientes, y obtener una estimacin de la proporcin de tuercas defectuosas cuando este proceso es estable. b) Supongamos que el proceso es estable al nivel encontrado en el apartado a). Si el proceso se desajusta aumentando la proporcin de defectuosos en 0.04 respecto del valor encontrado en el apartado a), qu probabilidad hay de detectar el desajuste en los tres primeros das despus de su ocurrencia? Solucin a) Los lmites de control para la carta de la proporcin p son

luego
de control para el nmero de tuercas defectuosas

los
d

limites
son

. Como vemos, los valores 9 y 8 estn fuera de los lmites de control. Eliminndolos y recalculando nuevos lmites tenemos que p . De nuevo el . Luego los lmites de control para d son [0,3] y y la estimacin de p es b) Si p = 0.05, entonces d~y>(5) y, en consecuencia, la probabilidad de detectar el aumento en un da es P(d > 3) = 1- P(d < 3) = 0.735 y la probabilidad de detectarlo en los tres primeros das es 0.735 + 0.265 0.735 + 0.265 0.265 0.735 = 0.98. 6. En una empresa se llevan cartas de control para X y S relativas al lmite de rotura de una pieza. Se tomaron 25 muestras de tamao 4, obtenindose Suponiendo que las muestras se tomaron cuando el proceso estaba bajo control:

valor 5 est fuera de los lmites de control. Recalculando obtenemos

230

Control de calidad

a) Calcular los lmites 3(7 de las cartas para X y S. Cul es la estimacin insesgada de <f! b) Si // aumenta 30 unidades y cr no cambia, cul es la probabilidad de que el cambio sea detectado en, a lo sumo, tres muestras obtenidas despus del desarreglo? c) Cuntas observaciones se necesitan para que X difiera de ju menos de 4 unidades con probabilidad igual a 0.95? Solucin a) Tenemos que 4 tabla 2.2 obtenemos A control para X son ICj =X+A3S= 273.6 T 1.628-14.3292 = [250.2721,296.9279]. Los lmites de control para S son LC La estimacin insesgada de b) La probabilidad de que un punto X caiga dentro de los lmites de control es
p a r a la

Los lmites de

Por tanto, la probabilidad de que un punto se salga fuera de los lmites de control (probabilidad de detectar el cambio en una X fija) es 1 - 0.1949 = 0.8051. El suceso contrario de detectar en al menos una de tres muestras es no detectar en ninguna de las tres muestras. Por tanto, la probabilidad de detectar en al menos una de las tres muestras es 1-(0.1949)3 =0.9926. c) Se desea que P(\X - u <4\ = 0.95, luego

y, por tanto,

= z0025 = 1.96 . Suponiendo que el proceso bajo control tenemos y entonces v de modo que = 58.1188.

Luego con n = 59 observaciones se logra lo que queremos.

Ejercicios

231

7. En un proceso de fabricacin, bajo control estadstico de la calidad se tiene que u = 24 y 7 = 5. Supongamos que la variable de calidad X es normal y se toman muestras de tamao n = 5 para controlar la calidad. a) Calcular los lmites de control 3<7 para la carta de medias y para la carta de desviaciones tpicas. b) Una empresa compradora enva a un inspector con las siguientes instrucciones: si un punto de la carta de medias se sale fuera de sus lmites o un punto de la carta de desviaciones tpicas se sale los suyos, se rechaza toda la produccin entre la toma de la muestra anterior y la presente. Cul es la probabilidad de que, de la produccin de cuatro perodos sea aceptada la de dos de ellos y rechazada la de los otros dos? c) Suponiendo que <J= 5 y i es desconocida, y que se desea estimar fi con un error menor que 1.5 unidades con probabilidad mayor que 0.90, cuntas observaciones deben tomarse? Solucin a) Los lmites de control para la carta de medias son Los lmites de control para la carta de

desviaciones tpicas son b) Suponiendo que el proceso est bajo control estadstico, la probabilidad de que la media de una muestra caiga dentro de los lmites de la carta de medias es P(jU- AG< X <ju + Aa) = 0.9973, mientras que la probabilidad de que la desviacin tpica caiga dentro de los lmites de la carta de desviaciones tpicas es

Suponiendo que la variable de calidad sigue una distribucin normal, los estadsticos X y S son independientes, y en consecuencia la probabilidad de que para una muestra tanto X como S caigan dentro de los lmites de sus respectivas cartas es

As, la probabilidad de que sea aceptada la produccin de un perodo es 0.9929. Por tanto, la probabilidad de que de la produccin de cuatro perodos sea aceptada la de dos de ellos y rechazada la de los otros dos es que es equivalente a

En consecuencia,

232

Control de calidad

de donde se deduce que n > 29.9 , es decir, se necesitan 30 observaciones. 8. Para controlar la calidad de fabricacin de tornillos por una mquina automtica se toman muestras de 100 tornillos de la produccin de las dos ltimas horas, y para cada tornillo se prueba si cumple la tolerancia usando un calibrador fijo. El nmero de tornillos defectuosos encontrados en 20 muestras sucesivas tom los siguientes valores: 1, 2, O, 1, 2, 5, 6, 3, 6, 2, 1, 1, O, O, 2, O, 3, 1, 4, O (el total de tornillos defectuosos fue 40). Suponiendo que todas estas muestras se obtuvieron cuando la mquina automtica estaba bajo control estadstico y que se usan cartas de control 3a: a) Cul es la probabilidad aproximada de que una muestra caiga fuera de los lmites de control cuando la mquina est bajo control estadstico? b) Si la mquina se desajusta produciendo una proporcin de tornillos defectuosos del 5%, cul es la probabilidad de que se requieran a lo sumo dos muestras para detectar el desajuste? Cul es el nmero medio de muestras requeridas para detectar el desajuste? c) Denotemos por p la probabilidad de tornillo defectuoso. Si se desea estimar p con un error de estimacin menor que 0.01 y con una probabilidad de al menos 0.95, cuntas muestras de 100 tornillos se requieren cuando sabemos que la probabilidad de tornillo defectuoso es inferior a 0.04? Cuntas muestras se requieren cuando no se tiene informacin a priori sobre la probabilidad de tornillo defectuoso? Solucin a) Para las 20 muestras, la estimacin de p es p = control para la carta de p son Se observa que ninguna muestra cae fuera de los lmites. Por lo tanto, si la mquina est bajo control estadstico, denotando por d el nmero de tornillos defectuosos en una muestra de tamao 100, se tiene que d ~ 5(100,0.02) y, aproximadamente, J~9^(2). Luego la probabilidad de que una muestra caiga fuera de los lmites de control es b) Si p = 0.05 , d sigue una distribucin binomial con n = 100 y p = 0.05 y, de forma aproximada, d~'3P(5}. La probabilidad de detectar el desajuste es l-P(0<d < 6) = I-0.1622 = 0.2378 . La probabilidad de que se requieran a lo sumo dos muestras para detectar el desajuste es 0.2378 + 0.7622-02378 = 0.419 . Sea Y la v.a. nmero de muestras necesarias para detectar el desajuste. El nmero medio de muestras requeridas para detectar el desajuste es la esperanza de Y. Como Y sigue una distribucin geomtrica con parmetro 0.2378, la esperanza de Y es = 0.02 . Los lmites de

Ejercicios

233

c) Se desea que equivalente a de muestras de tamao n. Por tanto mos que

. Esta desigualdad es aproximadamente donde es el nmero de donde deducisi de donde se obtiene ue entonces

Si p es desconocido, debemos considerar que p(\ p] < 1 / 4 para todo /?, es decir ^p(l-p) < l / 2 para todo p. Por tanto, obtiene que 9. Una empresa fabrica pelotas de tenis y considera que una caracterstica de calidad de las mismas es la altura que alcanzan despus del rebote, en cada libre desde una altura determinada, sobre el suelo. Las especificaciones tcnicas fijadas para dicha altura son de 55 + 10 cm. a) La empresa desea establecer un control de la calidad por dicha variable. Si para iniciar una grfica de control para la media muestral se han tomado 20 muestras de tamao 5 y J se han obtenido los resultados cules son los lmites 3crpara dicha grfica de control? Suponiendo que el proceso est bajo control, qu porcentaje de pelotas puede fabricar el proceso dentro de las especificaciones? b) Si la empresa considera defectuosa toda pelota que no cumpla las especificaciones y quiere llevar a cabo un control estadstico de la calidad por el nmero de pelotas defectuosas tomando muestras de 100 pelotas cada da, cules son los lmites 3(7 de la carta de control suponiendo que el proceso est bajo control con una proporcin de pelotas defectuosas del 0.5%? Cul es la probabilidad de detectar un aumento del 1 % en la proporcin de pelotas defectuosas en la primera muestra que se tome despus de haberse producido dicho aumento? Solucin a) Los lmites de control 3cr para la carta de medias son , de donde se

Suponiendo que X sigue una distribucin normal, el porcentaje de pelotas dentro de especificaciones es

234

Control de calidad

Luego el proceso puede fabricar un 97.93% de pelotas dentro de las especificacio-

nes. b) Los lmites de control para el nmero de pelotas defectuosas en una muestra de tamao n = 100 son
Si p = 0.015, entonces d ~ 5(100,0.015) y aproximadamente d~3(1.5). En consecuencia, la probabilidad de detectar un aumento del 1% es

10. En dos cadenas de produccin A y B de placas base de ordenador se establece un proceso de control de la calidad segn la proporcin de placas defectuosas. De la produccin de un da se toma una muestra de 50 placas de cada cadena, encontrndose 2 placas defectuosas en la cadena A y 3 en la B. a) Contrastar a un nivel de significacin del 5% si las dos cadenas estn produciendo placas de la misma calidad. b) Si las cadenas de produccin se encontraban bajo control en el momento en que se tomaron las muestras y se utilizan limites de control 3<T, cul es el tamao muestral necesario para detectar en la cadena A un aumento del 1 % en la proporcin de placas defectuosas con una probabilidad 0.95? Solucin a) Sean pA y pB las proporciones de placas defectuosas de las cadenas A y B respectivamente. Queremos contrastar HQ:pA = pB = p contra H\:pA^pB a un nivel de significacin del 5%. Los resultados mustrales son = 50, . Como los tamaos mustrales son grandes, realizaremos un contraste asinttico. El estadstico de prueba es
s la prOporcin

de defectuosos en la muestra combinada (siendo dA el nmero de placas defectuosas de la muestra de A, dB el nmero de placas defectuosas de la muestra de B, y nA y nB los tamaos mustrales respectivos). Sustituyendo los resultados mustrales resulta el contraste con-

cluye que las dos cadenas estn produciendo la misma proporcin de placas defectuosas.

Ejercicios

235

b) Si denotamos por pA la proporcin de placas defectuosas de la cadena A en estado de control, tenemos que pA = 0.04 . Se desea que la probabilidad de detectar que A p = 0.05 sea 0.95,
Luego

Por tanto,

de donde se obtiene que

Potrebbero piacerti anche