Sei sulla pagina 1di 50

Clculo de la potencia del contraste

Recordemos que la potencia de un contraste estadstico es el complementario del error tipo II (1-).

Potencia
Tambin se defini como P Rechazar0 0 = fals) La potencia representa la probabilidad de poder detectar el efecto de inters que estamos buscando. Es de lo ms importante!

Ejemplo 2.6
Supongamos que la duracin media de una lmpara de bajo consumo de una determinada marca es de 1000 horas con un desviacin tpica de 220 horas. La empresa que las fabrica introduce un nuevo proceso de fabricacin y afirma que la vida media de las nuevas es superior a las antiguas. Vamos a suponer que como hiptesis alternativa nica se plantea un promedio de duracin de 1060 horas. Tomando un nivel de significacin del 5%, determinar el error tipo II y la potencia de la prueba, si el estudio se realizara con un muestra de 100 lmparas.

Hiptesis
Aunque usualmente los contrastes se plantean con hiptesis exhaustivas y mutuamente excluyentes, para calcular la potencia de contraste se han de plantear dos hiptesis en las que slo figura el signo igual. 0 : = 1000 1 : = 1060

Asumiendo que la Sx es la misma en ambas distribuciones tendramos dos distribuciones poblacionales parcialmente solapadas con medias 1000 y 1060 y desviacin tpica 220.

Pero como estamos cogiendo muestras de n = 100, trabajamos con la distribucin muestral de la media con desviaciones tpicas
_ =

220 = 100

Si las vemos en un rango ms apropiado, podremos trabajar mejor con ellas.

Y esto es lo que se ha hecho en el texto para tener una mejor representacin.

Lgica a seguir
Z=(X-m)/s

En este grfico se muestra claramente la lgica del clculo: computamos el valor del tiempo de rotura de la lmpara (X) que deja por debajo de s 1- en la distribucin H0.

A continuacin, determinamos el valor de X si H1 fuese cierta (no H0). Obsrvese que los ejes de ambas distribuciones son el mismo (las grficas deberan estar solapadas) y deben estar en correspondencia oportuna.

1 step: distribucin muestral de las duraciones medias de las lmparas antiguas.


= 0 _
_

En las tablas de la curva normal buscamos la Z que deja por encima de s el 0.05 de la distribucin.

1 step: distribucin muestral de las duraciones medias de las lmparas antiguas.


= 0 _
_

Luego si Z = 1.64 deja por encima de s el 0.05 de la distribucin a qu valor Directo (X) se corresponde esta Z en la distribucin de las lmparas antiguas?

Luego sabiendo que Z = 1.64, que la media de la distribucin de tiempo en la distribucin antigua es de 1000 horas y que el error tpico viene dado (conocemos la desviacin tpica poblacional, ) por el cociente entre Y y la raz cuadrada del nmero de lmparas utilizadas:

Ahora solamente debemos despejar el valor de horas correspondiente a una Z = 1.64.

Resultado:

Observamos que calculando la media de tiempo utilizando la Normal tipificada, tenemos el valor crtico 1.64 (correspondiente a una Y media de 1036,1 horas) si utilizamos la distribucin de las lmparas antiguas.

Pero cunto sr este valor en el nuevo tipo de lmparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo truco que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.

Pero cunto sr este valor en el nuevo tipo de lmparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo truco que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.

Ahora buscamos en las tablas la probabilidad de este valor de Z. Resulta valer 0.1379.

Por ltimo, volvemos a la distribucin de puntuaciones directas (distribucin muestral de las medias con N = 100) y vemos que la probabilidad del rea gris () es la probabilidad de cometer un error tipo II. Luego su complementario (rea amarilla) ser 1- , la potencia.

1 = 1 0.1379 = 0.8621

Luego la probabilidad de que los resultados de la investigacin permitan rechazar H0 cuando es realmente falsa es de 0.86. Recordemos que el contraste se ha realizado asumiendo que H0 era cierta.

Si se rechazara la hiptesis nula de que el promedio de duracin es de 1000 horas, pero en realidad esta hiptesis fuera verdadera (es decir, el nuevo proceso de fabricacin no alarga la duracin) entonces estaramos cometiendo un error (tipo I) del 5%.

Por otro lado, si se acepta la hiptesis nula, pero la alternativa es la verdadera, la probabilidad de cometer este error (tipo II) es del 13,79%. Por tanto, la potencia de la prueba es del 86,21% (1 0,1379 = 0,8621).

Ejemplo 2.7
Para contrastar la presunta habilidad detectora de la dama se preparan 16 tazas de t, siguiendo ambos procedimientos: en ocho se vierte primero la leche, y en otros ocho se vierte primero la infusin. La presentacin se realiza al azar y la dama slo tiene que decir cul ha sido el procedimiento (primero la leche y despus el t, o a la inversa).

Supongamos, por ejemplo, que la dama acierta en 12 ocasiones. Vamos a utilizar este dato como hiptesis alternativa, para calcular la potencia de un contraste unilateral derecho con un nivel de significacin de 0,05. En este caso, la hiptesis nula es que la seora no puede realizar esta discriminacin (0 = 0,5 ) en relacin a lo que sucedera si la seora puede, efectivamente, realizarla con una probabilidad superior al azar (H1) que, en este caso, hemos supuesto igual a 0,75 = 12/16 = 3/4.

Si la probabilidad de acertar es del 50% (8 ocasiones con n = 16) concluimos que la seora no tiene esa habilidad. Pero incluso aunque no lo tenga, la seora no tiene porqu acertar 8 de las 16 veces inexcusablemente. Habr cierta variabilidad en el nmero de aciertos INCLUSO aunque H0 sea cierta.

Por ello debemos preguntarnos a partir de qu nmero de aciertos procederamos a rechazar la hiptesis nula con un nivel de significacin de 0,05?. Consultamos en la tabla de la distribucin binomial para n=16 y p=0,5 (H0) el nmero de aciertos superiores a 8 (que representa en este caso el 50%) y cuya suma sea al menos igual o menor que el alfa fijado.

Observamos que n (nmero de ensayos), x es el nmero de aciertos posibles (x <= n) y los valores de probabilidad no son acumulados.

Bajo la H0

< 0.05 0.0278 + 0.0085 + 0.0018 + 0.0002 + 0.0000 = 0.0383 < 0.05 Acierta 12 o ms ocasiones

Esto para H0 y para H1?


Sabiendo que la potencia corresponde a la probabilidad de rechazar la hiptesis nula cuando es falsa, es decir, cuando la dama s tiene esa habilidad y que esta decisin se toma cuando es capaz de acertar en 12 o ms ocasiones, la potencia del contraste se obtiene calculando la probabilidad de acertar en 12 o ms ocasiones cuando la dama s tiene esa habilidad.

Esto para H0 y para H1?


La dama tendr eta habilidad si p=0,754 . Por consiguiente, acudimos a la tabla de la distribucin binomial con n=16, p=0,75. Pero esta probabilidad no aparece en la Tabla!

Esto para H0 y para H1?


Esto quiere decir que si la probabilidad de acertar es 0,75, la de fallar es 0,25. Entonces la probabilidad de tener 12 aciertos (con p=0,75) en N=16 ensayos es la misma que la probabilidad de tener 4 fallos (con p=0,25) en esos mismos 16 ensayos. Y esta probabilidad de p=0,25 s que figura en la tabla binomial.

12 aciertos o ms (4 fallos o menos) en 16 ensayos (con p = 0.75) es lo mismo que 4 aciertos o menos en 16 ensayos con p = 0.25.

Tabla de la distribucin binomial para N = 16 y p =0,25. 0.2252 + 0.2079 + 0.1336 + 0.0534 + 0.0100 =
0.6302 = 1-

En trminos grficos

Por consiguiente, para calcular la potencia de un contraste se necesita que la H0 y la H1 sean simples. Cuando H1 es compuesta (plantea ms de un valor como media poblacional), la potencia del contraste vara en funcin de dos factores:
La distancia entre el valor de H0 y H1 (cuando H0 y H1 son simples, esta distancia est fijada). El tamao muestral.

En este caso y para un mismo valor del error tipo I (), se pueden confeccionar lo que se denominan curvas de potencia, las cuales permiten fcilmente localizar la potencia de un contraste segn sea el valor que puede tomar H1 y el tamao de la muestra.

Curvas de potencia para un fijado

Se puede ver que para un tamao muestral de 100, la potencia, efectivamente, est por encima de 0,85.

Nivel crtico p y errores en los contrastes


En las pruebas clsicas de contrastes es preciso establecer el error tipo I (mximo riesgo que estamos dispuestos a admitir al tomar una decisin) antes de realizar el contraste, de modo que este valor no influya en la decisin final que se toma. No obstante, establecer previamente un nivel de error tipo I, presenta algn inconveniente que puede ser decisivo en la decisin que se tome.

Inconvenientes
La decisin que se tome sobre puede depender del nivel de significacin que se establezca, y se puede dar la circunstancia de que sea rechazada con un nivel del 5% y no serlo con el 1%. Determinar cun pequeo debe ser depender de factores que pueden ser simplemente las creencias previas sobre los procesos de toma de decisin que se han realizado anteriormente sobre la misma o parecida cuestin y tambin sobre las consecuencias que se deriven al tomar una decisin errnea.

Inconvenientes
Debido a estos inconvenientes, en el anlisis de datos moderno se ha introducido el denominado nivel crtico p, que se define como el nivel de significacin ms pequeo al que una hiptesis nula puede ser rechazada con la medida de discrepancia obtenida. Nivel crtico p es la probabilidad asociada a la medida de discrepancia que hemos obtenido a partir de la informacin obtenida en nuestra muestra y cuantifica la probabilidad de obtener unos datos como los obtenidos en lainvestigacin o ms extremos bajo el supuesto de que la hiptesis nula es verdadera.

Al utilizar como criterio para la decisin el nivel crtico p no hay que establecer previamente un nivel de significacin, y sta se toma en funcin del valor de p. Si p es pequeo se rechazar , y si es grande se aceptar . Obviamente persiste el problema de determinar qu es grande y qu pequeo. Entonces para tomar una decisin hay que recurrir al criterio del grado de cercana o alejamiento de p a, por ejemplo, el valor 0,05. Si es claramente inferior, se rechaza , si es claramente superior se acepta , y si est en torno a ese valor, se vuelve a tomar nueva evidencia muestral y se repite el contraste.

No obstante, el empleo del nivel crtico p como criterio de decisin tampoco est exento de problemas, ya que, al igual que las medidas de discrepancia observada entre y la evidencia muestral, depende del tamao de la muestra utilizada. Es por ello que se han explorado nuevas medidas, independientes del tamao muestral: el tamao del efecto.

Potencia? Para eso primero tenemos que confiar en el producto


En 1876, un documento interno de la compaa Western Union, aseguraba lo siguiente: El llamado telfono tiene demasiadas limitaciones para considerarlo seriamente un medio de comunicacin. No posee ningn valor para nosotros.

Potencia? Para eso primero tenemos que confiar en el producto


Por otro lado, en 1943, Thomas Watson, presidente de la empresa IBM, estaba poco convencido sobre el futuro del mercado informtico: Creo que en el mundo hay mercado para unos cinco ordenadores como mucho.

Potrebbero piacerti anche