Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Recordemos que la potencia de un contraste estadstico es el complementario del error tipo II (1-).
Potencia
Tambin se defini como P Rechazar0 0 = fals) La potencia representa la probabilidad de poder detectar el efecto de inters que estamos buscando. Es de lo ms importante!
Ejemplo 2.6
Supongamos que la duracin media de una lmpara de bajo consumo de una determinada marca es de 1000 horas con un desviacin tpica de 220 horas. La empresa que las fabrica introduce un nuevo proceso de fabricacin y afirma que la vida media de las nuevas es superior a las antiguas. Vamos a suponer que como hiptesis alternativa nica se plantea un promedio de duracin de 1060 horas. Tomando un nivel de significacin del 5%, determinar el error tipo II y la potencia de la prueba, si el estudio se realizara con un muestra de 100 lmparas.
Hiptesis
Aunque usualmente los contrastes se plantean con hiptesis exhaustivas y mutuamente excluyentes, para calcular la potencia de contraste se han de plantear dos hiptesis en las que slo figura el signo igual. 0 : = 1000 1 : = 1060
Asumiendo que la Sx es la misma en ambas distribuciones tendramos dos distribuciones poblacionales parcialmente solapadas con medias 1000 y 1060 y desviacin tpica 220.
Pero como estamos cogiendo muestras de n = 100, trabajamos con la distribucin muestral de la media con desviaciones tpicas
_ =
220 = 100
Lgica a seguir
Z=(X-m)/s
En este grfico se muestra claramente la lgica del clculo: computamos el valor del tiempo de rotura de la lmpara (X) que deja por debajo de s 1- en la distribucin H0.
A continuacin, determinamos el valor de X si H1 fuese cierta (no H0). Obsrvese que los ejes de ambas distribuciones son el mismo (las grficas deberan estar solapadas) y deben estar en correspondencia oportuna.
En las tablas de la curva normal buscamos la Z que deja por encima de s el 0.05 de la distribucin.
Luego si Z = 1.64 deja por encima de s el 0.05 de la distribucin a qu valor Directo (X) se corresponde esta Z en la distribucin de las lmparas antiguas?
Luego sabiendo que Z = 1.64, que la media de la distribucin de tiempo en la distribucin antigua es de 1000 horas y que el error tpico viene dado (conocemos la desviacin tpica poblacional, ) por el cociente entre Y y la raz cuadrada del nmero de lmparas utilizadas:
Resultado:
Observamos que calculando la media de tiempo utilizando la Normal tipificada, tenemos el valor crtico 1.64 (correspondiente a una Y media de 1036,1 horas) si utilizamos la distribucin de las lmparas antiguas.
Pero cunto sr este valor en el nuevo tipo de lmparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo truco que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.
Pero cunto sr este valor en el nuevo tipo de lmparas que tienen una media de 1060 horas y asumimos que la misma Sx que las antiguas? Utilizamos el mismo truco que antes pero a la inversa ya que ahora conocemos todos los valores de la Z.
Ahora buscamos en las tablas la probabilidad de este valor de Z. Resulta valer 0.1379.
Por ltimo, volvemos a la distribucin de puntuaciones directas (distribucin muestral de las medias con N = 100) y vemos que la probabilidad del rea gris () es la probabilidad de cometer un error tipo II. Luego su complementario (rea amarilla) ser 1- , la potencia.
1 = 1 0.1379 = 0.8621
Luego la probabilidad de que los resultados de la investigacin permitan rechazar H0 cuando es realmente falsa es de 0.86. Recordemos que el contraste se ha realizado asumiendo que H0 era cierta.
Si se rechazara la hiptesis nula de que el promedio de duracin es de 1000 horas, pero en realidad esta hiptesis fuera verdadera (es decir, el nuevo proceso de fabricacin no alarga la duracin) entonces estaramos cometiendo un error (tipo I) del 5%.
Por otro lado, si se acepta la hiptesis nula, pero la alternativa es la verdadera, la probabilidad de cometer este error (tipo II) es del 13,79%. Por tanto, la potencia de la prueba es del 86,21% (1 0,1379 = 0,8621).
Ejemplo 2.7
Para contrastar la presunta habilidad detectora de la dama se preparan 16 tazas de t, siguiendo ambos procedimientos: en ocho se vierte primero la leche, y en otros ocho se vierte primero la infusin. La presentacin se realiza al azar y la dama slo tiene que decir cul ha sido el procedimiento (primero la leche y despus el t, o a la inversa).
Supongamos, por ejemplo, que la dama acierta en 12 ocasiones. Vamos a utilizar este dato como hiptesis alternativa, para calcular la potencia de un contraste unilateral derecho con un nivel de significacin de 0,05. En este caso, la hiptesis nula es que la seora no puede realizar esta discriminacin (0 = 0,5 ) en relacin a lo que sucedera si la seora puede, efectivamente, realizarla con una probabilidad superior al azar (H1) que, en este caso, hemos supuesto igual a 0,75 = 12/16 = 3/4.
Si la probabilidad de acertar es del 50% (8 ocasiones con n = 16) concluimos que la seora no tiene esa habilidad. Pero incluso aunque no lo tenga, la seora no tiene porqu acertar 8 de las 16 veces inexcusablemente. Habr cierta variabilidad en el nmero de aciertos INCLUSO aunque H0 sea cierta.
Por ello debemos preguntarnos a partir de qu nmero de aciertos procederamos a rechazar la hiptesis nula con un nivel de significacin de 0,05?. Consultamos en la tabla de la distribucin binomial para n=16 y p=0,5 (H0) el nmero de aciertos superiores a 8 (que representa en este caso el 50%) y cuya suma sea al menos igual o menor que el alfa fijado.
Observamos que n (nmero de ensayos), x es el nmero de aciertos posibles (x <= n) y los valores de probabilidad no son acumulados.
Bajo la H0
< 0.05 0.0278 + 0.0085 + 0.0018 + 0.0002 + 0.0000 = 0.0383 < 0.05 Acierta 12 o ms ocasiones
12 aciertos o ms (4 fallos o menos) en 16 ensayos (con p = 0.75) es lo mismo que 4 aciertos o menos en 16 ensayos con p = 0.25.
Tabla de la distribucin binomial para N = 16 y p =0,25. 0.2252 + 0.2079 + 0.1336 + 0.0534 + 0.0100 =
0.6302 = 1-
En trminos grficos
Por consiguiente, para calcular la potencia de un contraste se necesita que la H0 y la H1 sean simples. Cuando H1 es compuesta (plantea ms de un valor como media poblacional), la potencia del contraste vara en funcin de dos factores:
La distancia entre el valor de H0 y H1 (cuando H0 y H1 son simples, esta distancia est fijada). El tamao muestral.
En este caso y para un mismo valor del error tipo I (), se pueden confeccionar lo que se denominan curvas de potencia, las cuales permiten fcilmente localizar la potencia de un contraste segn sea el valor que puede tomar H1 y el tamao de la muestra.
Se puede ver que para un tamao muestral de 100, la potencia, efectivamente, est por encima de 0,85.
Inconvenientes
La decisin que se tome sobre puede depender del nivel de significacin que se establezca, y se puede dar la circunstancia de que sea rechazada con un nivel del 5% y no serlo con el 1%. Determinar cun pequeo debe ser depender de factores que pueden ser simplemente las creencias previas sobre los procesos de toma de decisin que se han realizado anteriormente sobre la misma o parecida cuestin y tambin sobre las consecuencias que se deriven al tomar una decisin errnea.
Inconvenientes
Debido a estos inconvenientes, en el anlisis de datos moderno se ha introducido el denominado nivel crtico p, que se define como el nivel de significacin ms pequeo al que una hiptesis nula puede ser rechazada con la medida de discrepancia obtenida. Nivel crtico p es la probabilidad asociada a la medida de discrepancia que hemos obtenido a partir de la informacin obtenida en nuestra muestra y cuantifica la probabilidad de obtener unos datos como los obtenidos en lainvestigacin o ms extremos bajo el supuesto de que la hiptesis nula es verdadera.
Al utilizar como criterio para la decisin el nivel crtico p no hay que establecer previamente un nivel de significacin, y sta se toma en funcin del valor de p. Si p es pequeo se rechazar , y si es grande se aceptar . Obviamente persiste el problema de determinar qu es grande y qu pequeo. Entonces para tomar una decisin hay que recurrir al criterio del grado de cercana o alejamiento de p a, por ejemplo, el valor 0,05. Si es claramente inferior, se rechaza , si es claramente superior se acepta , y si est en torno a ese valor, se vuelve a tomar nueva evidencia muestral y se repite el contraste.
No obstante, el empleo del nivel crtico p como criterio de decisin tampoco est exento de problemas, ya que, al igual que las medidas de discrepancia observada entre y la evidencia muestral, depende del tamao de la muestra utilizada. Es por ello que se han explorado nuevas medidas, independientes del tamao muestral: el tamao del efecto.