Inferencia Estadística

ESTADSTICA
Dr. Carlos E. Mendoza Durn.
INFERENCIA ESTADSTICA 2
Cmo le fue con su tarea? Poco a poco las tareas se empiezan a parecer a lo que siempre haba sido la
estadstica!
Prueba de hiptesis
Hoy vamos a hablar de otra forma de hacer la inferencia. En la sesin pasada revisamos la estimacin,
puntual y de intervalo. Repasamos tambin los casos ms comunes de estimacin.
La forma de inferir a la que nos referimos se llama genricamente prueba de hiptesis. La palabra
prueba aqu se debe entender como una puesta a prueba de la hiptesis para ver si la declaramos falsa o
verdadera. Una prueba de hiptesis estadstica es una prueba fundamentalmente emprica. Se trata de
confrontar la hiptesis con los hechos.
La situacin es similar a la de la minera donde se ensayan muestras de mineral para determinar el
grado de metal que contienen. De acuerdo al resultado de los ensayes, se establece si vale la pena la
explotacin de la mina.
Una hiptesis, de manera abstracta, en el contexto estadstico, es una afirmacin sobre el valor de un
parmetro.
Para que la prueba tenga inters debe tratarse de un parmetro con un significado muy claro y,
de preferencia, debe indicarnos alguna accin a seguir.
La afirmacin puede ser falsa o verdadera, al proponer una hiptesis estadstica no estamos
pensando que esa hiptesis sea verdadera. El objetivo de la prueba es, precisamente, decidir si
la muestra indica que la hiptesis es falsa o es verdadera.
Una prueba de hiptesis hace uso slo de la informacin que est en la muestra. Si en alguna
situacin poseyramos informacin aparte de la muestra, hay que disear un mecanismo
especfico para usar esa otra informacin.
De acuerdo al smil con la minera, podemos equivocarnos. Una muestra, por azar, puede
resultar alta en contenido de metal y llevarnos a excavar una mina pobre; de la misma forma,
una muestra pobre en metal puede hacernos abandonar la idea de excavar en un sitio que sea
muy rico.
Un ejemplo
Las hiptesis
Veamos un ejemplo para precisar la idea de una prueba estadstica. Supongamos que la compaa,
(nuestra compaa!), est contemplando una mejora en la rutina de produccin que nos va a volver
ms competitivos porque va a permitir reducir los costos. La nueva rutina ha sido probada en algunas
otras partes y ha funcionado; adems, hace las cosas de una manera ms lgica que la rutina actual.
Decidimos ponerla a prueba a ver si lo que esperamos de ella se verifica o n. Para que nos decidamos
a implantarla de forma definitiva, requerimos ver resultados de ella.
La prueba la vamos a hacer analizando si el costo promedio por artculo producido mejora y para eso,
vamos a considerar el promedio de artculos producidos. Pero vamos a adoptar el nuevo mtodo slo si
mejora en un 30% al promedio actual que es de 60.4 artculos, es decir slo cambiaramos la rutina si el
promedio se eleva a 78.5 o ms.
Para tener una mejor base de comparacin, vamos a repetir la operacin cincuenta veces y
calcularemos el promedio de estas 50 veces.
En el ejemplo tenemos una hiptesis: ``la media poblacional bajo el nuevo mtodo ser mayor que
78.5''. Note que esta hiptesis puede resultar falsa en los hechos a pesar de los buenos augurios que
tiene. Vamos a contrastarla contra otra: ``la media no rebasar 78.5''. Al hacer la prueba, en realidad
necesitamos las dos hiptesis, a una la llamamos nula y a la otra alternativa.
En nuestro ejemplo la hiptesis nula es ``la media no pasa de 78.5''. De ser cierta no vamos a hacer
nada (por eso se escogi el calificativo NULA). La alternativa es que sea ``mayor que 78.5''.
La prueba
La idea de la prueba es muy simple, en este caso. Vamos a evaluar la hiptesis nula en base a lo que
observemos:
Si el rendimiento promedio de las cincuenta repeticiones es muy bajo, no podremos sostener la

hiptesis alternativa y tendremos que quedarnos con la nula.
Si el rendimiento promedio supera por mucho los 78.5, concluiremos que la alternativa es la
correcta .
Pero si supera por poco los 78.5, tendremos duda al respecto.
La regin crtica y los errores

Vamos a tener que establecer una cota, por encima de los 78.5, y tomar la decisin de rechazar la nula
si la media observada rebasa esa cota. En caso contrario diremos que la evidencia emprica no muestra
que el nuevo mtodo sea mejor. Llamamos regin crtica o regin de rechazo a los valores del
promedio que nos llevan a la decisin de rechazar la nula.
Una consideracin importante para la prueba es que cualquiera que sea la decisin que tomemos nos
puede acarrear problemas, ya que la decisin tomada puede ser errnea. Hay que recordar que la
decisin la tomamos en base al resultado de una muestra y puede estar equivocado.
Adems, como en realidad, estamos probando un par de hiptesis, podemos errar de dos maneras:
1. Podemos rechazar la nula cuando es cierta
2. Podemos no rechazarla cuando es falsa.
La numeracin del prrafo anterior no es casual, es convencin llamar a los errores por su nmero:
error tipo 1 y error tipo 2.
Lo bueno o malo de una prueba se califica en base a la probabilidad de cometer error tipo uno y dos.
Llamamos significacin o nivel de significacin de la prueba a la probabilidad de cometer error tipo 1 y
la denotamos con la letra griega alfa. Usamos la letra griega beta para denotar a la probabilidad de error
tipo 2.
En nuestro ejemplo la regin crtica est incompleta, falta especificar la cota de la que hemos hablado,
es decir el nmero a partir del cual nuestra decisin ser adoptar el nuevo procedimiento.
Para poder especificarla debemos considerar un elemento extrao: qu probabilidad de cometer un
error de tipo 1 queremos?
Sesgos (Uy!)
Hay que reflexionar bien sobre esto ya que es una de las dificultades mayores en el uso de las pruebas
de hiptesis. En prrafos anteriores nos hemos referido a la posibilidad de equivocarnos. En el ejemplo,
podra pasar que el mtodo nuevo no fuera mejor. Aqu tenemos dos peligros que enfrentar:
El sesgo en la seleccin de la muestra.

El azar en la seleccin de la muestra.
Primero hablemos sobre el sesgo al seleccionar. Es claro que queremos probar el nuevo sistema en
nuestra propia empresa. Tambin es claro que no lo vamos a ensayar con todo el personal. Cmo
escoger al personal para llevar a cabo el experimento? Los ms capaces? Aqu es donde se puede
introducir un sesgo que destruya por completo la validez de la prueba.
Pero no para ah el peligro. El procedimiento es nuevo; siempre hay un efecto de la novedad.
Probablemente el personal har las cosas con ms entusiasmo que de costumbre. Adems, el personal
que est probando el nuevo mtodo est percibiendo atencin extra de sus superiores, esto afecta su
conducta. En contra se tiene el efecto del aprendizaje. Para poner las cosas de manera ms simple,
acurdese lo que sucedi la primera vez que manej un auto.
La manera de evitar los sesgos es mediante el control y la aleatorizacin. (Al menos eso dicen los
enterados en el diseo de experimentos). En nuestro ejemplo esto se traduce en que evitemos los sesgos
anteriores seleccionando al azar. Y esto nos lleva a considerar que la prueba puede fallarnos por mala
suerte. Volvamos a considerar el error tipo 1. En nuestro ejemplo, este error consiste en que el mtodo
nuevo no produzca la mejora esperada y que por casualidad la muestra tenga un promedio muy grande
(es decir, que est en la regin crtica).
Alfa
Naturalmente que quisieramos que esto no pudiera pasar. Desafortunadamente no hay garantas, slo
podemos lograr que la probabilidad del error tipo 1 sea pequea. El nivel de significacin se determina
de forma arbitraria (as como el nivel de confianza en un intervalo) y la costumbre es usar 10%, 5% o
1%.
Regresando a nuestro ejemplo, despus de hacer cuentas y consultar la tabla normal, resulta que si la
media de la muestra de 50 rebasa a 78.5 + (0.23)s rechazaremos la nula. Esta regin crtica nos da un
alfa = 0.05.
Llamamos prueba de una cola a aquella cuya regin crtica se localiza en un extremo de la distribucin
muestral ya sea la cola derecha como en nuestro ejemplo o la cola izquierda.
No es raro que usemos tambin pruebas de dos colas, situando la regin crtica en ambos extremos de
la distribucin muestral. Una prueba as sirve para detectar diferencias en cualquier sentido.
En clase hacemos ejercicios para entender la mecnica de la construccin de pruebas.
T A R E A.
(1) Del libro de texto (libro de las canicas) responda la pregunta 8-5 (p.422); tambin la 8-7 y la 8-11
(p.424); adems, la 8-21 y la 8-22 (p.432); tambin la 8-30 (p.440) y la 8-42 (p.448) (2) Explique Ud.
tres situaciones de su trabajo cotidiano en las que sea adecuado hacer una prueba de hiptesis. Para
cada una:
Describa brevemente el problema que tratara de resolver.

Diga cul sera la hiptesis nula y cul la alterna.
Explique qu sera un error tipo 1 y un error tipo 2 en esas circunstancias.
Diga qu otras cosas habra que hacer para resolver el problema, adems de la prueba de
hiptesis.
Aqu tiene Ud. un ejemplo de lo que se busca.

Mi trabajo es la enseanza. Un problema que se me presenta es la gran cantidad de reprobados en las
materias de estadstica bsica. Revisando los archivos me doy cuenta que el porcentaje de reprobados
ha sido aproximadamente 60%.
Tom un curso de didctica y me di cuenta de varios errores que cometo al ensear. Este semestre
espero haberlos corregido. Voy a hacer una prueba para saber si la proporcin de reprobados
disminuy. La hiptesis nula es que la proporcin es 60%, la alterna que la proporcin disminuy.
Un error tipo 1 es que mi enseanza haya mejorado pero por azar el grupo elegido para este semestre,
haya sido malo (puros burros!). Un error tipo 2 es que yo no haya mejorado mi didctica (a pesar del
curso) y por casualidad mi grupo en este semestre haya tenido pocos reprobados (puros aplicados!).
Adems de esta prueba, habra que tomar otros cursos de didctica y dar mejor atencin a los alumnos
para resolver el problema. La prueba de hiptesis me debe servir slo como un termmetro que indique
si la situacin mejora o n. Por otra parte debo llevar control no slo sobre el porcentaje de reprobados:
este es el efecto; sino sobre la cantidad de ayuda que proporciono a mis alumnos para no reprobar: las
consultas que me hacen, si copian o n las tareas, los grupos de trbajo que se forman, etc.(estas son las
causas).
Comentarios, sugerencias, regaos: cmendoza@campus.mor.itesm.mx

Inferencia Estadística

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Inferencia Estadística

Caricato da

Copyright:

Formati disponibili

ESTADSTICA

Dr. Carlos E. Mendoza Durn.

Si el rendimiento promedio de las cincuenta repeticiones es muy bajo, no podremos sostener la

La regin crtica y los errores

El sesgo en la seleccin de la muestra.

Describa brevemente el problema que tratara de resolver.

Aqu tiene Ud. un ejemplo de lo que se busca.

Potrebbero piacerti anche