Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
dos poblaciones con medias μ1 y μ2, y varianzas σ 12y σ 22. Sabemos que la variable aleatoria
tiene una distribución normal estándar.[ CITATION Dia13 \l 2058 ]
( X́ 1 − X́ 2 ) −( μ1−μ 2)
z=
σ 1 2 σ 22
√ n1 n2
+
Suponemos que n1 y n2 son suficientemente grandes, por lo que se aplica el teorema del
limite central. Por supuesto, si las dos poblaciones son normales, el estadístico anterior
tiene una distribución normal estándar aun para n1 y n2 pequeñas. Evidentemente, si
podemos suponer que σ 1 =σ 2=σ , el estadístico anterior se reduce a
( X́ 1 − X́ 2 ) −( μ1−μ 2)
z=
1 1
σ
√ +
n1 n2
Los dos estadísticos anteriores sirven como base para el desarrollo de los procedimientos de
prueba que incluyen dos medias. La equivalencia con el intervalo de confianza y facilidad
de la transición del caso de pruebas sobre una sola media hacen que esto sea sencillo.
La hipótesis bilateral sobre dos medias se escribe con bastante generalidad como
H o =μ 1−μ2=do
para σ 12y σ 22 conocidas, el estadístico de prueba dado por una región critica de dos colas en
el caso de la alternativa bilateral.
( X́ 1 − X́ 2 ) −do
z=
σ 1 2 σ 22
√ n1 n2
+
Ejercicios
1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con
métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo
grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y
se ejercita en el pedaleo de alta frecuencia. Después de un mes de entrenamiento se realiza
un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos
A un nivel de confianza del 95% ¿Puede considerarse que los tres métodos producen
resultados equivalentes? O por el contrario ¿Hay algún método superior a los demás?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por
el número de observaciones:
2. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les
realiza una prueba de recuerdo de dichas palabras, obteniéndose los siguientes resultados:
¿Qué conclusiones pueden sacarse acerca de las cuatro formas de presentación, con un
nivel de significación del 5%?
Solución: Comenzamos calculando los totales y los cuadrados de los totales divididos por
el número de observaciones:
A continuación calculamos los cuadrados de las observaciones y su total:
H 0 :μ 1−μ2=do ,
H a : μ1−μ2 ≠ do ,
Para una alternativa específica, digamos, μ1−μ 2=do+ δ en la figura se muestra que la
potencia de nuestra prueba es
1−β =P ¿
Por lo tanto,
2
zα+zβ ( σ 12 +σ 22 )
n≈
( 2 )
δ2
Para la prueba de una sola cola, la expresión para el tamaño requerido de la muestra cuando
n=n1=n2 es
2
( Z a + Z β ) +( σ 12 +σ 22 )
Elección del tamaño de la muestra: n=
δ2
X́−(μ0 +δ )
S /√n
no sigue una distribución t, como podría esperarse, sino que más bien sigue la distribución t
no central para determinar el tamaño adecuado de la muestra, si dispone de alguna
estimación de σ o si δ es un múltiplo de σ .
|δ| |μ−μ0|
∆= =
σ σ
|δ| |μ 1−μ2−do|
∆= =
σ σ
1. De una población de 1,176 adolescentes de una ciudad se desea conocer la aceptación
por los programas humorísticos televisivos y para ello se desea tomar una muestra por lo
que se necesita saber la cantidad de adolescentes que deben entrevistar para tener para
tener una información adecuada con error estándar menor de 0.015 al 90% de
confiabilidad.
Solución:
Es decir, para realizar una investigación se necesita una muestra de al menos 298
adolescentes. [ CITATION Dia13 \l 2058 ]
4.9. Aplicaciones.
Las pruebas de hipótesis son poderosas herramientas de estadística inferencial, que son
aplicadas en una gran variedad de áreas del conocimiento. En términos generales, una
prueba de hipótesis consiste en establecer un criterio para decidir si se debe rechazar o no
cierta hipótesis acerca de la población estudiada (la llamada hipótesis nula) en favor de
otra (la hipótesis alternativa). Por lo general, en la práctica la hipótesis alternativa es la
hipótesis de trabajo que los investigadores buscan probar como verdadera. La decisión que
se adopte depende de los valores observados en una muestra seleccionada al azar (una
muestra aleatoria); establecer el criterio de decisión, consiste en determinar una región de
confianza, de manera que se rechazara la hipótesis nula en el caso de que los valores
observados caigan dentro de dicha región.
Ejemplo uno. Imaginemos un agricultor que cosecha sandías con un peso promedio de 7
kilos. Le han ofrecido un fertilizante que, supuestamente, aumentara de manera
considerable el tamaño de sus frutas. El agricultor decide poner
A prueba el fertilizante por una temporada. Como el producto es costoso, decide que solo
valdrá la pena usarlo a largo plazo si produce sandías de más de 8 kilos. Supongamos que
este agricultor conoce de estadística, de manera que plantea una prueba de hipótesis para
abordar su problema. Denotando por ^ al peso promedio de las sandías producidas con el
fertilizante, establece las siguientes hipótesis nula y alternativa:
Desde luego, el agricultor quiere tener cierta garantía de que las sandías de verdad
promediaran más de 8 kilos, por lo que propone un valor de significancia para la prueba de
a = 0.15; esto es, quiere estar al menos 85% seguro. Se asume también que el peso de las
sandías está distribuido normalmente con media ^ desconocida y desviación estándar o =
2.1 Esto significa que los pesos de las sandías se distribuyen Serfin la gráfica de la figura 1.
1Cabe mencionar que esta es una fuerte suposición, que aquí tomamos por simplicidad y con
fines ilustrativos.
De una muestra de 50 sandías, el agricultor calcula el peso promedio X (X es lo que se
llama un
Figura 2. Distribución normal con ^=8 y o=2. El área sombreada es el 15% del área total
bajo la curva.
Estimador para u). Si el valor de X está dentro del intervalo de confianza,2 se rechaza la
hipótesis H0 en favor de H1 y se compra el fertilizante. Ahora bien, dicho intervalo de
confianza está determinado por valor de significancia aceptable propuesto. De forma más
precisa: partiendo de suponer u = 8 (el máximo de los pesos promedios “no aceptables”) el
intervalo de confianza comienza a partir del valor de X para el cual
(Es decir, que la probabilidad de que el promedio sea mayor que x 0 es menor o igual que
15%). De manera gráfica, esto significa que el intervalo de rechazo comienza a partir del
punto x0 a partir del cual el área bajo la gráfica corresponde al 15% del área total bajo la
curva (ver figura 2). En este caso, x0 = 10.08 y por lo tanto el agricultor adquirirá el
fertilizante si el promedio de las sandías que peso es de al menos de 10.08 kilos.
Si H0 fuera cierta, entonces la probabilidad de que X pese más de 10.08 kilos es pequeña
(nótese que lo que “pequeña” quiere decir, depende del valor de a).
El último de los puntos mencionados arriba, con mucha frecuencia es pasado por alto. Un
valor de significancia alto es a veces entendido como evidencia de un efecto grande o
importante; en realidad, el más modesto de los efectos puede ser detectado con una
significancia tan grande como se quiera. Para conseguir esto, basta considerar muestras de
tamaño grande. El entender y tener presente esto, nos parece fundamental para una
adecuada comprensión e interpretación de las pruebas de hipótesis. El siguiente ejemplo y
su discusión posterior tienen como propósito explicar este punto.
Ejemplo dos. En cierta bodega muy grande se guardan, revueltas, muchas canicas de dos
colores (digamos mitad verdes y mitad rojas). Aparte del color, las canicas son idénticas, en
forma, peso y tamaño. Supongamos además que, por alguna razón, las canicas verdes valen
más que las rojas; sabiendo esto, el deshonesto encargado de la bodega se ha dado a la tarea
de sustraer cada día una pequeña cantidad de canicas verdes, reemplazándolas por canicas
rojas. Después de cierto tiempo, hay 51% de canicas rojas y 49% de canicas verdes. Una
supervisora entra en sospechas, y como no puede contar todas las canicas (hay millones de
ellas), y el pesarlas no le daría información (pesan lo mismo), decide aplicar una prueba de
hipótesis. Digamos que plantea que un valor de suficiencia de a = 0.05 le basta (o sea,
quiere estar al menos 95% segura). La hipótesis nula es: “hay la misma cantidad de canicas
verdes que canicas rojas”, siendo la alternativa: “hay más canicas rojas que verdes”. Por la
información que tenemos, nosotros sabemos que debería rechazar la hipótesis nula: aunque
sea por poquito, hay más canicas rojas que verdes. No hacerlo implicaría que se está
cometiendo un error del tipo II. La pregunta es entonces: ¿Cuantas canicas necesita sacar
para rechazar la hipótesis nula? Es claro que la respuesta a esta pregunta no puede darse en
términos absolutos, sino probabilísticos; para cada tamaño de muestra hay la posibilidad de
que la hipótesis se rechace o de que no. Las probabilidades de que la supervisora capture al
encargado (con su 95% de significancia) se ilustran en las dos primeras columnas de la
tabla 1.3 En las otras columnas, mostramos que para mayores niveles de significancia
también es posible (de hecho casi seguro) detectar el cambio, bastante tomar muestras algo
más grande. El cambio será detectado con una probabilidad de más de diez mil a uno con
una muestra de 350 pelotas, incluso para niveles de significancia extremadamente altos de
p < 0.001.
• Es muy importante notar que, en todas estas tablas, la cantidad total de canicas rojas
y verdes no cambia. Aunque los valores de significancia sí lo hacen.
3Se usaron aproximaciones normales con p = 0.5 y a2 = 0.25/n para calcular la región de
rechazo; y con p = 0.51, a2 = (0.51 * 0.49)/n para calcular la probabilidad de caer ahí.
permiten detectar cambios muy pequeños de manera significativa, siempre y cuando la
muestra tomada sea suficientemente grande.[ CITATION Fed14 \l 2058 ]
Bibliografía
Alfredo, D. M. (2013). Estadística Aplicada a la Administración y la Economía. Mexico D.F: Mc
Graw Gill.
Menendez, F. (16 de marzo de 2014). Uso y abuso de pruebas de hipotesis. Uso y abuso de pruebas
de hipotesis. Hidalgo, Coahuila, Mexico: Centro de Investigacion en Matem ´ aticas,
Universidad Autonoma del Estado de Hidalgo.