Sei sulla pagina 1di 16

PRUEBA DE HIPTESIS:

1. Pruebas de hiptesis, muestras grandes Qu es una hiptesis? Hiptesis: enunciado acerca de una poblacin elaborada con el propsito de ponerse a prueba. Ejemplos de hiptesis acerca de un parmetro de poblacin son: La media mensual de ingresos para analistas de sistemas es $3625, El 20% de los delincuentes juveniles son capturados y sentenciados a prisin. Qu es una prueba de hiptesis? Prueba de hiptesis: procedimiento basado en la evidencia muestral y en la teora de probabilidad que se emplea para determinar si la hiptesis es un enunciado razonable y no debe rechazarse o si no es razonable y debe ser rechazado. Pasos en la prueba de hiptesis

Definiciones Hiptesis nula H0: afirmacin acerca del valor de un parmetro poblacional. Hiptesis alterna H1: afirmacin que se aceptar si los datos muestrales proporcionan evidencia de que la hiptesis nula es falsa. Nivel de significancia: probabilidad de rechazar la hiptesis nula cuando es verdadera.

Error Tipo I: rechazar la hiptesis nula cuando en realidad es verdadera. Error Tipo II: aceptar la hiptesis nula cuando en realidad es falsa. Estadstico de prueba: valor obtenido a partir de la informacin muestral, se utiliza para determinar si se rechaza o no la hiptesis. Valor crtico: el punto que divide la regin de aceptacin y la regin de rechazo de la hiptesis nula. Prueba de significancia de una cola Una prueba es de una cola cuando la hiptesis alterna, H1, establece una direccin, como: H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres. Distribucin de muestreo para el valor estadstico z, prueba de una cola, nivel de significancia de .05

Prueba de significancia de dos colas Una prueba es de dos colas cuando no se establece una direccin especfica de la hiptesis alterna H1, como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.

Distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de significancia de 0.05

Prueba para la media poblacional: muestra grande, desviacin estndar poblacional conocida. Cuando se hace una prueba para la media poblacional de una muestra grande y se conoce la desviacin estndar, el estadstico de prueba est dado por:

Ejemplo: Los fabricantes de una marca de Catsup indican en su etiqueta que el contenido de la botella es de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa el contenido. La muestra de la ltima hora tiene un peso medio de 16.12 onzas con una desviacin estndar de .5 onzas. Est el proceso fuera de control para un nivel de significancia de .05? Paso 1: establezca la hiptesis nula y alterna

Paso 2: seleccionar el nivel de significancia. = 0.05

Paso 3: calcule el valor del estadstico de prueba:


z= x

16.12 16.0 =1.44 0.5 36

Paso 4: Formular la regla de decisin: (valor critico) H0 se rechaza si z <- 1.96 o z > 1.96 Paso 5: Tomar una decisin sobre H0: No se rechaza H0 porque 1.44 es menor que el valor crtico 1.96 Valor p en la prueba de hiptesis Valor p: es la probabilidad de observar un valor muestral tan extremo o ms que el valor observado, dado que la hiptesis nula es verdadera. Si el valor p es menor que el nivel de significancia, H 0 se rechaza. Si el valor p es mayor que el nivel de significancia, H 0 no se rechaza. Clculo del valor p Prueba de una cola: Valor p = P {z el valor absoluto del estadstico de prueba calculado} Prueba de dos colas: valor p = 2P { z el valor absoluto del estadstico de prueba calculado} Para el primer ejemplo, z = 1.44, y para una prueba de dos colas, el valor p = 2P { z=1.44} = 2(0.5-0.4251) =0.1498. Como 0.1498 > 0.05, no se rechaza H 0. Prueba para la media poblacional: muestra grande, desviacin estndar poblacional desconocida. Aqu es desconocida, as que se estimar con la desviacin estndar de la muestra s.

Siempre que el tamao de muestra n 30, z puede aproximarse con:

Ejemplo: La cadena Roders Discount emite su propia tarjeta de crdito. Lisa, la gerente de crdito, quiere encontrar si la media mensual de saldos no pagados es mayor que $400. El nivel de significancia es de 0.05. Una revisin al azar de 172 saldos revel que la media muestral es $407 y la desviacin estndar muestral es $38. Debe Lisa concluir que la poblacin media es mayor que $400, o es razonable suponer que la diferencia de $7 ($407-$400) se debe al azar? Paso 1:

Paso 2: = 0.05 Paso 3: calcule el valor del estadstico de prueba:


z= x

16.12 16.0 =1.44 0.5 36

Paso 4: Formular la regla de decisin: (valor critico) H0 se rechaza si z > 1.645 Paso 5: Tomar una decisin. H0 se rechaza. Lisa puede concluir que la media de saldos no pagados es mayor que $400.

Prueba de hiptesis: dos medias poblacionales Suponga que los parmetros para dos poblaciones son:

Para muestras grandes el estadstico de prueba es: Cuando 1 y 2 no se conocen pero el tamao de muestra n 1 y n2 es mayor o igual que 30, el estadstico de prueba es

Ejemplo: Se realiz un estudio para comparar los aos promedio de servicio de quienes se retiraron en 1979 con los que se retiraron el ao anterior en Delong Manufacturing Co. Con un nivel de significancia de .01 podemos concluir que los trabajadores que se retiraron el ao pasado trabajaron ms aos segn la siguiente muestra? Nota: sea poblacin #1= ao anterior.

Paso 1: Paso 2: Rechace H0 si z > 2.33 Paso 3:

Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el ao anterior tenan ms aos de servicio. Pruebas respecto a relaciones proporcionales

Relacin proporcional: parte fraccional o porcentaje que indica la parte de la poblacin o muestra que tiene un atributo particular de inters. La relacin proporcional muestral se representa por p donde

Estadstico de prueba para ensayos con una sola relacin proporcional de poblacin

Ejemplo: En el pasado, 15% de la propaganda por correo para donativos dio como resultado contribuciones. Se mand una nueva carta a una muestra de 200 personas y 45 enviaron un donativo. Para .05 de significancia, se puede concluir que la nueva carta fue ms efectiva? Paso 1: Paso 2: H0 se rechaza si z > 1.645 Paso 3:

Paso 4: como z = 2.97 >1.645, H0 se rechaza. La nueva carta es ms efectiva. Prueba donde interviene la diferencia entre dos relaciones proporcionales de poblacin

El estadstico de prueba en este caso es:

Ejemplo: Es ms probable que los trabajadores solteros falten ms que los trabajadores casados? Una muestra de 250 trabajadores casados indic que 22 faltaron ms de 5 das el ao pasado, mientras que una muestra de 300 trabajadores solteros indic que 35 faltaron ms de 5 das. Utilice .05 de nivel de significancia. Nota: sea poblacin #1 = trabajadores solteros.

Paso 4: H0 no se rechaza. No existe diferencia entre la proporcin de trabajadores casados y solteros que faltan ms de 5 das al trabajo. El valor p = P{ z > 1.1} = .1357

Pruebas de hiptesis, muestras pequeas Caractersticas de la distribucin t de Student Valo aqu La distribucin t tiene las siguientes propiedades: es continua, tiene forma de campana y es simtrica respecto al cero como la distribucin z. existe una familia de distribuciones t que comparten una media de cero pero con desviaciones estndar diferentes. la distribucin t est ms dispersa y es ms plana en el centro que la distribucin z, pero se acerca a ella cuando el tamao de la muestra crece.

Prueba para la media poblacional: muesra pequea, desviacin estndar poblacional desconocida El estadstico de prueba para el caso de una muestra est dado por:

Ejemplo: La tasa actual para producir fusibles de 5 amp en Neary Electric Co. es 250 por hora. Se compr e instal una mquina nueva que, segn el proveedor, aumentar la tasa de produccin. Una muestra de 10 horas seleccionadas al azar el

mes pasado indica que la produccin media por hora en la nueva mquina es 256, con desviacin estndar muestral de 6 por hora. Con .05 de nivel de significancia, puede Neary concluir que la nueva mquina es ms rpida? Paso 1: Paso 2: H0 se rechaza si t >1.833, gl = 9 Paso 3:

Paso 4: H0 se rechaza. La nueva mquina es ms rpida. Grfica que muestra la regin de rechazo, el valor crtico y el estadstico de prueba calculado

NOTA Para una prueba de dos colas con la distribucin t, se rechaza la hiptesis nula cuando el valor del estadstico de prueba es mayor que

o si es menor que -

Para una prueba de cola izquierda con la distribucin t, se rechaza la hiptesis nula cuando el valor del estadstico de prueba es menor que

Comparacin de dos medias poblacionales Para realizar esta prueba se requieren tres suposiciones: las poblaciones deben tener una distribucin normal o normal aproximada las poblaciones deben ser independientes las variancias de las poblaciones deben ser iguales Variancia muestral combinada y estadstico de prueba Variancia muestral combinada:

Estadstico de prueba:

Un estudio EPA reciente compara la economa de combustible en carretera de los automviles nacionales e importados. Una muestra de 15 autos nacionales revel una media de 33.7 mpg con desviacin estndar de 2.4 mpg. Una muestra de 12 autos importados indic una media de 35.7 mpg con desviacin estndar de 3.9. Para .05 de nivel de significancia, puede EPA concluir que el consumo de las mpg para los autos importados es mayor? (Asocie el subndice 1 con los autos nacionales.) Paso 1: Paso 2: H0 se rechaza si t<-1.708, gl=25 Paso 3: t=1.64 (verifique) Paso 4: H0 no se rechaza. La evidencia muestral es insuficiente para asegurar que el consumo de mpg es ms alto en los autos importados. Pruebas de hiptesis con observaciones por pares Valo aqu Las muestras independientes que no estn relacionadas. Las muestras dependientes estn pareadas o relacionadas de alguna manera. Por ejemplo, si se desea comprar un auto se busca el mismo

modelo en dos (o ms) distribuidores diferentes y se comparan los precios. Use la siguiente prueba cuando las muestras son dependientes:

donde es el promedio de las diferencias es la desviacin estndar de las diferencias n es el nmero de pares (diferencias) Ejemplo: Una empresa independiente de pruebas estadsticas compara el costo diario de renta de un auto compacto en Hertz y en Avis. Se obtiene una muestra aleatoria de ocho ciudades con la siguiente informacin. Para .05 de nivel de significancia, puede la empresa de pruebas concluir que existe una diferencia en los costos de renta?

Paso 1: Paso 2: H0 se rechaza si t<-2.365 o t>2.365 Paso 3:

Paso 4: H0 no se rechaza. No existe diferencia en los costos. Variables Cuantitativas Discretas Valo aqu Variables discretas: slo pueden adquirir ciertos valores y

casi siempre hay brechas entre esos valores. EJEMPLO: el nmero de habitaciones en un hotel (1,2,3,....). Variables Cuantitativas Continuas Valo aqu Variables continuas: pueden tomar cualquier valor dentro de un intervalo especfico. EJEMPLO: el tiempo que toma volar de Buenos Aires a Bogot. Niveles de medicin Valo aqu Nivel nominal: los datos slo se puede clasificar en categoras, no se pueden ordenar. EJEMPLOS: color de los ojos, sexo, afiliacin religiosa. Mutuamente excluyente: un individuo, objeto o artculo, al ser incluido en una categora, debe excluirse de las dems. EJEMPLO: color de los ojos. Exhaustivo: cada persona, objeto o hecho debe clasificarse al menos en una categora. EJEMPLO: afiliacin religiosa. Nivel ordinal: involucra datos que se pueden ordenar, pero no es posible determinar las diferencias entre los valores de los datos o no tienen significado. EJEMPLO: en una prueba de sabor de 4 refrescos de cola, el C se clasific como nmero 1, el B como nmero 2, el A como 3 y el D como nmero 4. Nivel de intervalo: similar al nivel ordinal, con la propiedad adicional de que se pueden determinar cantidades significativas de las diferencias entre los valores. No existe un punto cero natural. EJEMPLO: temperatura en la escala de grados Fahrenheit. Nivel de razn: el nivel de intervalo con un punto cero inicial inherente. Las diferencias y razones son significativas para este nivel de medicin. EJEMPLOS: dinero, altura de los jugadores de basquetbol de la NBA.

Anlisis de variancia Caractersticas de la distribucin F Valo aqu Existe una familia de distribuciones F. Cada miembro de la familia est determinado por dos parmeteros: los grados de libertad (gl) en el numerador y los grados de libertad en el denominador. El valor de F no puede ser negativo y es una distrubucin continua. La distribucin F tiene sesgo postivo. Sus valores varan de 0 a . Con forme F la curva se aproxima al eje X. Prueba para variancias iguales Valo aqu Para prueba de dos colas, el estadstico de prueba est dado por:

son las variancias muestrales para las dos muestras. La hiptesis nula se rechaza si el clculo del estadstico de prueba es ms grande que el valor crtico (de tablas) con nivel de confianza numerador y el denominador. y grados de libertad para el

Ejemplo: Colin, agente de bolsa del Critical Securities, report que la tasa media de retorno en una muestra de 10 acciones de software fue 12.6% con una desviacin estndar de 3.9%. La tasa media de retorno en una muestra de 8 acciones de compaas de servicios fue 10.9% con desviacin estndar de 3.5%. Para .05 de nivel de significancia, puede Colin concluir que hay mayor variacin en las acciones de software? Paso 1:

Paso 2: H0 se rechaza si F > 3.68, gl = (9, 7), = .05 Paso 3: Paso 4: H0 no se rechaza. No hay evidencia suficiente para asegurar que hay mayor variacin en las acciones de software. Suposiciones de ANOVA Valo aqu La distribucin F tambin se usa para probar la igualdad de ms de dos medias con una tcnica llamada anlisis de variancia (ANOVA). ANOVA requiere las siguientes condiciones: la poblacin que se muestrea tiene una distribucin normal las poblaciones tienen desviaciones estndar iguales las muestras se seleccionan al azar y son independientes Estadsticas Inferencial Valo aqu Estadstica inferencial: una decisin, estimacin, prediccin o generalizacin sobre una poblacin, en base a una muestra. Una poblacin es un conjunto de todos los posibles individuos, objetos o medidas de inters. Una muestra es una porcin, o parte, de la poblacin de inters. Procedimiento de anlisis de variancia Valo aqu Hiptesis nula: las medias de las poblaciones son iguales. Hiptesis alterna: al menos una de las medias es diferente. Estadstico de prueba: F = (variancia entre muestras)/(variacia dentro de muestras). Regla de decisin: , la hiptesis nula se rechaza si F (calculada) para un nivel de significancia es mayor que F (en tablas) con grados de libertad en el numerador y en el denominator. NOTA Valo aqu Si se muestrean k poblaciones, entonces los gl (numerador) = k - 1 Si hay un total de N puntos en la muestra, entonces los gl (denominador) = N - k El estadstico de prueba se calcula con: F = [(SST) /(k - 1)] /[(SSE) /(N - k)]. SST es la suma de cuadrados de los tratamientos. SSE es la suma de cuadrados del error. Sea TC el total de la columna, nc el nmero de observaciones en cada columna, y X la suma de todas las observaciones. Frmulas Valo aqu

Inferencias acerca de las medias de tratamiento Valo aqu Cuando se rechaza la hiptesis nula de que las medias son iguales, quiz sea bueno saber qu medias de tratamiento difieren. Uno de los procedimientos ms sencillo es el uso de los intervalos de confianza. Intervalos de confianza para la diferencia entre dos medias Valo aqu

donde t se obtiene de la tabla con (N - k) grados de libertad. MSE = [SSE /(N - k)] Dos factores ANOVA Valo aqu Para ANOVA de dos factores se prueba si existe una diferencia signifcativa entre el efecto de tratamiento y si existe una diference en la variable de bloqueo. Sea Br el total de bloque (r segn las filas) SSB representa la suma de los cuadrados de los bloques, donde:

Potrebbero piacerti anche