Sei sulla pagina 1di 69

Estadística Aplicada a los Negocios

Unidad:
Pruebas de Hipótesis

Docente: Fredy Vivanco Huaytara


Logro
Al término de la unidad, el estudiante aplica los diferentes
conceptos relacionados con prueba de hipótesis
adecuadamente en situaciones reales.

Importancia
¿Cómo decidir si ciertos tratamientos tienen efectos positivos o
si los grupos de tratamiento difieren entre sí? Si la hipótesis o
las hipótesis están correctamente formuladas, se gana un nivel
importante en lo que será la solución al problema de una
investigación.
Contenido general
• Pruebas de hipótesis

• Metodologías para la prueba de hipótesis

• Prueba Z de hipótesis para la media(σ conocida)

• Prueba T de hipótesis para la media(σ desconocida)

• Prueba Z de hipótesis para la proporción

• Prueba de hipótesis aplicando Chi cuadrada (uso de la tabla)


Pruebas de hipótesis
• Hipótesis estadística
Pruebas de hipótesis
Hipótesis estadística

La prueba de hipótesis comienza con una suposición,


denominada hipótesis, que hacemos entorno a un
parámetro(𝜃𝜃) de la población, Principalmente sobre:

 media (µ),
 varianza (σ2 )
 proporción (π)

Reunimos datos muéstrales, producimos estadísticos de la


muestra y con esta información decidimos la probabilidad de
que el parámetro supuesto de la población sea correcto.
Pruebas de Hipótesis
Hipótesis estadística
Una prueba de hipótesis examina dos hipótesis
opuestas sobre una población:

La hipótesis nula(𝒉𝒉𝟎𝟎 )

Es el status quo o estado actual (lo que se cree


hasta el momento, o la que asegura que no hay
diferencias en la población. Es la hipótesis de no
efecto

La hipótesis alternativa (𝒉𝒉𝟏𝟏 , 𝒉𝒉𝒂𝒂 )

Es lo opuesto a la hipótesis nula; representa el


cambio en la población que el investigador
espera sea verdadero
Pruebas de Hipótesis

Hipótesis estadística

Hipótesis Nula (H0) Hipótesis Alterna (H1)

La hipótesis nula indica que un La hipótesis alternativa indica que un


parámetro de población (tal como la parámetro de población es más
media, la desviación estándar, etc. = pequeño, más grande o diferente del
, ≥, ≤) valor hipotético de la hipótesis nula ≠
, <, >).
Por lo general cuando se plantea una
Es lo que sospechamos que va a ser
hipótesis nula se espera que sea cierto, Es la hipótesis del
rechazada, solo si la evidencia investigador.
muestral sugiere que H0 es falsa
Pruebas de Hipótesis

Planteo Hipótesis Estadística

1. Establecer la Hipótesis Nula en términos de la igualdad media (µ),


𝜽𝜽 = varianza (σ2 )

𝐻𝐻𝑜𝑜 : 𝜃𝜃 = 𝜃𝜃𝑜𝑜 𝐻𝐻𝑜𝑜 : 𝜃𝜃 ≤ 𝜃𝜃𝑜𝑜 𝐻𝐻𝑜𝑜 : 𝜃𝜃 ≥ 𝜃𝜃𝑜𝑜 proporción (π)

2. Establecer la Hipótesis alternativa, que puede hacerse de tres maneras,


dependiendo del interés del investigador

𝐻𝐻1 : 𝜃𝜃 ≠ 𝜃𝜃𝑜𝑜 𝐻𝐻1 : 𝜃𝜃 > 𝜃𝜃𝑜𝑜 𝐻𝐻1 : 𝜃𝜃 < 𝜃𝜃𝑜𝑜

Prueba Unilateral Unilateral


bilateral Superior Inferior
Pruebas de Hipótesis
Hipótesis estadística: Ejemplos de planteo para los ejercicios

El diámetro de la tapa de frascos en la producción de lotes debe tener una variabilidad menor a 0.35 cm2
𝐻𝐻0 𝜎𝜎 2 ≥ 0.35𝑐𝑐𝑐𝑐𝑐
𝐻𝐻1 𝜎𝜎 2 < 0.35𝑐𝑐𝑐𝑐𝑐

En estudios previos, se ha determinado que el nivel de colesterol promedio (medio) de pacientes con
problemas cardíacos es 220. Un cardiólogo piensa que en realidad el nivel es más alto.
𝐻𝐻0 𝜇𝜇 ≤ 220
𝐻𝐻1 𝜇𝜇 > 220(el nivel es más alto de colesterol)

Un fabricante de mayonesa está en proceso de decidir si produce o no una versión mas salada. Un estudio
más extenso, hecho dos años antes, mostró que el 5% de las casas compraría la marca. Con un nivel de
significancia del 2%, ¿debe la compañía concluir que hay un incremento en el interés por el sabor con
salado?
𝐻𝐻0 𝜋𝜋 ≤ 0.05
𝐻𝐻1 𝜋𝜋 > 0.05 𝑒𝑒𝑒𝑒 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑝𝑝𝑝𝑝𝑝𝑝 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
Pruebas de Hipótesis

Hipótesis estadística

Ninguna prueba de hipótesis es 100% cierta. Puesto que


la prueba se basa en probabilidades, siempre existe la
posibilidad de llegar a una conclusión incorrecta. Cuando
usted realiza una prueba de hipótesis, puede cometer
dos tipos de error: tipo I y tipo II.
Pruebas de Hipótesis
Hipótesis estadística

Error de tipo I

Si usted rechaza la hipótesis nula cuando es verdadera,


comete un error de tipo I. La probabilidad de cometer un
error de tipo I es α, que es el nivel de significancia que usted
establece para su prueba de hipótesis. un α de 0.05 indica
que usted está dispuesto a aceptar una probabilidad de 5%
de estar equivocado al rechazar la hipótesis nula.

 Si nivel de confianza (1-𝛼𝛼) es 95% -> el nivel de


significancia(𝛼𝛼) es 5%.
 Si nivel de confianza (1-𝛼𝛼) es 90% -> el nivel de
significancia(𝛼𝛼) es 10%.
Pruebas de Hipotesis
Hipótesis estadística

Error de tipo II

Cuando la hipótesis nula es falsa y usted no la rechaza,


comete un error de tipo II. La probabilidad de cometer un
error de tipo II es β.

𝜶𝜶 = 𝑃𝑃 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼 = 𝑃𝑃 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐻𝐻𝐻𝐻/ 𝐻𝐻𝐻𝐻 𝑒𝑒𝑒𝑒 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣

β = 𝑃𝑃 𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝐼𝐼𝐼𝐼 = 𝑃𝑃 𝑁𝑁𝑁𝑁 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 𝐻𝐻𝐻𝐻 /𝐻𝐻𝐻𝐻 𝑒𝑒𝑒𝑒 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓


Metodologías para la prueba de hipótesis
Metodología Prueba de Hipótesis

Prueba de hipótesis

Media µ Proporción π Varianza σ2

Distribución
𝜎𝜎: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶(Z) Normal (Z)

Chi-cuadrado
𝑿𝑿𝟐𝟐
𝜎𝜎: 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑(𝑇𝑇)
Metodología Prueba de Hipótesis
Pasos de una prueba de Hipótesis estadística:

Paso 1: plantear la hipótesis


Prueba Bilateral Prueba Unilateral Prueba Unilateral
Inferior Superior
H o : θ = θo H o : θ ≥ θo H o : θ ≤ θo
H1 : θ ≠ θ o H1 : θ < θ o H1 : θ > θ o

Paso 2: Fijar nivel de significación 𝜶𝜶 = 𝟏𝟏𝟏. 𝟐𝟐𝟐, 𝟓𝟓𝟓, 𝒆𝒆𝒆𝒆𝒆𝒆

Paso 3: Calcular el estadístico de prueba

Paso 4: establecer las regiones críticas

Paso 5: Conclusiones
Metodología Prueba de Hipótesis
Pasos de una prueba de Hipótesis:

La posición de la región crítica depende de la hipótesis alternativa

Bilateral H0: 𝜇𝜇 =70 kg


H1: 𝜇𝜇 ≠70 kg

Unilateral inferior Unilateral superior

H0:𝜇𝜇 ≥ 70 kg H0:𝜇𝜇 ≤70 kg


H1: 𝜇𝜇<70 kg H1: 𝜇𝜇 >70 kg
Metodología Prueba de Hipótesis
Pasos de una prueba de Hipótesis:
La posición de la región crítica depende de la hipótesis alternativa

H0 : 𝜇𝜇 = 𝜇𝜇0 H0 : 𝜇𝜇 ≤ 𝜇𝜇0
H1 : 𝜇𝜇 ≠ 𝜇𝜇0 H1 : 𝜇𝜇 > 𝜇𝜇0

𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎 𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎 𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎 𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎


𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎

𝛼𝛼/2 𝛼𝛼/2 1 − 𝛼𝛼 𝛼𝛼

H0 : 𝜇𝜇 ≥ 𝜇𝜇0
H1 : 𝜇𝜇 < 𝜇𝜇0
𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎
𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎
𝛼𝛼
Prueba Z de hipótesis para la media (σ conocida)
• Prueba de hipótesis para una media
• Prueba de hipótesis para dos medias
Prueba Z de hipótesis para la media(σ conocida)
Prueba de hipótesis para una media(𝜇𝜇)

Paso 1: Plantear Hipótesis:

H0 : 𝜇𝜇 = 𝜇𝜇0 H0 : 𝜇𝜇 ≤ 𝜇𝜇0 H0 : 𝜇𝜇 ≥ 𝜇𝜇0


H1 : 𝜇𝜇 ≠ 𝜇𝜇0 H1 : 𝜇𝜇 > 𝜇𝜇0 H1 : 𝜇𝜇 < 𝜇𝜇0

Paso 2: Fijar nivel de significación 𝜶𝜶 = 𝟏𝟏𝟏. 𝟐𝟐𝟐, 𝟓𝟓𝟓, 𝒆𝒆𝒆𝒆𝒆𝒆

Paso 3: Estadístico de Prueba


𝑋𝑋� − 𝜇𝜇hip
𝑍𝑍𝑐𝑐 = 𝜎𝜎 Si n≥30,
𝑛𝑛
Paso 4: Regiones Críticas:

Paso 5: Conclusiones:
Prueba Z de hipótesis para la media(σ
conocida)
Nota: calculo de valores en distribución Z
Nivel 𝒁𝒁𝟏𝟏−𝜶𝜶 𝒁𝒁𝟏𝟏−𝜶𝜶
𝟐𝟐 𝟐𝟐
significancia
10% 𝒁𝒁(0.95) 1.645
5% 𝒁𝒁(0.975) 1.96
2% 𝒁𝒁(0.99) 2.33
1% 𝒁𝒁(0.995) 2.58
Prueba Z de hipótesis para la media(σ
conocida)
Prueba de hipótesis para una media(𝜇𝜇): Ejercicio

A un supermercado que asisten por semana miles de personas,


se desea saber el gasto en compra de cada cliente por cada
visita.

El gerente comercial ha establecido, por un estudio anterior,


que el gasto promedio de cada persona es de S/ 76.7 con una
desviación estándar de S/ 8.6.

En un nuevo estudio, 45 clientes son elegidos aleatoriamente y


tuvieron una compra promedio de S/ 73.2.

El promedio de compra ha disminuido? Use un nivel de


significación de 5%.
Prueba Z de hipótesis para la media(σ conocida)
Prueba de hipótesis para una media(𝜇𝜇) (n>30)
Solución
Datos población Datos Muestra
𝑋𝑋: Compra por cada visita
𝜎𝜎 = 8,6 𝑛𝑛 = 45
Paso 1: Plantear Hipótesis:
𝑋𝑋� =73.2
𝒉𝒉𝒐𝒐 : 𝝁𝝁 ≥ 𝟕𝟕𝟕𝟕, 𝟕𝟕
𝒉𝒉𝟏𝟏 : 𝝁𝝁 < 𝟕𝟕𝟕𝟕. 𝟕𝟕 La compra por cada visita Paso 4: Región crítica:
Ha disminuido
Paso 2: Nivel de significación: 𝛼𝛼 = 0.05

Paso 3: Estadístico de Prueba: 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0

𝑋𝑋� − 𝑢𝑢 73,2 − 76.7


𝑍𝑍𝑐𝑐 = 𝜎𝜎 = = −2.73 𝛼𝛼 = 0.05
8.6 1 − 𝛼𝛼
𝑛𝑛
45
𝑍𝑍 0.05 = − 1,96
Prueba Z de hipótesis para la media(σ conocida)
Prueba de hipótesis para una media(𝜇𝜇): Ejercicio
𝒉𝒉𝒐𝒐 : 𝝁𝝁 ≥ 𝟕𝟕𝟕𝟕, 𝟕𝟕
Paso 5: Conclusiones 𝒉𝒉𝟏𝟏 : 𝝁𝝁 < 𝟕𝟕𝟕𝟕, 𝟕𝟕

𝑍𝑍𝐶𝐶 = −2.73

𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0

𝛼𝛼 1 − 𝛼𝛼

𝑍𝑍 0.05 = − 1,96

A un nivel de significación del 5%, Existe evidencia


estadística para rechazar hipótesis nula, el gasto medio de
compra por cada cliente ha disminuido.
Prueba Z de hipótesis para la media(σ conocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 )

Paso 1: Plantear Hipótesis:

H0 : 𝜇𝜇1 = 𝜇𝜇2 H0 : 𝜇𝜇1 ≤ 𝜇𝜇2 H0 : 𝜇𝜇1 , ≥ 𝜇𝜇2


H1 : 𝜇𝜇1 ≠ 𝜇𝜇2 H1 : 𝜇𝜇1 > 𝜇𝜇2 H1 : 𝜇𝜇1 < 𝜇𝜇2

Paso 2: Fijar nivel de significación 𝜶𝜶 = 𝟏𝟏𝟏. 𝟐𝟐𝟐, 𝟓𝟓𝟓, 𝒆𝒆𝒆𝒆𝒆𝒆

Paso 3: Estadístico de Prueba

𝑋𝑋�1 − 𝑋𝑋�2 − (𝜇𝜇1 − 𝜇𝜇2 )ℎ𝑖𝑖𝑖𝑖


Varianza poblacional Conocida: (muestras ≥30) 𝑍𝑍𝐶𝐶 =
𝜎𝜎1 2 𝜎𝜎2 2
𝑛𝑛1 + 𝑛𝑛2
Paso 4: Regiones Críticas:

Paso 5: Conclusiones
Prueba Z de hipótesis para la media(σ conocida)

Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 ), muestras ≥30

Usted produce agua embotellada y desea determinar si el


consumo de agua promedio diaria en la costa Atlántica es
superior al consumo en los Llanos Orientales.

Para ello, realiza las siguientes muestras aleatorias: 150


individuos de la costa atlántica, con un promedio muestral de
280 mililitros de agua diario, y 120 individuos de los llanos, con
un promedio muestral de 250 mililitros de agua diarios.

Suponga desviaciones poblacionales de 30 mililitros para costa y


35 mililitros para los llanos. ¿Existe evidencia de mayor
consumo en la costa? Pruebe a un nivel de significancia de
0.025.
Prueba Z de hipótesis para la media(σ conocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 ), muestras ≥30
Solución
𝑋𝑋𝑋: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 Datos población Datos Muestra
𝑋𝑋𝑋: 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 𝑑𝑑𝑑𝑑 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 𝑒𝑒𝑒𝑒 𝑙𝑙𝑙𝑙𝑙𝑙 𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙𝑙 1. Costa 2. Llanos
1. Costa 2. Llanos
Paso1: Plantear Hipótesis: 𝜎𝜎1 = 30 𝜎𝜎2 = 35 𝑛𝑛1 = 150 𝑛𝑛2 = 120
𝑋𝑋�1 = 280 𝑋𝑋�2 = 250
𝒉𝒉𝒐𝒐 : 𝝁𝝁𝟏𝟏 ≤ 𝝁𝝁𝟐𝟐 Existe evidencia de mayor
𝒉𝒉𝟏𝟏 : 𝝁𝝁𝟏𝟏 > 𝝁𝝁𝟐𝟐 consumo en la costa

Paso2: nivel de significación: 𝛼𝛼 = 0.025

Paso3: Estadístico de Prueba:

𝑋𝑋�1 − 𝑋𝑋�2 − (𝜇𝜇1 − 𝜇𝜇2 ) 280 − 250 − (0)


𝑍𝑍𝐶𝐶 = = = 7,45
𝜎𝜎1 2 𝜎𝜎2 2 302 352
𝑛𝑛1 + 𝑛𝑛2 150
+ 120
Prueba Z de hipótesis para la media(σ conocida)

Paso 5: Conclusiones 𝒉𝒉𝒐𝒐 : 𝝁𝝁𝟏𝟏 ≤ 𝝁𝝁𝟐𝟐


𝒉𝒉𝟏𝟏 : 𝝁𝝁𝟏𝟏 > 𝝁𝝁𝟐𝟐

𝑍𝑍𝐶𝐶 = 7,45

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1 − 𝛼𝛼 𝛼𝛼

𝑍𝑍 1−𝛼𝛼 = 𝑍𝑍 0,975 = 1,96

A un nivel de significación del 2.5%, Existe evidencia


estadística para rechazar hipótesis nula, existe evidencia de
mayor consumo en la costa.
Prueba T de hipótesis para la media(σ desconocida)
• Prueba de hipótesis para una media
• Prueba de hipótesis para dos medias
Prueba T de hipótesis para la media(σ desconocida)
Prueba de hipótesis para una media(𝜇𝜇)

Paso 1: Plantear Hipótesis:

H0 : 𝜇𝜇 = 𝜇𝜇0 H0 : 𝜇𝜇 ≤ 𝜇𝜇0 H0 : 𝜇𝜇 ≥ 𝜇𝜇0


H1 : 𝜇𝜇 ≠ 𝜇𝜇0 H1 : 𝜇𝜇 > 𝜇𝜇0 H1 : 𝜇𝜇 < 𝜇𝜇0

Paso 2: Fijar nivel de significación 𝜶𝜶 = 𝟏𝟏𝟏. 𝟐𝟐𝟐, 𝟓𝟓𝟓, 𝒆𝒆𝒆𝒆𝒆𝒆

Paso 3: Estadístico de Prueba


𝑋𝑋� − 𝜇𝜇hip
𝑇𝑇𝑐𝑐 = Si n<30,
𝑆𝑆
𝑛𝑛
Paso 4: Regiones Críticas:

Paso 5: Conclusiones:
Prueba T de hipótesis para la media (σ
desconocida)
Prueba de hipótesis para una media(𝜇𝜇): Ejercicio

En estudios previos se ha determinado que el nivel de


colesterol promedio de pacientes con problemas cardíacos es
220. Un cardiólogo piensa que en realidad el nivel es más alto y
para probar su afirmación usa la muestra:

217 223 225 245 238 216 217 226 202 233
235 242 219 221 234 199 236 248 218 224

¿Habrá suficiente evidencia estadística para apoyar la


afirmación del cardiólogo? Justificar su respuesta con un
α=0.05 fuente:
http://academic.uprm.edu/eacuna/miniman7sl.pdf
Prueba T de hipótesis para la media (σ desconocida)
Prueba de hipótesis para una media(𝜇𝜇) (n<30)
Solución :
𝑋𝑋: 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐
Datos población Datos Muestra

No hay datos 𝑛𝑛 = 20
Paso 1: Plantear Hipótesis: 𝑋𝑋� = 225.9
𝑆𝑆 = 13.094
𝒉𝒉𝒐𝒐 : 𝝁𝝁 ≤ 𝟐𝟐𝟐𝟐𝟐𝟐
H1 : 𝝁𝝁 > 𝟐𝟐𝟐𝟐𝟐𝟐 El nivel promedio de colesterol se ha Paso 4: Región crítica:
incrementado

Paso 2: nivel de significación: 𝛼𝛼 = 0.05

Paso 3: Estadístico de Prueba: 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

𝑋𝑋� − 𝜇𝜇 225.9 − 220


𝑇𝑇𝑐𝑐 = = = 2.015
𝑆𝑆 13.094 1 − 𝛼𝛼 𝛼𝛼
𝑛𝑛 20
𝑇𝑇 1−𝛼𝛼,𝑛𝑛−1 = 𝑇𝑇 0.95,19 = 1.729
Prueba T de hipótesis para la media (σ
desconocida)
Prueba de hipótesis para una media(𝜇𝜇) (n<30)

Paso5: conclusiones
𝒉𝒉𝒐𝒐 : 𝝁𝝁 ≤ 𝟐𝟐𝟐𝟐𝟐𝟐
𝑇𝑇𝐶𝐶 = 2.015
𝒉𝒉𝟏𝟏 : 𝝁𝝁 > 𝟐𝟐𝟐𝟐𝟐𝟐

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1 − 𝛼𝛼 𝛼𝛼

𝑇𝑇 1−𝛼𝛼,𝑛𝑛−1 = 𝑇𝑇 0.95,19 = 1.729

A un nivel de significación del 5%, Existe evidencia estadística


para rechazar hipótesis nula, por lo tanto el cardiólogo tiene
razón, el nivel de colesterol medio es es más alto
Prueba T de hipótesis para la media(σ desconocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 )

Paso 1: Plantear Hipótesis:

H0 : 𝜇𝜇1 = 𝜇𝜇2 H0 : 𝜇𝜇1 ≤ 𝜇𝜇2 H0 : 𝜇𝜇1 , ≥ 𝜇𝜇2


H1 : 𝜇𝜇1 ≠ 𝜇𝜇2 H1 : 𝜇𝜇1 > 𝜇𝜇2 H1 : 𝜇𝜇1 < 𝜇𝜇2

Paso 2: Fijar nivel de significación 𝜶𝜶 = 𝟏𝟏𝟏. 𝟐𝟐𝟐, 𝟓𝟓𝟓, 𝒆𝒆𝒆𝒆𝒆𝒆

Paso 3: Estadístico de Prueba

caso 1: Varianza poblacional desconocida, pero iguales σ1 2 = σ2 2 (Homogéneo)

𝑋𝑋�1 − 𝑋𝑋�2 − (𝜇𝜇1 − 𝜇𝜇2 )ℎ𝑖𝑖𝑖𝑖 Donde:


(𝑛𝑛 −1)𝑆𝑆 2
+ (𝑛𝑛 −1)𝑆𝑆 2
𝑇𝑇𝐶𝐶 = 𝑆𝑆𝑆𝑆2 =
1 1 2 2
1 1 𝑛𝑛1 + 𝑛𝑛2 − 2
𝑆𝑆𝑆𝑆2 +
𝑛𝑛1 𝑛𝑛2
𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺 𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿𝐿 = 𝑛𝑛1 +𝑛𝑛2 − 2
Prueba T de hipótesis para la media(σ desconocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 )

caso 2: Varianza poblacional desconocida pero diferentes 𝜎𝜎1 2 ≠ 𝜎𝜎2 2 (Heterogéneo)


2
𝑋𝑋�1 − 𝑋𝑋�2 − (𝜇𝜇1 − 𝜇𝜇2 )ℎ𝑖𝑖𝑖𝑖 𝑠𝑠1 2 𝑆𝑆2 2
+
𝑇𝑇𝐶𝐶 = 𝑛𝑛1 𝑛𝑛2
𝑔𝑔l =
𝑆𝑆1 2 𝑆𝑆2 2 2
𝑆𝑆2 2
𝑛𝑛1 + 𝑛𝑛2
2 2
𝑠𝑠1
𝑛𝑛1 𝑛𝑛2
+
𝑛𝑛1 − 1 𝑛𝑛2 − 1

Paso 4: Región crítica

Paso 5: Conclusiones
Prueba T de hipótesis para la media (σ
desconocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 )
En el año 2017 un tesista de Sociología realizó un muestreo a
10 hombres y 11 mujeres que laboran en el distrito de
Miraflores, encontrando un sueldo medio de s/ 540 con una
deviación estándar de 16 soles para los hombres, S/. 530 de
sueldo con una desviación estándar s/15 para las mujeres.

El tesista desea probar a un nivel de 1% si el sueldo medio de


los hombres es mayor que de las mujeres en más de 1 sol.

Asuma que la población de sueldos de los empleados de


miraflores sigue una distribución normal.

Nota: Según el último censo nacional, se sabe que en


Miraflores la variabilidad del sueldo entre hombres y mujeres
es igual.
Prueba T de hipótesis para la media(σ desconocida)
Prueba de hipótesis para dos medias(𝜇𝜇1 , 𝜇𝜇2 ), pero iguales σ1 2 = σ2 2 (ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜)
Solución
𝑋𝑋𝑋: 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 ℎ𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜𝑜 𝑒𝑒𝑒𝑒 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀
𝑋𝑋𝑋: 𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑒𝑒𝑒𝑒 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 Datos población Datos Muestra

Paso 1: Plantear Hipótesis: σ1 2 = σ2 2 1. hombres 2. Mujeres


𝑛𝑛1 = 10 𝑛𝑛2 = 11
𝒉𝒉𝒐𝒐 : 𝝁𝝁𝟏𝟏 ≤ 𝝁𝝁𝟐𝟐 +1 𝑋𝑋�1 = 540 𝑋𝑋�2 = 530
𝒉𝒉𝟏𝟏 : 𝝁𝝁𝟏𝟏 > 𝝁𝝁𝟐𝟐 +1 El sueldo se diferencia en mas de 1 𝑆𝑆1 = 16 𝑆𝑆2 = 15
sol

Paso 2: nivel de significación: 𝛼𝛼 = 0.01


(10 − 1)16 2 + (11 − 1)152

Paso 3: Estadístico de Prueba: 𝑆𝑆𝑆𝑆2 = = 239.68


10 + 11 − 2

𝑋𝑋�1 − 𝑋𝑋�2 − (𝜇𝜇1 − 𝜇𝜇2 ) 540 − 530 − (1)


𝑇𝑇𝐶𝐶 = = = 1.33
1 1 1 1
𝑆𝑆𝑆𝑆2 ( + ) 239.68 ( + )
𝑛𝑛1 𝑛𝑛2 10 11
Prueba T de hipótesis para la media (σ
desconocida)
Paso5: conclusiones 𝒉𝒉𝒐𝒐 : 𝝁𝝁𝟏𝟏 ≤ 𝝁𝝁𝟐𝟐 +1
𝒉𝒉𝟏𝟏 : 𝝁𝝁𝟏𝟏 > 𝝁𝝁𝟐𝟐 +1

𝑇𝑇𝐶𝐶 = 1.33
𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1 − 𝛼𝛼 𝜶𝜶=0.01

𝑇𝑇 1−𝛼𝛼 ; 𝑛𝑛1 +𝑛𝑛2−2


𝑇𝑇 0.99; 19 = 2.539
A un nivel de significación del 1%, no hay suficiente evidencia
estadística para rechazar hipótesis nula; el sueldo medio de
los hombres no es mayor que de las mujeres en más de 1 sol.
Prueba Z de hipótesis para la proporción
• Prueba de Hipótesis para una proporción
• Prueba de hipótesis para dos proporciones
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para una proporción (π)

Paso 1: Plantear Hipótesis:

H0 : π = π0 H0 : π ≤ π0 H0 : π ≥ π0
H1 : π ≠ π0 H1 : π > π0 H1 : π < π0

Paso 2: Fijar nivel de significación

Paso 3: Estadístico de Prueba


𝑝𝑝 − 𝜋𝜋ℎ𝑖𝑖𝑖𝑖
𝑍𝑍𝑐𝑐 =
𝜋𝜋ℎ𝑖𝑖𝑖𝑖 (1 − 𝜋𝜋ℎ𝑖𝑖𝑖𝑖 )
𝑛𝑛
Prueba Z de hipótesis para la proporción
Paso 4: Regiones Críticas:

H0 : π = π0 H0 : π ≤ π0
H1 : π ≠ π0 H1 : π > π0

𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎 𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎 𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎 𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎


𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎

𝛼𝛼/2 𝛼𝛼/2 1 − 𝛼𝛼 𝛼𝛼

H0 : π ≥ π0
H1 : π < π0
𝑹𝑹𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆𝒆 𝒉𝒉𝟎𝟎
𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨𝑨 𝒉𝒉𝟎𝟎
𝛼𝛼

Paso 5: Conclusiones:
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para una proporción (π)

Una funcionaria experimentada, preocupada por la


contaminación ambiental, afirma en una audiencia pública
que “menos del 60% de las plantas industriales de esta área
cumple con los estándares de cuidado del ambiente”.

Se realiza una nueva investigación. Para ello, se muestrea


aleatoriamente a 60 plantas de una población grande y
encuentra que 33 cumple con los estándares de cuidado del
ambiente.

¿Se sigue cumpliendo lo mencionado por la funcionaria en el


nuevo estudio? Use un nivel de significancia de 0.05 y asuma
la normalidad de la variable de interés
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para una proporción (π)

Solución
Datos población Datos Muestra
𝑋𝑋: 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑑𝑑𝑑𝑑 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑞𝑞𝑞𝑞𝑞𝑞 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐 𝑐𝑐𝑐𝑐𝑐𝑐 𝑙𝑙𝑙𝑙𝑙𝑙
𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 de calidad(X=33) No hay 𝑛𝑛 = 60
datos 𝑋𝑋 33
Paso 1: Plantear Hipótesis: 𝑃𝑃 = =
𝑛𝑛 60
𝑃𝑃 = 0.55
𝒉𝒉𝒐𝒐 : 𝝅𝝅 ≥ 𝟎𝟎. 𝟔𝟔
𝒉𝒉𝟏𝟏 : 𝝅𝝅 < 𝟎𝟎.6 menos del 60% cumple Paso 4: Región Crítica

Paso 2: Nivel de significación: 𝛼𝛼 = 0.05

Paso 3: Estadístico de Prueba:

𝑝𝑝 − 𝜋𝜋 0.55 − 0.6
𝑍𝑍𝑐𝑐 = = = −0.79
𝜋𝜋(1 − 𝜋𝜋) 0.6(0.4)
𝑛𝑛 60
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para una proporción (π)
𝒉𝒉𝒐𝒐 : 𝝅𝝅 ≥ 𝟎𝟎, 𝟔𝟔
Paso5: conclusiones 𝒉𝒉𝟏𝟏 : 𝝅𝝅 < 𝟎𝟎, 𝟔𝟔

𝑍𝑍𝑐𝑐 = −0.79

𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0

𝛼𝛼 1 − 𝛼𝛼

𝑍𝑍 0.05 = − 1,96
A un nivel de significación del 5%, hay suficiente evidencia
estadística para rechazar hipótesis nula. El porcentaje de
plantas industriales cumplen con los estándares de cuidado
del ambiente es menor que 60%.
Prueba Z de hipótesis para la proporción

Prueba de hipótesis para dos proporciones (𝜋𝜋1 , 𝜋𝜋2 )

Paso 1: Plantear Hipótesis:


H0 : 𝜋𝜋1 = 𝜋𝜋2 H0 : 𝜋𝜋1 ≤ 𝜋𝜋2 H0 : 𝜋𝜋1 ≥ 𝜋𝜋2
H1 : 𝜋𝜋1 ≠ 𝜋𝜋2 H1 : 𝜋𝜋1 > 𝜋𝜋2 H1 : 𝜋𝜋1 < 𝜋𝜋2

Paso 2: Fijar nivel de significación

Paso 3: Estadístico de Prueba


𝑝𝑝1 −𝑝𝑝2 −(𝜋𝜋1 − 𝜋𝜋2 )ℎ𝑖𝑖𝑖𝑖 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷:
𝑍𝑍𝑐𝑐 = 𝑋𝑋1 + 𝑋𝑋2
1 1 𝑝𝑝̅ =
𝑝𝑝̅ (1 − 𝑝𝑝)̅ + 𝑛𝑛1 + 𝑛𝑛2
𝑛𝑛1 𝑛𝑛2

Paso 4: Regiones Críticas:

Paso 5: Conclusiones:
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para dos proporciones (𝜋𝜋1 , 𝜋𝜋2 )

Considere el caso de una compañía que fabrica productos


medicinales y que está probando dos nuevos compuestos
destinados a reducir los niveles de presión sanguínea.

Los compuestos se administran a dos conjuntos de animales de


laboratorio.

*En el grupo uno, 71 de 100 animales respondieron a


la droga 1 con niveles menores de presión arterial.

*En el grupo dos, 58 de 90 animales respondieron a la


droga 2 con menores niveles de presión sanguínea.

La compañía desea probar a un nivel de significancia de 0.05 si


existe una diferencia en la eficacia de las dos medicinas.
Prueba Z de hipótesis para la proporción
Prueba de hipótesis para dos proporciones (𝜋𝜋1 , 𝜋𝜋2 )
Solución :
Datos población Datos Muestra
𝑋𝑋𝑋: Número animales que respondieron a la droga 1 (X1=71)
𝑋𝑋𝑋: Número animales que respondieron a la droga 2 (X2=58) No hay datos Droga 1 Droga 2
𝑛𝑛1 = 100 𝑛𝑛2 = 90
Paso1: Plantear Hipótesis: 𝑋𝑋1 71 𝑋𝑋2 58
𝑝𝑝1 = = 𝑝𝑝2 = =
𝑛𝑛1 100 𝑛𝑛2 90
ℎ𝑜𝑜 : 𝜋𝜋1 = 𝜋𝜋2 𝑝𝑝1 = 0.71 𝑝𝑝2 = 0.644
ℎ1 : 𝜋𝜋1 ≠ 𝜋𝜋2 sí existe diferencia entre ellas dos

Paso2: nivel de significación: 𝛼𝛼 = 0.05 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷:

𝑋𝑋1 + 𝑋𝑋2 71 + 58
Paso3: Estadístico de Prueba: 𝑝𝑝̅ = =
𝑛𝑛1 + 𝑛𝑛2 100 + 90
𝑝𝑝̅ = 0.6789
𝑝𝑝1 −𝑝𝑝2 −(𝜋𝜋1 − 𝜋𝜋1 ) 0,71 − 0,644 − (0)
𝑍𝑍𝑐𝑐 = = = 0.973
1 1 1 1
𝑝𝑝̅ (1 − 𝑝𝑝)̅ + 0,6789 (0,3211) +
𝑛𝑛1 𝑛𝑛2 100 90
Prueba Z de hipótesis para la proporción

Paso 4: Región Crítica


𝑍𝑍𝑐𝑐 = 0,973

𝛼𝛼 = 0.05

𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0 𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1 − 𝛼𝛼
𝛼𝛼� = 0.025 𝛼𝛼� = 0.025
2 2

𝑍𝑍 𝛼𝛼 𝑍𝑍
= 0.025
≈ −1,96 𝑍𝑍 0.975 ≈ 1,96
2

A un nivel de significación del 5%, no existe suficiente


evidencia estadística para rechazar hipótesis nula. No
existe una diferencia en la eficacia de las dos medicinas
Prueba de hipótesis aplicando Chi cuadrada (uso de
la tabla)
• Prueba de Hipótesis para la varianza
• Prueba de Independencia y homogeneidad
Prueba de hipótesis aplicando Chi cuadrado
Distribución Chi-cuadrado

𝑋𝑋 2 𝑛𝑛−1

Tabla Chi-cuadrado
Prueba de hipótesis: aplicaciones Chi-cuadrado
Prueba de Hipótesis para la varianza

Paso 1: Plantear Hipótesis:

H0 : 𝜎𝜎 2 = 𝜎𝜎 2 0 H0 : 𝜎𝜎 2 ≤ 𝜎𝜎 2 0 H0 : 𝜎𝜎 2 ≥ 𝜎𝜎 2 0
H1 : 𝜎𝜎 2 ≠ 𝜎𝜎 2 0 H1 : 𝜎𝜎 2 > 𝜎𝜎 2 0 H1 : 𝜎𝜎 2 < 𝜎𝜎 2 0

Paso 2: Fijar nivel de significación

Paso 3: Estadístico de Prueba

(𝑛𝑛 − 1)𝑆𝑆 2 Grado de libertad: 𝑛𝑛 − 1


𝑋𝑋𝐶𝐶 2 =
𝜎𝜎 2 𝐻𝐻𝐻𝐻𝐻𝐻
Prueba de hipótesis: aplicaciones Chi-cuadrado
Paso 4: Regiones Críticas:

H0 : 𝜎𝜎 2 = 𝜎𝜎 2 0 H0 : 𝜎𝜎 2 ≤ 𝜎𝜎 2 0
H1 : 𝜎𝜎 2 ≠ 𝜎𝜎 2 0 H1 : 𝜎𝜎 2 > 𝜎𝜎 2 0

𝑹𝑹𝒉𝒉𝟎𝟎 𝑹𝑹𝒉𝒉𝟎𝟎
𝑹𝑹𝒉𝒉𝟎𝟎

1-𝛼𝛼 𝛼𝛼
𝛼𝛼/2 𝛼𝛼/2

H0 : 𝜎𝜎 2 ≥ 𝜎𝜎 2 0
H1 : 𝜎𝜎 2 < 𝜎𝜎 2 0

1-𝛼𝛼
𝑹𝑹𝒉𝒉𝟎𝟎

𝛼𝛼

Paso 5: Conclusiones
Prueba de hipótesis: aplicaciones Chi-
cuadrado
Prueba de Hipótesis para la varianza: Ejercicio
En Pamolsa se produce los frascos PET que generalmente es
usado para almacenar los perfumes más prestigiosos de
nuestro país, Se sabe que durante mucho tiempo los envases
PET han tenido una medida del diámetro de la tapa cuya
varianza era 4 milímetros.

El nuevo gerente espera que haya disminuido la variabilidad del


diámetro de la tapa, para ello sus asistente realiza una muestra
aleatoria de 24 envases PET, encontrándose una varianza de
4.9 milímetros

¿Qué noticias le dará el asistente a su gerente? Habrá


disminuido la variabilidad? Use un nivel de significancia del 5%
para realizar cualquier prueba.
Prueba de hipótesis: Aplicaciones Chi-cuadrado
Prueba de Hipótesis para la varianza:
Solución :
Datos población Datos Muestra
𝑋𝑋𝑋: 𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 de PET
No hay datos 𝑛𝑛 = 24
Paso1: Plantear Hipótesis: 𝑆𝑆 2 = 4.9
𝒉𝒉𝒐𝒐 : 𝝈𝝈𝟐𝟐 ≥ 𝟒𝟒
𝒉𝒉𝟏𝟏 : 𝝈𝝈𝟐𝟐 < 4 Disminución variabilidad

Paso2: nivel de significación: 𝛼𝛼 = 0.05

Paso3: Estadístico de Prueba:

(𝑛𝑛−1)𝑆𝑆 2 (24−1)(4.9)
𝑋𝑋 2 𝑐𝑐 = = = 28,18
𝜎𝜎2 0 4
Prueba de hipótesis: Aplicaciones Chi-cuadrado
Paso 4: Regiones Críticas

Rechazo 𝒉𝒉𝟎𝟎 1-𝛼𝛼

𝛼𝛼 = 0.05

𝑋𝑋 2 (0.05,23) =13.848

Paso 5: Conclusión

A un nivel de significación del 5% no existe evidencia estadística para rechazar H0; por lo
tanto, podemos afirmar que la varianza no ha disminuido y tenemos malas noticias para el
gerente.
Aplicaciones de Chi-cuadrado

Prueba Chi Cuadrado

Dos Variables
Una Variable

Prueba De
Independencia
Prueba
De Bondad
De Ajuste Prueba De
Homogeneidad
Aplicaciones de Chi-cuadrado
Prueba de Independencia

Es una prueba estadística para evaluar hipótesis acerca de la


relación entre dos variables categóricas

Notación: χ2
Variables Dos variables (la prueba Chi-cuadrada no
involucradas: considera relaciones causales).
Nivel de medición Nominal u ordinal
de las variables

Prueba de Hipótesis
H0: Las variables no están asociadas( son independientes)

H1: Las variables están asociadas (no son independientes)


Aplicaciones Chi-cuadrado
Prueba de Independencia
Paso1: Plantear Hipótesis:
H0: No existe relación entre las variables (Independencia).
H1: Existe relación entre las variables (No independencia).

Paso2: nivel de significación: 𝛼𝛼 = 1%, 5%, 10%, 𝑒𝑒𝑒𝑒𝑒𝑒 …

Paso3: Estadístico de Prueba:


Donde:
O: frecuencia observada
� 𝑂𝑂𝑖𝑖 − 𝐸𝐸𝑖𝑖 2 en cada celda
𝑋𝑋𝐶𝐶 2 = E: frecuencia esperada
𝐸𝐸𝑖𝑖
en cada celda

𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 ∗ 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶


𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝐸𝐸 =
𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
Aplicaciones Chi-cuadrado
Prueba de Independencia
Paso4: Region Crítica:

𝑹𝑹𝒉𝒉𝟎𝟎
1-𝛼𝛼
𝛼𝛼

𝑋𝑋 2 1−𝛼𝛼;𝑔𝑔𝑔𝑔

𝑔𝑔𝑔𝑔 = #𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 − 1 #𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 − 1

Paso 5: Conclusiones:
Aplicaciones Chi-cuadrado
Prueba de Independencia: ejercicios
Se estudia a 1040 estudiantes de los niveles de educación
primaria y secundaria y a los cuales se aplica un instrumento que
mide el aprendizaje de la matemática, en las dimensiones de
aprendizaje conceptual, procedimental y actitudinal.
TABLA DE CONTINGENCIA

Nivel de educación
Primaria Secundaria

Conceptual 180 100


Aprendizaje 190 280
Procedimental
Actitudinal 170 120

Existe relación entre el tipo de aprendizaje y el nivel educativo de


los niños?. Use alfa 5%
Aplicaciones Chi-cuadrado
Prueba de Independencia
Frecuencia observada y Frecuencia esperada::
Nivel de educación TOTAL
Primaria Secundaria

Conceptual 180 (145.4) 100 (134.6) 280


Aprendizaje 190 (244.0) 280 (226.0) 470
Procedimental
170 (150.6) 120 (139.4) 290
Actitudinal
TOTAL 540 500 1040

540(280) 500(280)
𝐸𝐸11 = = 145.4 𝐸𝐸12 = = 134.6 APRENDIZAJE:
1040 1040
categorías: Conceptual,Procedimental,
540(470) 500(470) Actitudinal.
= 244.0 𝐸𝐸22 = =226.0
𝐸𝐸21 = 1040
1040

NIVEL DE EDUCACIÓN:
540(290) 500(290) categorías: Primaria, Secundaria.
𝐸𝐸32 = = 139.4
𝐸𝐸31 = 1040 = 150.6 1040
Aplicaciones Chi-cuadrado
Prueba de Independencia
Solución
Paso1: Plantear Hipótesis:
H0: No existe relación entre el aprendizaje y los niveles de educación(Independencia).
H1: Existe relación entre el aprendizaje y niveles de educación (No independencia).

Paso2: nivel de significación: 𝛼𝛼 = 0.05

Paso3: Estadístico de Prueba:


2
2
� 𝑂𝑂𝑖𝑖 − 𝐸𝐸𝑖𝑖
𝑋𝑋𝐶𝐶 =
𝐸𝐸𝑖𝑖
𝑋𝑋𝐶𝐶 2
2 2 2 2 2
180 − 145.4 100 − 134.6 190 − 244.0 280 − 226.0 170 − 150.6
= + + + +
145.4 134.6 244.0 226.0 150.6
2
120 − 139,4
+ = 47.33
139.4
Aplicaciones Chi-cuadrado
Prueba de Independencia

Paso 4: Región crítica: 𝑔𝑔𝑔𝑔 = #𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 − 1 #𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 − 1


𝑔𝑔𝑔𝑔 = (3−1)(2−1)=2
𝑋𝑋𝐶𝐶 2 = 47.33

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1-𝛼𝛼 𝛼𝛼

𝑋𝑋 2 1−𝛼𝛼;𝑔𝑔𝑔𝑔 = 𝑋𝑋 2 0,95;2 =5.991


Paso 5: conclusión:
A un nivel de significancia del 5%, Existe evidencia estadística para Rho.
Existe relación entre el aprendizaje y niveles de educación
Aplicaciones Chi-cuadrado
Prueba de Homogeneidad
Paso 1: Plantear Hipótesis:
H0: Las muestras provienen de la misma población (son iguales).
H1: Las muestras no provienen de la misma población (no son
iguales).
Paso 2: nivel de significación: 𝛼𝛼 = 1%, 5%, 10%, 𝑒𝑒𝑒𝑒𝑒𝑒 …
Paso 3: Estadístico de Prueba:

Donde:
2
� 𝑂𝑂𝑖𝑖 − 𝐸𝐸𝑖𝑖 O: frecuencia observada
𝑋𝑋𝐶𝐶 2 = en cada celda
𝐸𝐸𝑖𝑖
E: frecuencia esperada
en cada celda

𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 ∗ 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶


𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹𝐹 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 𝐸𝐸 =
𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺 𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇
Aplicaciones Chi -cuadrado
Prueba de Homogeneidad

Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación al distribuidor que nos
lo suministra.
Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven
el producto, comprobando el número de defectuosos en cada lote.
La siguiente tabla muestra el número de defectuosos en para cada uno de los distribuidores.

Frecuencia observada
Componente TOTAL
Defectuoso No defectuoso

D1 16 94 100
Distribuidor
D2 24 76 100

D3 9 81 100

TOTAL 49 251 300


Aplicaciones chi-cuadrado
Prueba de Homogenidad
Frecuencia observada y Frecuencia esperada::
componente TOTAL
Defectuoso No defectuoso

Distribuidor 1 16 (16.33) 94 (83.66) 100


Distribuidor
Distribuidor 2 24(16.33 76(83.66) 100

Distribuidor 3 9(16.33) 81(83.66) 100

TOTAL 49 251 300

49(100) 251(100)
𝐸𝐸11 = = 16.33 𝐸𝐸12 = = 83.66
300 300

49(100) 𝐸𝐸22 = 251(100) = 83.66


𝐸𝐸21 = = 16.33
300 300

49(100) 251(100)
𝐸𝐸31 = = 16.33 𝐸𝐸32 = = 83.66
300 300
Aplicaciones Chi-cuadrado
Prueba de Homogeneidad
Solución
Paso1: Plantear Hipótesis:

H0: No hay diferencia entre los tres distribuidores sobre los componentes defectuosos( son iguales).
H1: si hay diferencia entre los tres distribuidores sobre los componentes defectuosos(no son iguales).

Paso 2: Nivel de significación: 𝛼𝛼 = 0.05

Paso 3: Estadístico de Prueba:


2
� 𝑂𝑂𝑖𝑖 − 𝐸𝐸𝑖𝑖
𝑋𝑋𝐶𝐶 2 =
𝐸𝐸𝑖𝑖
2
𝑋𝑋𝐶𝐶
2 2 2 2 2
16 − 16.33 94 − 83.66 24 − 16.33 76 − 83.66 9 − 16.33
= + + + +
16.33 83.66 16.33 83.66 16.33
81 − 83.66 2
+ = 8.96
83.66
Aplicaciones Chi-cuadrado
Prueba de Independencia

Paso 4: Región crítica:

𝑔𝑔𝑔𝑔 = #𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓 − 1 #𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶𝐶 − 1


𝑋𝑋𝐶𝐶 2 = 8.96 𝑔𝑔𝑔𝑔 = (3−1)(2−1)=2

𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴𝐴 ℎ0 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ℎ0

1-𝛼𝛼 𝛼𝛼

𝑋𝑋 2 1−𝛼𝛼;𝑔𝑔𝑔𝑔 = 𝑋𝑋 2 0.95;2 =5.991

Debemos concluir que no existe homogeneidad y, por lo tanto, que hay diferencias entre los tres distribuidores.
Conclusiones
1. Prueba de Hipótesis:
 La prueba de hipótesis es una suposición, en entorno a un
parámetro(𝜃𝜃), pueden existir 2 tipos de hipótesis alterna y nula.
2. Metodologías para la prueba de hipótesis
 Existe 5 pasos para realizar una prueba de hipótesis estadística.
3. Prueba Z de hipótesis para la media(σ conocida)
 Si el tamaño de la muestra (s) es mayor a 30, se usa la
distribución normal estándar, ya sea para una o dos medias.
4. Prueba T de hipótesis para la media(σ desconocida)
 Si el tamaño de la muestra (s) es menor a 30, se usa la
distribución distribución T, ya sea para una o dos medias.
5. Prueba Z de hipótesis para la proporción
 Se usa generalmente para una variable cualitativa, donde exista
una proporción o porcentaje para cierta categoría.
6. Prueba de hipótesis aplicando Chi cuadrada
 La aplicación más importante es la prueba de independencia
para medir la asociación de 2 variables y la prueba de bondad de
ajuste para describir una distribución teórica.
Gracias
Docente: Fredy Vivanco Huaytara

Potrebbero piacerti anche