Sei sulla pagina 1di 29

INFERENCIA ESTADÍSTICA

Pruebas de independencia y
Homogeneidad

c r (nij  eij ) 2 M. Tatiana Burga Ghersi


 2  
j 1 i 1 eij mburga@usat.edu.pe
Estadística y Probabilidad

www.usat.edu.pe
www.usat.edu.pe
Competencias del Perfil del egresado

• La asignatura ESTADÍSTICA Y PROBABILIDADES, que corresponde al


área de estudios Específicas, contribuye al logro del perfil de egreso,
específicamente a la(s) competencia(s):
- Diseñar sistemas productivos en organizaciones industriales y de
servicios, de manera sostenible aplicando tecnologías y herramientas
de ingeniería y de disciplinas afines para la mejora de la productividad.
- Dirigir sistemas productivos, administrativos y comerciales, en
organizaciones industriales y de servicios; satisfaciendo las
necesidades socio económicas y ambientales.
- Gestionar el talento humano en las actividades productivas,
administrativas y comerciales, para resolver problemas socios
económicos, ambientales y empresariales

2 www.usat.edu.pe
Competencia de la asignatura

Aplica métodos y técnicas de la estadística


descriptiva e inferencial en el estudio de
problemas aplicados a su especialidad
para el análisis y la toma de decisiones.

3 www.usat.edu.pe
Resultado de aprendizaje

Resultado de aprendizaje N° 03 (RA3)


Estima características poblacionales y pruebas de
hipótesis de una o dos variables, así como la relación
entre ellas.

IND5: Efectúa análisis inferencial usando las técnicas


de estimación por intervalos y pruebas de hipótesis.

4 www.usat.edu.pe
Objetivos

 Realizar la Prueba de
independencia de dos variables
cualitativas o categóricas.
 Realizar la Prueba de
Homogeneidad de distribuciones.

www.usat.edu.pe
Contenidos
Aplicaciones de la prueba Chi-Cuadrado

• Prueba de independencia de variables.


• Prueba de homogeneidad de poblaciones.

6 www.usat.edu.pe
Prueba de Independencia
El objetivo de la Prueba de Independencia es determinar la posible
relación entre dos variables cualitativas o categóricas.

Variable A con r valores o categorías: A1, A2, … , Ar


Variable B con c valores o categorías: B1, B2, … , Bc.

Las hipótesis nula y alterna son que se somete a prueba es:


Ho: Las variables A y B son independientes (no hay relación)
H1: Las variables A y B no son independientes (que existe relación)
Estadístico: Prueba Chi-Cuadrado:
c r (nij  eij ) 2 Tiene distribución Chi-Cuadrado con
  
2
Grados de libertad, df = (r-1)(c-1)
j 1 i 1 eij

7 www.usat.edu.pe
Prueba de Independencia
Para calcular el valor experimental del estadístico Chi.Cuadrado:
a) Se obtiene una muestra aleatoria de n objetos o sujetos
b) Se clasifican los n elementos de la muestra en una tabla de contingencia, o
tabla de frecuencias conjunta, contiene las frecuencias observadas
n11 = frecuencia observada conjunta de la fila 1
cuya estructura general es:
y la columna 1

nij = frecuencia observada conjunta

de la fila i y la columna j
n1. = Total de la fila 1
ni. = Total de la fila i

n.1 = Total de la columna 1


n.j = Total de la columna j
n.. = n frecuencia total
Hay r*c frecuencias observadas
8 www.usat.edu.pe
 c) Se calculan las frecuencias esperadas , hay también r*c frecuencias esperadas

i = 1,2,…,r, j = 1,2,…,c
  = 𝒏𝒊 . 𝒏. 𝒋
𝒆
 𝑒 = 𝑛1 . 𝑛.1   = 𝑛2 . 𝑛. 3
𝑒
𝒊𝒋
𝒏
d) Se calcula
11 el
𝑛 valor experimental
23
𝑛 del estadístico Chi-Cuadrado.

c r (nij  eij ) 2
 2  
j 1 i 1 eij
El p-valor se calcula con la siguiente función de Excel; DISTR.CHICUAD.CD(;15)

P-valor =

DISTR.CHI.CUAD.CD(X; grados de libertad)

www.usat.edu.pe
Prueba de Independencia con MegaStat

Ejemplo 1
Un ingeniero lleva adelante un estudio con el objetivo de descubrir la posible
relación que puede existir entre el las fallas de que presentan cinco máquinas
y el turno de operación de dichas máquinas. Se han obtenidos datos de 160
fallas y se han clasificado en la siguiente tabla de contingencia.

Realizar la Prueba de independencia para las dos variables involucradas

10 www.usat.edu.pe
Ejemplo de Prueba de Independencia
Hipótesis
1) Ho: La falla de las máquinas y el turno de operación son independientes
H1:La falla de las máquinas y el turno de operación no son independientes
2) Nivel de significancia 5%
3) Estadístico de prueba. Chi-Cuadrado de independencia
c r (nij  eij ) 2
 2  
j 1 i 1 eij

4) Cálculo del valor de la prueba Chi-Cuadrado


Calculamos primero las 12 frecuencias esperadas

  =   =   =

www.usat.edu.pe
Ejemplo de Prueba de Independencia
Frecuencias esperadas

c r (nij  eij ) 2 (12  9.41) 2 (6  7.53) 2 (18  17.89) 2


       ...   2.87
2 2

eij 9.41 7.53 17.89


j 1 i 1

2
 𝜒 =2.87
=DISTR.CHI.CUAD.CD(2.78; 6)
5) p-valor =0.8250,
6) decisión: No se rechaza la hipótesis nula
7) Conclusión: no hay asociación entre las fallas de las máquinas y el turno de trabajo,
es decir, son independientes.
12 www.usat.edu.pe
Prueba de Independencia con MegaStat

Prueba Chi-
Cuadrado con
MegaStat

A partir de tabla A partir de una


de contingencia base de datos

13 www.usat.edu.pe
Prueba de Independencia con MegaStat

A partir de una Tabla de contingencia


MegaStat
Chi-Square/Crosstab
Contingency table

14 www.usat.edu.pe
Prueba de Independencia con MegaStat

Cálculo del valor de la prueba Chi-Cuadrado y p-valor

www.usat.edu.pe
Prueba de Independencia con MegaStat

Los valores de Chi-Cuadrado y el p-valor son los mismos que se calcularon


anteriormente, por lo tanto la decisión y la conclusión son las mismas

www.usat.edu.pe
Coeficiente de Cramer´s
Rango de valores [0 hasta 1]

•Cramérs V = 0: no hay relación entre X e Y


•Cramérs V = 1: hay una relación perfecta entre X e Y
•Cramérs V = 0,6: hay una correlación relativamente intensa entre X e Y

Dado que Cramérs V es un número siempre positivo, no se pueden hacer


afirmaciones acerca de la dirección de la relación.

El coeficiente de contingencia
Se rige por las mismas reglas de la correlación y las mediciones de
índice correspondiente de -1 a +1, pasando por el cero, donde este
último significa correlación entre las variables estudiadas y los dos
primeros la correlación máxima. 

17 www.usat.edu.pe
Prueba de Homogeneidad

www.usat.edu.pe
Prueba de Homogeneidad

OBJETIVO: Esta prueba tiene como objetivo analizar si una


variable cualitativa o categórica se distribuye de manera
uniforme en c poblaciones.

Sea A una variable cualitativa con r: categorías: A1, A2, …, Ar.

HIPÓTESIS.
Las hipótesis nula y alternativa de una prueba de homogeneidad son:
Ho: La variable A se distribuye de manera uniforme en las c poblaciones.
H1: La variable A no se distribuye de manera uniforme en las c poblaciones.

www.usat.edu.pe
Prueba de Homogeneidad
c r (nij  eij ) 2
ESTADÍSTICO DE PRUEBA  2  
j 1 i 1 eij

Si la hipótesis nula es cierta, el estadístico tiene distribución Chi-cuadrado


con grados libertad df = (r-1)*(c-1).

Para calcular el valor del estadístico Chi-Cuadrado de homogeneidad:


a) Se toman muestras aleatorias de tamaños n1, n2, …, nc,
respectivamente, de las c poblaciones.
b) Se forma una tabla de contingencia con las distribuciones de frecuencias
de cada muestra, la estructura de dicha tabla de contingencia es la misma
de la prueba de independencia.
Para calcular el valor del estadístico Chi-cuadrado y el p-valor, se procede
exactamente igual que en el caso de la prueba de independencia.
20 www.usat.edu.pe
Prueba de Homogeneidad- Ejemplo
EJEMPLO.
Un empresario desea saber si los consumidores de cinco
marcas de gaseosa:
Coca-cola, Pepsi, Inca cola, Kola real y Fanta se distribuyen de
manera uniforme en las ciudades de Piura, Chiclayo, Trujillo y
Lima.

Con tal propósito realiza una encuesta a sendas muestras de


consumidores de gaseosa en las cuatro ciudades. Los
resultados se presentan en la tabla de contingencia siguiente.

www.usat.edu.pe
Prueba de Homogeneidad-Ejemplo
Marca de gaseosa Piura Chiclayo Trujillo Lima
Coca-cola 60 90 122 138
Pepsi 120 130 102 162
Inca kola 104 100 114 152
Kola real 72 50 38 46
Fanta 44 130 74 102
Tamaño de
400 500 450 600
muestra (nj)

¿Es posible concluir que las proporciones de consumidores de las cinco


marcas de gaseosa no son homogéneas en las cuatro ciudades? Use un
nivel de significancia del 5%.

22 www.usat.edu.pe
Prueba de Homogeneidad-Ejemplo
Hipótesis
1) Ho: Las distribuciones del consumo de las cinco marcas de gaseosa en las cuatro
ciudades es homogénea
Ho: Las distribuciones del consumo de las cinco marcas de gaseosa en las cuatro
ciudades no es homogénea.
2) Nivel de significancia, 5%
3) Estadístico de prueba: Prueba Chi-Cuadrado de homogeneidad
c r (nij  eij ) 2
 2  
j 1 i 1 eij
4) Cálculo del valor del estadístico Chi-Cuadrado.

e11 =410*400/1950= 84.103, e12 = 410*500/1950 = 105.128, …,


e54 = 350*600/1950 = 107.692,

Las 20 frecuencias esperadas se muestran en la siguiente tabla

www.usat.edu.pe
Prueba de Homogeneidad-Ejemplo

Frecuencias esperadas, eij


Marca de gaseosa Piura Chiclayo Trujillo Lima Total
Coca-cola 84.103 105.128 94.615 126.154 410
Pepsi 105.436 131.795 118.615 158.154 514
Inca kola 96.410 120.513 108.462 144.615 470
Kola real 42.256 52.821 47.538 63.385 206
Fanta 71.795 89.744 80.769 107.692 350
Tamaño de muestra 400 500 450 600 1950
(nj)

24 www.usat.edu.pe
Prueba de Homogeneidad-Ejemplo
Términos del estadístico Ji-Cuadrado
Marca de gaseosa Piura Chiclayo Trujillo Lima Total
Coca-cola 6.907 2.177 7.926 1.112 18.123
Pepsi 2.012 0.024 2.327 0.094 4.457
Inca kola 0.597 3.492 0.283 0.377 4.749
Kola real 20.936 0.151 1.914 4.768 27.769
Fanta 10.761 18.058 0.567 0.301 29.687
Tamaño de 41.213 23.901 13.017 6.652 84.784
muestra (nj)

c r (nij  eij ) 2
 2   = 6.907 + 2.177 + 7.926 + 1.112 + 2.012 + … + 0.567 + 0.301 = 84.784
j 1 i 1 eij

25 www.usat.edu.pe
Prueba de Homogeneidad-Ejemplo

5) Cálculo del p-valor.


Usamos la función de Excel =DISTR.CHI.CUAD.CD(84.784; 12)

p-valor = 5.00803E-13 =0.0000

6) Decisión. Dado que p-valor < 0.05, se rechaza la hipótesis nula.

7) Conclusión.
La distribución del consumo de las cinco marcas de gaseosa no
es homogénea.

Actividad: Calcular el valor del estadístico Chi-Cuadrado y el


p-valor usando MegaStat.

www.usat.edu.pe
Conclusiones
• La prueba Chi-Cuadrado de independencia permite detectar la
relación entre dos variables cualitativas o categóricas
• La prueba Chi-Cuadrado de Homogeneidad permite
determinar si la distribución de una variable cualitativa es
homogénea en c poblaciones
• La prueba de Independencia se lleva a cabo con una muestra
de tamaño n tomada de una población y la prueba de
Homogeneidad se lleva a cabo con c muestras independientes
tomadas de c poblaciones.

27 www.usat.edu.pe
Referencias
DEVORE, J. (1998). Probabilidad y estadística para ingeniería y
ciencias. México. International Thomson Editores.
MONTGOMERY, D. (1996). Probabilidad y Estadística y
Probabilidades a la Ingeniería. Ed. McGraw-Hill Interamericana Editores
S.A. Impreso en México 1996.
MENDENHALL W., TERRY S. (1997). Probabilidad y estadística
para ingeniería y ciencias. México. Prentice Hall Hispanoamericana.
ROSS, SHELDON. (2001) Probabilidad y Estadística para
Ingeniería. México, D.F.: McGraw-Hill.
WALPOLE R., MYERS R., MYERS. S. (1999). Probabilidad y
estadística para ingenieros. México. Prentice Hall Hispanoamericana.

28 www.usat.edu.pe
María Tatiana Burga Ghersi
mburga@usat.edu.pe

http://www.facebook.com/usat.peru

https://twitter.com/usatenlinea

https://www.youtube.com/user/tvusat

https://plus.google.com/+usateduperu

29 www.usat.edu.pe

Potrebbero piacerti anche