Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Matricula. 100317592
Análisis a nivel binomial
Chi cuadrado
Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis
nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente
especificada como el modelo matemático de la población que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor
o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi ,
donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores
según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se
define como:
Una prueba de chi-cuadrada es una prueba de hipótesis que compara la distribución observada
de los datos con una distribución esperada de los datos.
Existen varios tipos de pruebas de chi-cuadrada:
Prueba de bondad de ajuste de chi-cuadrada
Utilice este análisis para probar qué tan bien una muestra de datos categóricos se ajusta a una
distribución teórica.
Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado muchas veces y
utilizando una prueba de bondad de ajuste de chi-cuadrada para determinar si los resultados
siguen una distribución uniforme. En este caso, el estadístico de chi-cuadrada cuantifica qué
tanto varía la distribución observada de los conteos con respecto a la distribución hipotética.
Pruebas de chi-cuadrada de asociación e independencia
Los cálculos para estas pruebas son iguales, pero la pregunta que se está tratando de contestar
puede ser diferente.
Prueba de asociación: Utilice una prueba de asociación para determinar si una variable está
asociada a otra variable. Por ejemplo, determine si las ventas de diferentes colores de automóviles
dependen de la ciudad donde se venden.
Prueba de independencia: Utilice una prueba de independencia para determinar si el valor
observado de una variable depende del valor observado de otra variable. Por ejemplo, determine
si el hecho de que una persona vote por un candidato no depende del sexo del elector.
Es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad
de la variable aleatoria:
X= Z1²+…+Zk²
donde Zi son variables de distribución normal, de media cero y varianza uno.
El que la variable aleatoria X tenga esta distribución se representa habitualmente así:
X ~ Xk²
Una variable Chi cuadrada se define como la suma de n variables normales estandarizadas elevadas al
cuadrado.
Algunas de sus características:
La distribución es asimétrica positiva.
A medida que aumenta el tamaño de la muestra la curva es menos asimétrica, aproximándose a una curva
normal.
Para cada tamaño muestral, se tendrá una distribución χ2 diferente.
El parámetro que caracteriza a una distribución χ2 son sus grados de libertad (n-1), originado una
distribución para cada grado de libertad.
La Distribución de probabilidad de esta función para valores menores de un x dado, que representamos
por
donde:
Esta integral no tiene una solución conocida, y solo se conocen métodos numéricos para calcular sus
valores, hay distintos tipos de tablas y algoritmos para ordenador con los que se pueden calcular sus
soluciones, veamos una tabla distribución chi-cuadrado y su modo de utilización.
donde:
Prueba de bondad de ajuste. Frecuencias esperadas desiguales. Ejemplo 2 Un banco clasifica las
cuentas por cobrar como “al día”, “atrasadas” e “incobrables. Las cifras en el sector muestran que el
60% de las cuentas por cobrar están al día, 30% son atrasadas y 10% son incobrables. El departamento
jurídico del Banco tiene 500 cuentas por cobrar: 320 están al día, 120 tienen atraso y 60 son
incobrables. Estos números concuerdan con la distribución en el sector. Utilice el nivel de significación
de 0.05 Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio) Ho: no hay diferencia con la
distribución en el sector H1: hay diferencia con la distribución en el sector Segundo Paso: Nivel de
significancia 0,05 Tercer Paso: Valor estadístico de prueba Donde X2= 9,33 Cuarto Paso: Plantear la
regla de decisión. (Apéndice B3) α= 0,05 Grados de libertad = K-1 =3-1 =2 X2=5,991 Como
X2(15,31) > 9,488 se rechaza la Ho y se acepta la H1TIPOfe(fo-fe)(fo-fe)2(fo-fe)2/fefo%Al
corriente32060300204001,33atrasadas12030150-309006,00No
cobrables601050101002,00TOTAL50010050009,33C x C
La prueba chi cuadrado consiste en la comparación entre la frecuencia observada en un intervalo de
clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la hipótesis nula formulada.
Es decir, se quiere determinar si las frecuencias observadas en la muestra están lo suficientemente
cerca de las frecuencias esperadas bajo la hipótesis nula.
Para realizar el cálculo de ji cuadrada se siguen los siguientes pasos:
- Elevar al cuadrado cada una de las diferencias observadas entre fo y fe. Esto es (fo - fe)2
- Dividir los resultados de la columna 2 entre la frecuencia esperada y sumar estos valores. La suma
es el valor de ji cuadrada.
Si no hay una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas, se
supondría que las frecuencias observadas fueran iguales o aproximadamente iguales.
En este caso cualquier diferencia observada entre el conjunto de frecuencias observadas y esperadas,
podría atribuirse al muestreo o a la casualidad.
La prueba de ji cuadrada se puede usar cuando las frecuencias esperadas no son iguales. Es decir en el
caso de que existan una diferencia entre una frecuencia observada y una frecuencia esperada.
Cuando en una celda o en algunas se tiene una frecuencia esperada demasiado pequeña La ji cuadrada
nos llevara a determinaciones equivocas. Esto puede ocurrir porque las frecuencias esperadas aparecen
en el denominador de la fórmula, y al dividir entre un número muy pequeño se obtiene un cociente
muy grande. Existen dos reglas generales en relación con las celdas con frecuencias muy pequeñas:
a) Si sólo hay dos celdas (tablas de 2 X 2), la frecuencia esperada en cada celda debe ser de 5 o más.
De otro modo no se puede utilizar la ji cuadrada.
b) Si hay más de dos celdas, no se debe utilizar la ji cuadrada cuando más del 20% de las celdas tienen
una frecuencia esperada menor a 5.