Sei sulla pagina 1di 8

Orquídea vallejo peña

Matricula. 100317592
Análisis a nivel binomial

Chi cuadrado

Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La hipótesis
nula de la prueba Chi-cuadrado postula una distribución de probabilidad totalmente
especificada como el modelo matemático de la población que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada valor
o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi ,
donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o intervalo de valores
según la hipótesis nula). El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se
define como:

Una prueba de chi-cuadrada es una prueba de hipótesis que compara la distribución observada
de los datos con una distribución esperada de los datos.
Existen varios tipos de pruebas de chi-cuadrada:
Prueba de bondad de ajuste de chi-cuadrada
Utilice este análisis para probar qué tan bien una muestra de datos categóricos se ajusta a una
distribución teórica.
Por ejemplo, usted puede comprobar si un dado es justo, lanzando el dado muchas veces y
utilizando una prueba de bondad de ajuste de chi-cuadrada para determinar si los resultados
siguen una distribución uniforme. En este caso, el estadístico de chi-cuadrada cuantifica qué
tanto varía la distribución observada de los conteos con respecto a la distribución hipotética.
Pruebas de chi-cuadrada de asociación e independencia
Los cálculos para estas pruebas son iguales, pero la pregunta que se está tratando de contestar
puede ser diferente.
Prueba de asociación: Utilice una prueba de asociación para determinar si una variable está
asociada a otra variable. Por ejemplo, determine si las ventas de diferentes colores de automóviles
dependen de la ciudad donde se venden.
Prueba de independencia: Utilice una prueba de independencia para determinar si el valor
observado de una variable depende del valor observado de otra variable. Por ejemplo, determine
si el hecho de que una persona vote por un candidato no depende del sexo del elector.

Prueba de Bondad de Ajuste Chi Cuadrado


La Prueba de Bondad de Ajuste Chi Cuadrado es el test de bondad de ajuste más utilizado. En
general un test de bondad de ajuste se utiliza para discriminar si una colección de datos o muestra
se ajusta a una distribución teórica de una determinada población. En otras palabras, nos dice si la
muestra disponible representa (ajusta) razonablemente los datos que uno esperaría encontrar en la
población.
El test de bondad de ajuste chi cuadrado puede ser utilizado para trabajar tanto con distribuciones
discretas como, por ejemplo, la Distribución de Poisson o la Distribución Binomial como así
también con distribuciones continuas (por ejemplo, Distribución Normal, Distribución
Exponencial, etc). Esto a diferencia de las pruebas de bondad de ajuste Kolmogorov Smirnov y
Anderson Darling que sólo pueden ser utilizados para trabajar con distribuciones continuas.
La aplicación de la prueba de bondad de ajuste chi cuadrado requiere:
Que los datos estén agrupados en categorías o clases. Si los datos originalmente no se encuentran
agrupados será necesario agruparlos antes de aplicar el test de chi cuadrado para lo cual será necesario
construir una tabla de frecuencia o histograma.
Al respecto, existen varios programas computacionales que permiten construir de forma sencilla
un histograma. Uno de ellos es Easyfit que puede ser descargado en su versión de prueba y que
permite automatizar el proceso de ajuste de distribuciones tal cual se observa en la siguiente imagen
Otra alternativa consiste en hacer un histograma con el software Geogebra.
Una desventaja potencial del test de chi cuadrado es que requiere una muestra suficientemente grande
de modo que la aproximación de chi cuadrado sea válida.
Cabe destacar que existe otro test chi cuadrado llamado test chi cuadrado para independencia.
Frecuentemente los 2 test chi cuadrado son confundidos pero en realidad son diferentes:
El test de bondad de ajuste chi cuadrado ajusta una variable categórica a una distribución.
El test chi cuadrado para independencia compara dos conjunto de datos para ver si existe relación entre
ellas.
Básicamente, el test de bondad de ajuste chi cuadrado se basa en qué tan buen ajuste se alcanza
entre la frecuencia de ocurrencia de las observaciones en una muestra observada y las frecuencias
esperadas que se obtienen a partir de la distribución hipotética (teórica).

L¿Cómo se define la variable?

Es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad
de la variable aleatoria:

X= Z1²+…+Zk²
donde Zi son variables de distribución normal, de media cero y varianza uno.
El que la variable aleatoria X tenga esta distribución se representa habitualmente así:
X ~ Xk²
Una variable Chi cuadrada se define como la suma de n variables normales estandarizadas elevadas al
cuadrado.
Algunas de sus características:
La distribución es asimétrica positiva.
A medida que aumenta el tamaño de la muestra la curva es menos asimétrica, aproximándose a una curva
normal.
Para cada tamaño muestral, se tendrá una distribución χ2 diferente.
El parámetro que caracteriza a una distribución χ2 son sus grados de libertad (n-1), originado una
distribución para cada grado de libertad.

¿¿Cómo se calcula su media y su varianza?


El parámetro de la distribución X² es n y su media y su varianza son:

¿Cómo se calcula su función generadora de momentos?

¿Cómo se calcula su función de densidad?


La Distribución chi-cuadrada, tiene por función de densidad
Donde el parámetro k de X²k, se denomina grados de libertad de la distribución.
La Distribución chi-cuadrado no tiene sentido para valores negativos de x, como se puede ver en la
figura.
Téngase en cuenta que para k = 1 y k = 2 la función de densidad para x = 0, se hace infinito:

Para el resto de los valores de k, para x = 0, la función vale 0.

La Distribución de probabilidad de esta función para valores menores de un x dado, que representamos
por
donde:

Esta integral no tiene una solución conocida, y solo se conocen métodos numéricos para calcular sus
valores, hay distintos tipos de tablas y algoritmos para ordenador con los que se pueden calcular sus
soluciones, veamos una tabla distribución chi-cuadrado y su modo de utilización.

¿Cómo se calcula su función de distribución acumulada?


Su función de distribución es:

donde:

es la función gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X

Prueba de bondad de ajuste. Frecuencias esperadas desiguales. Ejemplo 2 Un banco clasifica las
cuentas por cobrar como “al día”, “atrasadas” e “incobrables. Las cifras en el sector muestran que el
60% de las cuentas por cobrar están al día, 30% son atrasadas y 10% son incobrables. El departamento
jurídico del Banco tiene 500 cuentas por cobrar: 320 están al día, 120 tienen atraso y 60 son
incobrables. Estos números concuerdan con la distribución en el sector. Utilice el nivel de significación
de 0.05 Primer Paso: Plantear la hipótesis (ver la pregunta del ejercicio) Ho: no hay diferencia con la
distribución en el sector H1: hay diferencia con la distribución en el sector Segundo Paso: Nivel de
significancia 0,05 Tercer Paso: Valor estadístico de prueba Donde X2= 9,33 Cuarto Paso: Plantear la
regla de decisión. (Apéndice B3) α= 0,05 Grados de libertad = K-1 =3-1 =2 X2=5,991 Como
X2(15,31) > 9,488 se rechaza la Ho y se acepta la H1TIPOfe(fo-fe)(fo-fe)2(fo-fe)2/fefo%Al
corriente32060300204001,33atrasadas12030150-309006,00No
cobrables601050101002,00TOTAL50010050009,33C x C
La prueba chi cuadrado consiste en la comparación entre la frecuencia observada en un intervalo de
clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la hipótesis nula formulada.
Es decir, se quiere determinar si las frecuencias observadas en la muestra están lo suficientemente
cerca de las frecuencias esperadas bajo la hipótesis nula.
Para realizar el cálculo de ji cuadrada se siguen los siguientes pasos:

-Determinar las diferencias entre fo y fe. La suma de estas diferencias es cero.

- Elevar al cuadrado cada una de las diferencias observadas entre fo y fe. Esto es (fo - fe)2

- Dividir los resultados de la columna 2 entre la frecuencia esperada y sumar estos valores. La suma
es el valor de ji cuadrada.

Prueba de bondad de ajuste


Frecuencias esperadas iguales
La prueba de bondad de ajuste se dice que es una de las pruebas no paramétricas más utilizadas. Esta
prueba se puede usar para datos de cualquier nivel. Este tipo de pruebas se utilizan para ver que tan
bien se ajusta un conjunto de datos observados a un conjunto de datos esperados.

Si no hay una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas, se
supondría que las frecuencias observadas fueran iguales o aproximadamente iguales.
En este caso cualquier diferencia observada entre el conjunto de frecuencias observadas y esperadas,
podría atribuirse al muestreo o a la casualidad.

Prueba de bondad de ajuste

Frecuencias esperadas diferentes

La prueba de ji cuadrada se puede usar cuando las frecuencias esperadas no son iguales. Es decir en el
caso de que existan una diferencia entre una frecuencia observada y una frecuencia esperada.

Limitaciones de la chi cuadrada

Cuando en una celda o en algunas se tiene una frecuencia esperada demasiado pequeña La ji cuadrada
nos llevara a determinaciones equivocas. Esto puede ocurrir porque las frecuencias esperadas aparecen
en el denominador de la fórmula, y al dividir entre un número muy pequeño se obtiene un cociente
muy grande. Existen dos reglas generales en relación con las celdas con frecuencias muy pequeñas:

a) Si sólo hay dos celdas (tablas de 2 X 2), la frecuencia esperada en cada celda debe ser de 5 o más.
De otro modo no se puede utilizar la ji cuadrada.

b) Si hay más de dos celdas, no se debe utilizar la ji cuadrada cuando más del 20% de las celdas tienen
una frecuencia esperada menor a 5.

Análisis de tablas de contingencias


Cuando se analizan variables cualitativas es habitual representar en tablas las frecuencias de casos
observados para cada una de las diferentes categorías de las variables, las cuales se denominan tablas
de contingencia.
En este tipo de tablas frecuentemente se desea conocer si existe asociación entre las dos variables, o si
por el contrario se pueden considerar independientes.

Potrebbero piacerti anche