Sei sulla pagina 1di 9

UNIVERSIDAD AUTÓNOMA METROPOLITANA

UNIDAD XOCHIMILCO

DIVISIÓN: CSB

MEDICINA VETERINARIA Y ZOOTECNIA


MODULO: PROCESOS FUNDAMENTALES DE
BIOESTADÍSTICA

PRUEBA DE BONDAD DE AJUSTE DE PEARSON

YAMASAKI ROMERO KAHORI

GRUPO: BB03VB
INDICE

Introducción ……………………………………………………………………………. 1

Procedimiento …………………………………………………………………………. 2

Ejemplo .……………………………………………………………………………….. 3

Bibliografía …………………………………………………………………………….. 7
En 1900, Carl Pearson propuso la primera prueba de bondad de ajuste, ésta mide
la diferencia entre la frecuencia observada entre la que en teoría se espera
basada en una distribución hipotética.

La prueba de Ji-cuadrada (x²) o de bondad de ajuste nos ayuda a determinar si los


resultados de una prueba o experimento coinciden con los esperados con base en
un modelo, ley o teoría científica. Para ello se debe:

1. Obtener las frecuencias observadas y ubicarlas en un cuadro de


contingencia (diagrama de Carroll).
2. Construir un cuadro de frecuencias esperadas que concuerden con la
distribución teórica.
3. Dependiendo el número de variables de criterio que se consideren será el
cuadro de contingencia (l × c) o (r × l); ésta prueba se emplea para una
muestra y una o más variables.

El modelo que se utiliza es el siguiente:

(𝑓𝑜 − 𝑓𝑒)2
𝑋2 = ∑
𝑓𝑒

dónde:

𝑓𝑜 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎

𝑓𝑒 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎

Para cada categoría se obtiene el cuadrado de la diferencia entre la frecuencia


esperada y la observada, el resultado se divide por la frecuencia esperada de
dicha categoría. La suma total de cada categoría nos da el valor de x².

Los requisitos de uso de x² para bondad de ajuste son:

1. Un mínimo de 50 observaciones/mediciones para que la distribución x² sea


una aproximación de la distribución muestral esperada.
2. La frecuencia esperada para cada categoría debe ser de mínimo 5, para
esto se pueden combinar las categorías.
3. En el caso de la bondad de ajuste para la distribución normal, se deben
conocer µₓ y σₓ o sus estimadas x¯ y s para poder calcular las frecuencias
esperadas.

1
El procedimiento es:

Paso 1. Identificar la variable de interés.

Paso 2. Establecer las hipótesis estadísticas.

Ejemplo:

H0: El modelo de fe es válido.

H1: no es válida.

Paso 3. Proponer el valor de α

Paso 4. Determinar el modelo estadístico que se utilizará. O sea:

2
(𝑓𝑜 − 𝑓𝑒)2
𝑋 =∑
𝑓𝑒

Paso 5. Obtener mediante la tabla de x² del apéndice el valor de x² (α, gl) y ubicar
la región de rechazo en una gráfica.

Paso 6. Especificar la regla de decisión (RD) para rechazar H0.


2
Si 𝑋𝑐2 ≥ 𝑋(∝,𝑔𝑙) , entonces H0 se rechaza.

(𝑓𝑜−𝑓𝑒)2
Paso 7. Calcular 𝑋 2 , por medio de 𝑋 2 = ∑ (fe ya calculado) donde:
𝑓𝑒

n = tamaño de la muestra
p = probabilidad de ocurrencia en cada categoría

Paso 8. Obtener las conclusiones, rechazar H0 o de H1 (la distribución muestral


se ajusta o no a la especificación de la distribución)

2
Ejemplo:

En una investigación de enfermedad de insuficiencia renal felina realizada en una


muestra de 167 gatos, el médico tuvo el interés de conocer si existía alguna
relación de ésta enfermedad con la edad de una población a la que estudió.

Observo que 95 gatos tenían insuficiencia renal, de estos, 15 gatos tenían 5 años,
20 tenían 10 años y 60 tenían 15 años o más.

1. Planteamiento de la hipótesis:

Ho=La frecuencia de la insuficiencia renal felina NO está asociada con la


edad. Las variables serán independientes.

H1=La frecuencia de la insuficiencia renal felina está asociada con la edad.


Las variables serán dependientes.

2. Arreglar las observaciones en una tabla de contingencia:

Frecuencia observada (fo)

Insuficiencia renal
felina

Sí No

5 15 25 40
Edad

10 20 32 52

15 o más 60 15 75

95 72 167

3. Aplicación de la ecuación de la prueba

A B C D E F
𝑓𝑒𝑎 𝑓𝑒𝑏 𝑓𝑒𝑐 𝑓𝑒𝑑 𝑓𝑒𝑑 𝑓𝑒𝑑
(𝑎 + 𝑏)(𝑎 + 𝑐 + 𝑒) (𝑎 + 𝑏)(𝑎 + 𝑑 + 𝑓) (𝑐 + 𝑑)(𝑎 + 𝑐 + 𝑒) (𝑐 + 𝑑)(𝑏 + 𝑑 + 𝑓) (𝑒 + 𝑓)(𝑎 + 𝑐 + 𝑒) (𝑎 + 𝑏)(𝑎 + 𝑑 + 𝑓)
= = i = = = =
𝑛 𝑛 𝑛 𝑛 𝑛 𝑛
(40)(95) (40)(72) (52)(95) (52)(72) (75)(95) (75)(72)
= 22.7 = 17.2 = 29.6 = 22.4 = 42.7 = 32.3
(167) (167) (167) (167) (167) (167)

3
Frecuencia observada (fo)
Insuficiencia renal
felina

Sí No

5 15 25 40
Edad

10 20 32 52

15 o más 60 15 75

95 72 167

Frecuencia esperada (fe)

Insuficiencia renal
felina

Sí No

5 22.7 17.2 40
Edad

10 29.6 22.4 52

15 o más 42.7 32.3 75

95 72 167

a b c d e f ∑
(15 − 22.5)2 (25 − 17.2)2 (20 − 29.6)2 (32 − 22.4)2 (60 − 42.7)2 (15 − 32.3)2 𝑋2
= 2.6 = 3.5 = 3.1 = 4.1 = 7.0 = 9.3
22.7 17.2 29.6 22.4 42.7 32.3 29.6

4
4. Regla de decisión

El valor obtenido es 29.6.

El valor crítico de acuerdo con los grados de libertad es:

𝑔𝑙 = (𝑓𝑖𝑙𝑎𝑠 − 1)(𝑐𝑜𝑙𝑢𝑚𝑛𝑎𝑠 − 1)

𝑔𝑙 = (3 − 1)(2 − 1)

𝑔𝑙 = 2

Valores críticos de la Distribución de


𝑿𝟐

Gl 0.05

1 3.84
2 5.99
3 7.81
4 9.49
5 11.07
6 12.59
7 14.07
8 15.57
9 16.92
10 18.31

5
2 2
5. Decidir si se acepta o se rechaza Ho, de acuerdo con 𝑋𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 ≥ 𝑋𝑡𝑎𝑏𝑙𝑎𝑠 ,e
interpretar los resultados:

Como el valor obtenido es 29.6 y es mayor al valor crítico de tablas (5.99) es


posible rechazar Ho.

Existe una asociación estadísticamente significativa (𝑝 < 0.05). Quiere decir que la
edad se asocia con la presencia de la insuficiencia renal felina en gatos.

6
BIBLIOGRAFÍA:

 Pérez, H. (2008). Estadística para las ciencias sociales, del


comportamiento y de la salud. (3° ed). México: CENGAGE Learning.

 Milton, J. (2001). Estadística para Biología y Ciencias de la Salud. (3° ed).


España: McGraw-Hill

 Ingeniera Industrial Easy. (s.f). Recuperado el 15 de septiembre, 2019,


YouTube de: https://www.youtube.com/watch?v=b-BOQDTLL3U

 Arellano, O. (s.f) Chi cuadrada. Recuperado el 15 de septiembre, 2019,


UAM Xochimilco.

Potrebbero piacerti anche