Sei sulla pagina 1di 44

1

CONCEPTOS BASICOS

Pertenece a las pruebas no paramtricas Establecido por primera vez por Helmert en 1875 Redescubierta en 1900 por Karl Pearson Proporciona una medida de la discrepancia existente entre la frecuencia observada y la frecuencia esperada

EL CHI CUADRADO

Proporciona una medida de la discrepancia existente entre la frecuencia observada y la frecuencia esperada.

DADA POR LA FORMULA:

(1 1 ) (2 2 ) ( ) 2 = + +. . . + = 1 2

=1

( )2

Donde ,si la frecuencia total es N:

1 = 1 = N

Donde equivale

2 =

( ) =1

-N

PRUEBA DE CHI CUADRADA PARA LA BONDAD DE AJUSTE

La prueba chi cuadrada puede usarse para determinar que tan bien las distribuciones tericas se ajustan a las distribuciones empricas

EJEMPLO:

En sus experimentos con chicharos, Gregor Mendel observo que 315 eran redondos y amarillos ,108 eran redondos y verdes,101 eran rugosos y amarillos y 32 eran rugosos y verdes . de acuerdo con su teora de la herencia, los nmeros deberan estar en la proporcin 9:3:3:1existe alguna evidencia para dudar de su teora a los niveles de significancia de A)0,01 Y B)0,05

TOTAL DE CHICHAROS

315+108+101+32= 556

Dado que los nmeros esperados estn en la proporcin 9:3:3:1 ( y 9+3+3+1=16),se esperara.
9 16 3 16 3 16 1 16

556 = 312,75 redondos y amarillos 556 =104,25 redondos y verdes 556 =104,25 redondos y verdes 556 =34,75 rugosos y verdes

Entonces: (1 1 )2 (2 2 )2 ( )2 = + +. . . + 1 2
2

(315 312,75)2 (108 104,25)2 (101 104,25)2 (32 34,75)2 = + + + 312,751 104,25 104,25 34,75
2

=0,470

10

Existe 4 categoras , k=4 , y el numero de grados de libertad es v= 4-1=3

a) Para v=3 ,99 2 = 11,3; , 0,01 b) Para v=3 ,95 2 = 7,81; , 0,05

SE CONCLUYE QUE LA TEORIA Y EL EXPERIMENTO CONCUERDAN OBSERVESE QUE PARA TRES GRADOS DE ACUERDO ES BUENO , LOS RESULTADOS OBTENIDOS ESTAN SUJETOS A UNA CANTIDAD RAZONABLE DE ERROR DE MUESTREO

11

12

PRUEBA CHI-CUADRADO
Chi-Cuadrado ( 2) es el nombre de una prueba de

hiptesis que determina si dos variables estn relacionadas o no. Pasos:


1) 2) 3) 4)

5)
6) 7)

Realizar una conjetura. Escribir la hiptesis nula y la alternativa. 2 calc . Calcular el valor de Determinar el valor de p y el grado de libertad. Obtener el valor crtico. Realizar una comparacin entre el chi-cuadrado calculado y el valor crtico. Interpretar la comparacin.

13

TABLA DE CONTINGENCIA
Es la tabla que contiene los datos obtenidos contados y

organizados.
Ejemplo:
USO DE CINTURN DE SEGURIDAD
GNERO FEMENINO MASCULINO S NO

50 40

25 45

14

FORMULACIN DE HIPTESIS
NULA (H0): Es aquella en la que se asegura que los dos

parmetros analizados son independientes uno del otro.


ALTERNATIVA (H1): Es aquella en la que se asegura

que los dos dependientes.

parmetros

analizados

son

15

EJEMPLO
Melissa conjetura que el uso de cinturn de seguridad,

en los conductores, est relacionado con el gnero.


H0: El uso del cinturn de seguridad es independiente

del gnero. H1: El uso del cinturn de seguridad no es independiente del gnero.

16

TABLA DE FRECUENCIAS ESPERADAS


Para calcular todos y cada uno de los valores de la tabla

de frecuencias esperadas se realiza:


Total Columna Para dicha celda Total Fila Para dicha celda SumaTotal

17

REALIZAR UNA TABLA CON LOS VALORES DE LA TABLA DE CONTINGENCIA Y AADIR UNA FILA EN LA PARTE INFERIOR Y UNA COLUMNA EN LA PARTE DERECHA.

50 40

25 45

18

REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL

50 40
FRECUENCIAS DE VALORES OBSERVADOS

25 45 70

75 85
SUMA DE FILAS

90

160

SUMA DE COLUMNAS

SUMA TOTAL
19

Usar la frmula para obtener las frecuencias esperadas.

90 75 160

42.1875 32.8125

70 75 160

90 85 160

47.8125 37.1875

70 85 160

FRECUENCIAS DE VALORES ESPERADOS

20

CHI CUADRADO CALCULADO


Para obtener el valor de Chi-Cuadrado Calculado se

tiene la frmula
2 calc

f0 fe
fe

f0 : Frecuencia del valor observado. fe : Frecuencia del valor esperado.

21

EJEMPLO
TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS

50 40

25 45

42.1875 32.8125

47.8125 37.1875

f0 fe 2 calc fe
2 calc

50 42.18752 25 32.81252 40 47.81252 45 37.18752


42.1875 32.8125 47.8125 37.1875

2 calc 1.4468 1.8601 1.2766 1.6413 6.2248


22

GRADO DE LIBERTAD v
Para calcular el grado de libertad (v) se realiza:

v Cantidad de filas 1Cantidad decolumnas 1

23

EJEMPLO
TABLA DE VALORES OBSERVADOS

50 40

25 45

v 2 1 2 1 v 11 1
24

NIVEL DE SIGNIFICANCIA
Es el error que se puede cometer al rechazar

la

hiptesis nula siendo verdadera.


Por lo general se trabaja con un nivel de significancia

de 0.05, que indica que hay una probabilidad del 0.95 de que la hiptesis nula sea verdadera.

25

EJEMPLO
Melissa conjetura que el uso de cinturn de seguridad,

en los conductores, est relacionado con el gnero. Los datos se muestran en la tabla inferior. Melissa realiza la prueba de su conjetura usando chi-cuadrado con un nivel de significancia del 1%.
USO DE CINTURN DE SEGURIDAD GNERO FEMENINO MASCULINO S NO

50 40

25 45

Entonces se tiene un nivel de significancia del 0.01.


26

VALOR DEL PARMETRO p


Para calcular el valor de p se realiza:

p 1 Nivel de significancia
Ejemplo:

p 1 0.01 0.99

27

TABLA PARA VALORES DE CHI-CUADRADO CRTICO

28

EJEMPLO

29

COMPARACIN ENTRE LOS VALORES DEL CHI-CUADRADO CALCULADO Y EL CRTICO


Si el valor del chi-cuadrado calculado es menor o igual

que el chi-cuadrado crtico entonces se acepta la hiptesis nula, caso contrario no se la acepta.
Ejemplo: 2 calc

Valor crtico

6.2248 6.635
Entonces se acepta la hiptesis nula, la cual es El uso del cinturn de seguridad es independiente del gnero.
30

EJEMPLO BONDAD DEL AJUSTE:


En cierta mquina Expendedora de Refrescos existen 4

canales que expiden el mismo tipo de bebida. Estamos interesados en averiguar si la eleccin de cualquiera de estos canales se hace de forma aleatoria o por el contrario existe algn tipo de preferencia en la seleccin de alguno de ellos por los consumidores. La siguiente tabla muestra el nmero de bebidas vendidas en cada uno de los 4 canales durante una semana. Contrastar la hiptesis de que los canales son seleccionados al azar a un nivel de significacin del 5%.
31

32

SOLUCIN:
Para realizar el contraste de Bondad de Ajuste

debemos calcular las frecuencias esperadas de cada suceso bajo la hiptesis de uniformidad entre los valores. Si la seleccin del canal fuera aleatoria, todos los canales tendran la misma probabilidad de seleccin y por lo tanto la frecuencia esperada de bebidas vendidas en cada uno de ellos debera ser aproximadamente la misma.

33

Como se han vendido en total 70 refrescos, la

frecuencia esperada en cada canal es

34

Este valor debemos compararlo con el valor crtico de

la distribucin 2 con (4-1)=3 grados de libertad. Este valor es:


Puesto que el valor del estadstico (2.34) es menor que

el valor crtico, no podemos rechazar la hiptesis de que los datos se ajustan a una distribucin uniforme. Es decir, que los canales son seleccionados aleatoriamente entre los consumidores.

35

EJEMPLO HOMOGENIEDAD:
Estamos interesados en estudiar la fiabilidad de cierto

componente informtico con relacin al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100 componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando el nmero de defectuosos en cada lote. La siguiente tabla muestra el nmero de defectuosos en para cada uno de los distribuidores.

36

37

SOLUCIN:
Debemos realizar un contraste de homogeneidad para

concluir si entre los distribuidores existen diferencias de fiabilidad referente al mismo componente.

38

Las frecuencias esperadas bajo homogeneidad son las

representadas entre parntesis. El estadstico del contraste ser:

39

Este valor del estadstico Ji-cuadrado es mayor que el

valor para el nivel de significacin del 5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay diferencias entre los tres distribuidores.

40

EJEMPLO PRUEBA DE INDEPENCIA:


Para estudiar la dependencia entre la prctica de algn

deporte y la depresin, se seleccion una muestra aleatoria simple de 100 jvenes, con los siguientes resultados:

Determinar si existe independencia entre la actividad del

sujeto y su estado de nimo. Nivel de significacin (5%)


41

SOLUCIN:
Debemos primero calcular las frecuencias esperadas

bajo el supuesto de independencia. La tabla de frecuencias esperadas sera:

42

43

Este valor debemos compararlo con el percentil de la

distribucin 2 con (2-1)(2-1)=1 grado de libertad.

Por lo tanto como el valor del estadstico es superior al

valor crtico, concluimos que debemos rechazar la hiptesis de independencia y por lo tanto asumir que existe relacin entre la depresin e los hbitos deportistas del individuo.
44

Potrebbero piacerti anche