Sei sulla pagina 1di 20

Tema.

El estadstico
Chi-cuadrado y
contrastes asociados

RONALD AYLMER FISHER


Docente:Juan Carriel Wang

Qu vamos hacer ahora?


Hay variables

- Muy relacionadas
- Muy poco relacionadas

Veamos un estadstico para ver si dos variables estn


o no asociadas

El estadstico Chi-cuadrado

Docente:Juan Carriel Wang

El estadstico Chi-cuadrado
Las hiptesis son:
H0: Las variables en filas y columnas no estn asociadas

H1: Las variables en filas y columnas estn asociadas

Necesitamos frecuencias esperadas

ei , j

f i. f. j
n

Docente:Juan Carriel Wang

EJEMPLO (supervivencia en el Titanic)


Sobrevive No sobrevive

Total

Primera clase

194

128

322

Segunda clase

119

161

280

Tercera clase

138

573

711

Total

451

862

1313

Frecuencias esperadas

f1. f.1 322 x451


e11

110,6
n
1313
f 2. f.1 280 x451
e21

96,2
n
1313
Docente:Juan Carriel Wang

Frecuencias esperadas
Sobrevive

No sobrevive

Total

Primera clase

110,6

211,4

322

Segunda clase

96,2

183,8

280

Tercera clase

244,2

466,8

711

451

862

1313

Total

Calculemos Chi-cuadrado

2
exp

( f ij eij )

eij

Ya vuelven los matemticos a complicar las cosas


Docente:Juan Carriel Wang

Traduccin
Tenemos dos tablas (sin totales):
Frecuencias absolutas
Frecuencias esperadas
Sobrevive No sobrevive

Sobrevive

No sobrevive

Primera clase

194

128

Primera clase

110,6

211,4

Segunda clase

119

161

Segunda clase

96,2

183,8

Tercera clase

138

573

Tercera clase

244,2

466,8

1) Hagamos otra tabla, donde restamos a la primera la


segunda
Sobrevive

No sobrevive

Primera clase

(194-110,6)

(128-211,4)

Segunda clase

(119-96,2)

(161-183,8)

Tercera clase

(138-244,2)

(573-466,8)

Docente:Juan Carriel Wang

2) Este valor elevado al cuadrado


Sobrevive

No sobrevive

Primera clase

(194-110,6)^2

(128-211,4)^2

Segunda clase

(119-96,2)^2

(161-183,8)^2

Tercera clase

(138-244,2)^2

(573-466,8)^2

3) Dividido por el valor que tengamos en la segunda tabla


Sobrevive

No sobrevive

Primera clase

(194-110,6)^2/110,6

(128-211,4)^2/211,4

Segunda clase

(119-96,2)^2/96,2

(161-183,8)^2/183,8

Tercera clase

(138-244,2)^2/244,2

(573-466,8)^2/466,8

Docente:Juan Carriel Wang

Obtenemos la siguiente tabla en nuestro ejemplo


Sobrevive

Primera clase

(194 110,6) 2
62,9
110,6

(128 211,4) 2
32,9
211,4

Segunda clase

(119 96,2) 2
5,4
96,2

(181 183,8) 2
2,8
183,8

Tercera clase

2
exp

i

No sobrevive

( f ij eij ) 2
eij

(573 466,8) 2
(138 244,2) 2
24,2
46,2
466
,
8
244,2

62,9 32,9 5,4 2,8 46,2 24,2 174,4


Docente:Juan Carriel Wang

Grados libertad
1

2
3
4
5
6

Probabilidad de un valor superior


- Alfa ()
0,1
0,05 0,025 0,01 0,005
2,71 3,84 5,02 6,63 7,88

4,61 5,99
6,25 7,81
7,78 9,49
9,24 11,07
10,64
12,59
Docente:Juan Carriel Wang

7,38
9,35
11,14
12,83
14,45

9,21
11,34
13,28
15,09
16,81

10,60
12,84
14,86
16,75
18,55

Tenemos:

2
exp
174,4

Ahora calculemos el valor de la tabla Chi-cuadrado

1) grados de libertad, son:


K = (nmero de fila-1)x(nmero de columnas-1)
= (3-1)x(2-1) = 2

2) El valor alfa (0,05 si no se dice).


3) El valor que buscamos

2
g .l .;

2
2; 0, 05

5,99

SIGNIFICADO: La probabilidad de obtener


un valor mayor
que 5,99 es 0,05
Docente:Juan Carriel Wang

Tenemos:

2
exp
174,4
2
2
g .l .; 2;0,05 5,99

Por tanto:

2
exp

2
2; 0, 05

SIGNIFICADO: Las variables no son


independientes

SIGNIFICADO en el ejemplo: El salvamento de los viajeros


en el Titanic no fue independiente de su clase social.
Docente:Juan Carriel Wang

Hemos hecho un contraste de hiptesis


Los pasos en un contraste son:
1) Fijar las hiptesis que se quieren contrastar:
2) Fijar el nivel de significacin:

H0

H1

3) Elegir un estadstico de contraste:


2
exp

i

( f ij eij ) 2
eij

k2( filas1) x ( columnas1);

4) Se toma la decisin de rechazar o no la hiptesis:


2
2
exp k ; Aceptar H 0 Independientes
2
exp
k2; Rechazar H 0
Docente:Juan Carriel Wang

Dependientes

Contraste de homogeneidad
1) Fijar las hiptesis que se quieren contrastar:

H0

H1

Las subpoblaciones tienen idntica


distribucin para la variable Y.
la distribucin de la variable Y en alguna
de estas subpoblaciones es diferente

2) Fijar el nivel de significacin:

Docente:Juan Carriel Wang

3) Elegir un estadstico de contraste:


2
exp

i

( f ij eij ) 2

eij

k2( filas1) x ( columnas1);

4) Se toma la decisin de rechazar o no la hiptesis:

2
exp

2
k ;

2
exp
k2;

Aceptar

H0

Rechazar

H0

Docente:Juan Carriel Wang

EJEMPLO
Se desea saber si la distribucin de los grupos
sanguneos es similar en los individuos de dos
poblaciones. Para ello se elige una muestra aleatoria
de cada una de ellas, obtenindose los siguientes
datos Qu decisin se debe tomar?

Muestra 1
Muestra 2

Total

A
90
200
290

B
80
180
260

AB
110
240
350

Docente:Juan Carriel Wang

0
20
30
50

Total
300
650
950

Calculamos las frecuencias esperadas: ei , j

f i. f. j
n

A
B
AB
0
Muestra 1 91.5789 82.105 110.53 15.789
Muestra 2 198.421 177.89 239.47 34.211
Componentes de la Chi-cuadrado

(90 91,5789) 2
0,0272
91,5789
Estadstico de contraste:
2
exp

i

( f ij eij ) 2
eij

0,0272 ... 1,76

Docente:Juan Carriel Wang

Calculemos el valor

2
k ( filas1) x ( columnas1);

Los grados de libertad:

k ( filas 1) x ( columnas 1) ( 2 1) x ( 4 1) 3
Entonces:

2
k ( filas1) x ( columnas1);

2
3; 0, 05

7,81

La decisin de rechazar o no la hiptesis:

2
exp

2
k ;

Aceptar

H0

Docente:Juan Carriel Wang

Cuando podemos aplicar el


estadstico Chi-cuadrado?
1) Siempre hacemos un contraste unilateral.

2) No debe usarse si hay frecuencias esperadas


inferiores a 1.

3) Como mximo el 20% de las frecuencias esperadas


pueden ser menores que el valor 5.

Docente:Juan Carriel Wang

RESUMEN

- El estadstico Chi-cuadrado
- Fijar hiptesis
- Fijar nivel de significacin
- Grados de libertad
- Valores del estadstico
- Contraste de independencia
- Contraste de homogeneidad
- Condiciones de aplicar el Chi-cuadrado

Docente:Juan Carriel Wang

GRACIAS POR
LA ATENCIN

Docente:Juan Carriel Wang

Potrebbero piacerti anche