Sei sulla pagina 1di 19

AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA

1/19
AYUDA SPSS

CHI CUADRADO NOTAS METODOLGI CAS

Rubn Jos Rodr guez
Oct ubr e de 2004

I NTRODUCCI N
Chi Cuadrado de Pearson es un estadstico no paramtrico y es una potente herramienta para
pruebas de significacin de la hiptesis nula de independencia estadstica entre variables
categoriales en tablas de contingencia. Para poder realizar una correcta aplicacin e
interpretacin de Chi Cuadrado se han desarrollado estas Notas Metodolgicas que sistematizan
las consideraciones de los principales tratadistas en la materia. Se hace hincapi en los anlisis
de los residuos (diferencias entre las frecuencia observadas y esperadas), especficamente en
los residuos tipificado corregidos (o residuos ajustados), dado que nos permiten interpretar con
precisin el significado de la asociacin detectada, en trminos del puntaje standardizado Z.
Tambin se desarrolla formulas alternativas del Chi Cuadrado de Pearson para ciertas
condiciones de uso. Se compara la Prueba de Independencia de la Ley del producto o de la
probabilidad compuesta en el marco de la Teora matemtica de la probabilidad 'a prior' de Pierre
Simn Laplace, con los resultados de Chi Cuadrado. Se expone la Regla de Hans Zeizel para
calcular los porcentajes de celdas. Se introduce la nocin de celda falsificadora de la hiptesis
nula (y las celdas verificadoras de la hiptesis alternativa o del investigador). Se realizar una
lectura de los porcentajes de celdas y se interpreta la diferencia porcentual. Se utiliza la prueba t
de diferencia de media de proporciones para muestras independientes como va alternativa
de establecer la significacin estadstica de la diferencia entre porcentajes condicionales o de
celdas. Por ltimo se expone el caso TITANIC (ver Ayuda SPSS - Chi Cuadrado_Caso TITANIC)
para ejemplificar lo desarrollado es estas notas metodolgicas y brindar una definicin e
interpretacin del P-value. Se resume el modelo Chi Cuadrado, se formulan las hiptesis
estadsticas (nula y del investigador), se establecen las reglas de decisin de Pearson y Fisher, y
se adjunta la tabla de Chi Cuadrado para identificar el Chi Cuadrado terico segn determinados
grados de libertad y nivel de significacin.
Not as I [ RJR] :
a) Razn de Ver osi mi l i t ud Ji - cuadr ado: La razn de verosimilitud Ji-cuadrado es
una alternativa al estadstico Ji-cuadrado (X
2
= Chi cuadrado) de Pearson para
contrastar la hiptesis de independencia entre las variables. Mientras el estadstico Ji-
cuadrado de Pearson se basa en las diferencias entre las frecuencias observadas y las
frecuencias esperadas, la r azn de ver osi mi l i t ud Ji - cuadr ado se basa en el
coci ent e ent r e el l as(si) el p- valor asociado a la razn de verosimilitud Ji-cuadrado
(Significance=0,00000) tambin es menor que P = 0,05. En consecuencia, al nivel
de significacin 0,005, tambin se rechazar la hiptesis nula de independencia entre
las variablespodra suceder que, para un mismo nivel de significacin, el p- valor
asociado a uno de estas test, fuera menor que el nivel de significacin, mientras que
el p- valor asociado a la otra prueba fuera mayor, en dicho caso, debera optarse por
el ms conservador (por el que presente menor p- valor).
Ferrn Aranaz, Magdalena (1996). SPSS par a Wi ndow s. Pr ogr amaci n y anl i si s
est adst i co. Madrid, Editorial McGraw-Hill. 1996. ISBN 84-481-0589-3, pgs. 144-
145.

b) El Test de l a Razn de Ver osi mi l i t udes: Como alternativa al contraste Chi-
cuadrado, S. Wiks (1935), ( The Likelihood t est of independence in cont ingency
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
2/19
t ables , Annals of Mathematical Statistics, N 6, pg. 190), ha propuesto el siguiente
estadstico:

2 i
i
i
i
i
o
:
: , es decir, la cantidad de casos
o de valores que se han registrado para cada valor de la variable,
si es una tabla de contingencia.
(f ) Frecuencias observa
F
G 2 F * ln
E
F
E
das
Frecuenc :
siendo
| |
=
|
\ .

e
suponiendo que la hiptesis
nula que se ensaya es verdadera.
ias espera (f ) d , as


(en general), se obtienen resultados muy similares en todos los casos y, por lo tanto,
el uso de uno u otro procedimiento sera, en principio, indiferente. Ello no obstante, el
t est de l a r azn de ver osi mi l i t ud presenta una ventaja con respecto al Chi-
cuadrado: No r equi er e que t odas f r ecuenci as esper adas sean may or es de 5
Garca, Roberto M. (1995). Cont r ast e Chi - cuadr ado. Buenos Aires, Cuadernos de
UADE n 123, Departamento de Matemtica y Mtodos Cuantitativos, UADE, 1995,
ISBN 987-519-1-012-8, pg. 27.

c)
Chi cuadr ado de l a r azn de ver osi mi l i t ud Li k el i hood r at i o chi squar e
Estadstico de bondad de ajuste similar al Chi cuadrado de Pearson. Para tamaos de
muestra grandes, los dos estadsticos son equivalentes. La ventaja del chi cuadrado
de la razn de verosimilitud es que puede subdividirse en una serie de partes
interpretables por separado que, sumadas, equivalen al total.
Di cci onar i o Est adst i co, http://www.estadistico.com/dic.html?p=122

d)
cuando se pide el test de Ji-Cuadrado al programa, SPSS proporciona adems la
Razn de Ver osi mi l i t ud ( Li k el i hood Rat i o) , y el Mantel-Haenzel Test (Asociacin
lineal por lineal). El primero de estos est basado en la teora de mxima
verosimilitud, y su valor es dos veces la suma de las frecuencias observadas de cada
celda mult iplicadas por el logarit mo neperiano de la frecuencia observada dividida
ent re la frecuencia t erica. Con grandes tamaos de muestra adopta valores similares
al test Ji-Cuadrado. El Mantel-Haenzel Test es una medida de avocacin que analiza
la relacin existente entre las filas y columnas de una tabla; y se calcula multiplicando
el coeficiente de correlacin de Pearson por el nmero de casos menos uno. Como ha
sealado Norusis, hay que tener en cuenta que nicamente debe ser utilizado con
variables ordinales y de intervalo (Norusis, 1990:131).
Daz de Rada, Vidal (1999): Tcni cas de anl i si s de dat os par a i nvest i gador es
soci al es. Aplicaciones prcticas con SPSS para Windows: Madrid, Ra-Ma, 1999, p.
171. [RJR]

Not a I I [ RJR] :
Anl i si s de l os Resi duos: La prueba de la Ji-cuadrada que hemos explicado
en 6.3.1. sirve para ver si la relacin entre un par de var i abl es es estadsticamente
significativa. El anlisis de los residuos va a utilizar las ideas de la ji-cuadrada para
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
3/19
estudiar de una manera pormenorizada la tabla: en lugar de ver si las dos variables
estn relacionadas estudiamos l a r el aci n ent r e cada par ej a de cat egor as.
Bsicamente, el anlisis de los residuos (diferencia entre valor observado (fo),
O
i j
) y el valor esperado (fe), E
i j
) es una aplicacin de la Ji-cuadrada al estudio de las
parejas de categoras: observamos las frecuencias obtenidas y las comparamos con
las esperadassi la pareja de categoras no estuviera relacionada el clculo se
realiza segn el procedimiento explicado en 6.3.1. De l a magni t ud del r esi duo
concl ui r emos sobr e l a r el aci n ent r e l as cat egor asCada casilla de la tabla
incluye el nmero de casos, o valores observados ( COUNT) , los valores esperados
( EXPECTED) , la diferencia entre observados y esperados ( RESI D) , los residuos
estandarizados ( SRESI D) y estos mismos residuos ajustados segn procedimiento de
Haberman ( ASRESI D) . Veamos el clculo de cada uno de estos valores:

- Los r esi duos ( RESI D) :
ij
(RESID) R ( )
ij ij
O E =


donde O
ij
y

E
ij
son los valores observados y esperados, respectivamente, en casilla
definida por la fila i y la columna j .
Snchez Carrin, Juan Javier (1995): Manual de anl i si s est adst i co de l os dat os,
2 ed. Revisada, Madrid, Alianza Editorial, 1999, captulo 6: Las tablas de
contingencia: relacin entre variables nominales (ordinales), pp. 341-344. [RJR].

La diferencia entre un valor observado y el valor pronosticado por el modelo. El valor
pronosticado es el nmero de casos que se esperaran en la casilla si no hubiera
relacin entre las dos variables. Un residuo positivo indica que hay ms casos en la
casilla de los que habra en ella si las variables de fila y columna fueran
independientes.
SPSS 11.51, Ay uda cont ex t ual , Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos. [RJR]

- Los r esi duos est andar i zados ( SRESI D) :


ij
(SRESID) SR ( ) /
ij ij ij
O E E =


Estos residuos eliminan el efecto que sobre el valor del residuo puedan tener
los marginales de ambas variables
Snchez Carrin (1995: 341-344). [RJR]
El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que
son conocidos tambin como los residuos de Pearson o residuos estandarizados,
tienen una media de 0 y una desviacin tpica de 1.
SPSS 11.51, Ay uda cont ex t ual , Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos tipificados. [RJR]

- Los r esi duos aj ust ados ( ASRESI D) :
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
4/19


ij
(SRESID) AR /
ij ij
SR V =


donde V
i j
es la varianza estimada de SR
i j
,de valor igual a:

| |
. .
1 ( / ) 1 ( / )
ij i j
V O n O n ( =



siendo O
i .
y

O.
j
son las frecuencias observadas, respectivamente, en la fila i y la
columna j , y n el tamao de la muestraCuant o may or sea el val or absol ut o del
r esi duo aj ust ado, may or ser l a r el aci n ent r e l a par ej a de cat egor as.
Snchez Carrin (1995: 341-344). [RJR]

El residuo de una casilla (valor observado menos valor pronosticado) dividido por
una estimacin de su error tpico. El residuo tipificado resultante viene expresado en
unidades de desviacin tpica, por encima o por debajo de la media.
SPSS 15. 0, Ay uda cont ex t ual , Tablas de Contingencia, Chi Cuadrado, Mostrar en
las celdas, Residuos tipificados corregidos [RJR].

Los Resi duos t i pi f i cados cor r egi dos de Haberman (1973). Estos residuos se
distribuyen normalmente con media 0 y desviacin tpica 1. Se calculan dividiendo el
residuo de cada casilla por su Error Tpico ( ES o SE) , que en tablas bidimensionales se
obtienen como la raz cuadrada de: m
ij
(1-n
i
) (1-n
j
)/n
2
.
La gran ut ilidad de los Resi duos t i pi f i cados cor r egi dos radica en que, puest o que
se dist ribuye normalment e con media cero y desviacin t pica uno, N ( 0, 1) , son
fcilment e int erpret ables: ut ilizando un nivel de confianza de 0, 95, podemos afirmar
que los residuos mayores de 1, 96 delat an casillas con ms casos de los que debera
haber en esa casilla si las variables est udiadas fueran independient es; mient ras que
los residuos menores de - 1, 96 delat an casillas con menos casos de los que cabra
esperar baj o la condicin de independencia.
En t ablas de cont ingencia con variables nominales, una vez que hemos est ablecido
que ent re dos variables exist e asociacin significat iva ( mediant e el est adst ico Chi-
cuadrado) y que hemos cuant ificado esa asociacin con algn ndice de asociacin
( Coeficient e de Cont ingencia, CC) , los residuos t ipificados corregidos const it uyen la
mej or herramient a disponible para poder int erpret ar con precisin el significado de la
asociacin det ect adaLos dist int os porcent aj es pueden ayudarnos a int uir posibles
paut as de asociacin, pero son los Resi duos t i pi f i cados cor r egi dos los que nos
permit e int erpret ar de forma precisa la relacin exist ent e ent re las
variablesBast a con fij arnos en aquellos ( punt aj es z) que son mayores que
+ 1, 96 o menores que - 1, 96. . [Ver ejemplo Tabla 5 y 6 en Nota IV d)]
Gua 10.0 SPSS par a el Anl i si s de Dat os, captulo 12: Anlisis de variables
categricas, p. 39 y 41. (En lnea):
ht t p: / / w w w .uca.es/ ser v/ sai / manual es/ spss/ Pant al l a/ 12cont i n.pdf [Consulta: 10 de
octubre de 2004]


AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
5/19
Not a I I I : [ RJR]
Pr ueba Est adst i ca de Fi sher : Prueba estadstica ideada para el caso de tablas
dicotmicas en las que no se pueda aplicar el test X
2
por ser la frecuencia o
frecuencias de alguna de sus casillas ms bajas que lo permitido por dicho test, es
decir, inferiores a cinco.

Frmula:
(a+b)!(c+d)!(a+c)!(b+d)!
P=
N! a! b! c! d!


Tiene el inconveniente de la dificultad de su clculo por el nmero de factoriales (!)
que comprende la frmula (El paquete estadstico SPSS calcula automticamente esta
prueba).
Sierra Bravo, Restituto (1991): Di cci onar i o Pr ct i co de Est adst i ca, Madrid,
Editorial Paraninfo, 1991, p. 379. [RJR]
En caso de t abl as de 2 X 2 (las dos variables dicotmicas o dicotomizadas mediante
un punto de corte), p- val ue asociado al estadstico Ji- cuadrado de Pearson puede ser
poco preciso. En el caso de que el nmero total de observaciones en l a muest r a sea
gr ande, una alternativa al estadstico Ji- cuadrado de Pearson, que incorpora una
cor r ecci n por cont i nui dad y, por lo tanto, un p- value ms preciso, es Ji -
cuadr ado por Cor r ecci n de Cont i nui dad de Yat es puede ser poco preciso. En el
caso de que el nmero total de observaciones en la muestra sea grande, una
alternativa al estadstico. Si el t amao muest r al es pequeo, mediante l a pr ueba
de l a pr obabi l i dad ex act a de Fi sher , se puede calcular la probabilidad exacta de
observar un conjunto particular de frecuencias en una tabla 2 X 2. El pr opi o
pr ogr ama SPSS opt ar por una u ot r a de l as pr uebas en f unci n del t amao
muest r al y de l as f r ecuenci as esper adas en l as cel das
Ferrn Aranaz, Magdalena (1996): SPSS par a Wi ndow s. Pr ogr amaci n y Anl i si s
Est adst i co, Madrid, McGraw-Hill, 1996, captulo 7: Tablas de contingencia y medidas
de asociacin, p. 145. [RJR]

Not a I V: [ RJR]
Pr uebas de i ndependenci a:
Es necesario sistematizar las distintas opciones estadstico-metodolgicas de analizar la
independencia estadstica entre dos variables, dado que en la bibliografa segn sea la disciplina
que trate estadstica o metodologa- no desarrollan de modo exhaustivo los diferentes modos
alternativos de analizar o probar la existencia o no de independencia estadstica: Existen cinco
modos alternativos para analizar la independencia estadstica:
a) Una manera es calculando la proporcin entre la frecuencia condicional de una celda y la
frecuencia marginal de columna, comparndola con la proporcin entre la
correspondiente frecuencia marginal, de esa fila, y la frecuencia total. Si se da una
igualdad entre ambas proporciones, se comprueba que ambas variables son independientes. Es
decir, que la distribucin condicin es igual a la distribucin marginal, o lo que es lo mismo, la
distribucin bivariada se comporta del mismo modo que la distribucin univariada. Por lo que
la conclusin es que la introduccin de la segunda variable en las columnas no afecta, no
modifica las distribuciones condicionales. En caso contrario, que se de una desigualdad entre
las proporciones, se sostiene la No independencia entre las categoras, y generalizando, entre
las variables comparadas. Obsrvese que no se afirma la dependencia entre las variables, sino
la No independencia entre las mismas.
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
6/19
b) Otro modo de comprobar lo mismo es recurrir a la Prueba de independencia, en el marco de la
Teora de Clsica de la Probabilidad formulada por Jean Batiste Laplace, donde se compara la
probabilidad simple de un evento con su probabilidad condicional.
En las siguientes tablas se dan simblicamente, y se expresan analticamente ambos casos.
TABLA I

Var i abl e X
Var i abl e Y 0 1 Tot al
1 a b a+ b
0 c
d c+ d
Total a+ c
b+ d n
[Elaboracin propia][RJR]

a) Igualdad de proporciones entre distribuciones condicionales y marginales:

SI:
Independencia
d c d
b d n
+
=
+


a) Un segundo mtodo de la clculo lo brinda la Prueba de independencia de la 2 Ley de la
Multiplicacin de Laplace para sucesos simultneos dependientes:

P(A)=P A/B Independencia
(Se lee: Si la P(A) es igual a su Probabilidad Condicional, es decir, la P(A sabiendo que se ha
dado B), se concluye que ambas categoras son independientes)

Aplicando ambos criterios a una tabla emprica, para averiguar si el Sexo es independiente o
no respecto del Estado Civil, tenemos:
TABLA 2








Sierra Bravo (1991: 365) PA/B P(A)

Sex o
Est ado Ci vi l Hombre Mujer Tot al
Solteros 8.000 5.000 13.000
Casados 10.000 12.000 22.000
Viudos
1.000 4.000 5.000
Total
19.000 21.000 40.000
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
7/19
b) La proporcin entre la distribucin condicional comparada con la distribucin marginal,
del ejemplo, da:
f (viudo)/f (total) f (viudo y mujer)/f (mujer)

5.000/40.000 4.000/21.000

0,125 0,191 No independencia

La desigualdad nos confirma que el hecho de ser mujer No es independiente del Estado Civil que
se posee. Se pueden comparar las proporciones de cada una de las celdas y se obtendr la misma
conclusin para cada par de categoras. Por lo que podemos generalizar las conclusiones para el
conjunto del cuadro bivariado: el Sexo No es independiente del Estado Civil.

b) Si P(A) es la Probabilidad Simple de que una persona sea Viudo, es decir, la Probabilidad de
ser Viudo, es igual a la cantidad de Viudos divido el Total de personas, es decir:

P (Viudo) = 5.000/40.000= 0,125

Y P (B) la Probabilidad Simple de que una persona sea Mujer, es igual:

P (Mujer)= 21.000/40.000= 0,525

Pero, P(A/B) es la Probabilidad Condicional de Ser Viudo sabiendo que es Mujer, es decir, la
Probabilidad de ser Viudo condicionado a que sea Mujer, es igual a:
P (Viudo/Mujer)= 4.000/21.000= 0,191
Comparando los resultados, comprobamos que ambas probabilidades son distintas:
P (Viudo) P (Viudo/Mujer)

0,125 0,191 No independencia

Obsrvese que analticamente, la expresin

P (Viudo/Mujer)= f (viudo y mujer)/f (mujer),
con lo cual se demuestra que ambos criterios (a) y (b) de Prueba de Independencia son equivalente.
c) Un tercer modo alternativo de anlisis emprico de un cuadro bivariado es convertir las
frecuencias absolutas en frecuencias relativas, es decir en porcentajes, y calcular la Diferencia
Porcentual (d%). Para ello debemos tener en cuenta la Regla de Hans Zeisel
1
: Porcentuar en el

1
Galtung, Johan (1966): Teora y mtodos de la investigacin social, 2 ed., Buenos Aires, Eudeba, Tomo
II, 1969, p. 234: La regla es muy simple: sacar porcentajes tomando siempre como base los valores de lo
que se considera variable independiente en el modelo subyacente.
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
8/19
sentido de la variable independiente, -tomando como base el marginal de esta ltima- y comparar
los porcentajes en sentido opuesto. Tambin debemos observar la forma de la distribucin
condicional relativa (distribucin diagonal o rinconal), e identificar las celdas verificadoras
(circuladas en rojo en el ejemplo) y las celdas falsificadoras de la hiptesis que subyace al cuadro.
En nuestro ejemplo:
TABLA 3







Obsrvese que los porcentajes resaltados en azul, coinciden con las proporciones y probabilidades
obtenidas mediante los criterios alternativos (a) y (b). La Diferencia porcentual, nos indica la
fuerza o intensidad relativa de la asociacin entre las variables, y no solamente es una Prueba
de Independencia. Si la d% = 0 indica independencia estadstica, o asociacin nula, y si la d% =
100, estara sealando mxima asociacin. En nuestro ejemplo, (d% = -13,8) indica leve
asociacin. Hubiese existido asociacin nula segn los subndices de la TABLA 1- si los
porcentajes hubiesen sido iguales:

00 01
p p =


viudo y hombre viudo y mujer
p = p


Y hubiese existido algn grado de asociacin si los porcentajes hubiesen sido:

00 01
p p =


viudo y hombre viudo y mujer
p p =



No obstante que, la diferencia porcentual como medida de asociacin, acta como medida de
influencia de una variable X sobre otra Y, debe ser interpretada mediante la prueba t de
diferencia de medias de proporciones para muestras independientes (Galtung, 1969, II: 241)
para medir la significacin estadstica del tamao de la diferencia, pues una d% = 10%, puede ser
tanto la diferencia entre 95-85% como entre 25-15%. Si bien en ambos casos la d% es igual al
10%. En el primer caso la diferencia del 10% en proporcin al porcentaje menor representa un
incremento porcentual (%) del 11,76%:

Sex o ( % )
Est ado Ci vi l Hombre Mujer % d%
Solteros 42,1 23,8 32,5 18,3
Casados 55,6 57,1 55,0 -1,5
Viudos 5,3 19, 1 12,5 - 13, 8
Total 100,0 100,0 100,0 : 0
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
9/19
95 85
% 100 11, 76%
85
(
. = - =
(



Mientras que en el segundo caso la diferencia del 10% en proporcin al 15% representa un
incremento (%) del 66,67%. En este sentido, se puede opinar que es ms significativo este
segundo caso que el primero.

25 15
% 100 66, 67%
15
(
. = - =
(



d) Un cuarto modo es, justamente, l a pr ueba t de di f er enci as de pr opor ci ones de
dos muest r as i ndependi ent es, que permite verificar diferencias entre proporciones
o porcentajes (d%) de dos muestra (grandes) independientes. Los componentes del
modelo y los pasos para el clculo del estadstico de prueba, son:
Model o est adst i co: Distribucin de diferencias de proporciones muestrales,
con media igual a la Medi a de l a di st r i buci n di f er enci as de pr opor ci ones
muest r al es y con Desvo Standard igual al Er r or Est ndar de l as di f er enci as
de pr opor ci ones muest r al es. En smbolos:

0
D
=



1 1 2 2
1 2
D
p q p q
n n
o
- -
= +
= ES
D

Hi pt esi s est adst i cas: La hiptesis nula plantea la igualdad de las
proporciones en las dos muestras, o lo que es lo mismo, que su diferencia es igual
a 0. Mientras que la hiptesis alternativa, la hiptesis del investigador, plantea
que las proporciones muestrales son distintas, es decir, que sus diferencias son
distintas de 0, divergiendo del mero azar. Simblicamente:

0 1 2
H 0 p p D = = =



1 1 2
H 0; o 0 p p D = = =

Est adst i co de pr ueba:
Caso I : t de St udent par a di f er enci as de pr opor ci ones muest r al es
i ndependi ent es ( muest r as gr andes) .


AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
10/19
1 2
1 2
1 1 2 2
1 2
%
p p
D
p p d
t
p q p q
n n
o

= =
- -
+


Est adst i co de pr ueba:
Caso I I : t de St udent di f er enci as de medi as de muest r as i ndependi ent es
( muest r as gr andes) .

( )
1 2
1 2
1 2
2 2
1 2
1 2

X X
D
X X
D
D
X X
t
s s
n n


= =
+


Cl cul o del est adst i co de pr ueba: Si aplicamos la prueba t para el caso II, al
Fi cher o Vent as- Benef i ci os- 1994- 95 X 83 empr esas
2
para poner a prueba la
hiptesis nula de la no existencia de diferencia entre las medias de Benef i ci os
ant es de i mpuest os en l 995 (bai95) entre empr esas del sect or ser vi ci os e
i ndust r i al es. Para ello, debemos dar los siguientes pasos:
i . Recodificar la variable Sector (sect or) asignando los viejos cdigos del sector de
actividad de la variable sect or a la nueva variable dicotomizada sect orb,
categorizada en Sect or Servicios ( 1) y Sect or I ndust rial ( 2) . Dato que la prueba t
compara dos medias en base a una variable de agrupacin dicotmica.
i i . Luego se abre la cuadro de dilogo: Compar ar medi as> Pr ueba T par a
muest r as i ndependi ent es, del men Anal i zar .
i i i . En dicho cuadro seleccionamos la variables bai95 y la pasamos a la ventana
Cont r ast ar var i abl es ( Test Variable) , en Var i abl es de agr upaci n,
seleccionamos la nueva variable que recodifica los sectores: sect orb.

/h

2
Visauta Vinacua, Bienvenido (1997): Anlisis estadstico con SPSS para Windows (6.1), Madrid,
McGraw-Hill, 1997, captulo 4: Test de hiptesis: Comparacin de medias, pp. 111-114.
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
11/19
i v. Luego se definen los grupos: Usar val or es especi f i cados O Punt o de cor t e.
Oprimir Cont i nuar para volver a la ventana original o primaria. Y luego Acept ar .



SPSS ejecuta el comando T- Test y arroja dos tablas con los resultados que se
observan en el Visor de SPSS:



TABLA 4
Estadsticos de grupo


Sector-Servicio-
Industria
N Media Desviacin tp. Error tp. de la media
Beneficios antes de
impuestos (1995)
Sector Servicios 39 23.068,74 50.154,834 8.031,201
Sector Industrial 36 10.774,83 32.247,476 5.374,579

TABLA 5
Prueba de muestras independientes



Prueba de
Levene para la
igualdad de
varianzas
Prueba T para la igualdad de medias
F Sig. t gl
Sig.(
bilate
ral)
Diferencia
de medias
Error tp.
de la
diferencia
95% Intervalo de confianza
para la diferencia
Inferior Superior
Se han
asumido
varianzas
iguales
2,356 ,129 1,251 73 ,215 12.293,91 9.827,639
-
7.292,546
31.880,367


Beneficios
antes de
impuestos
(1995)

No se han
asumido
varianzas
iguales
1,272 65,413 ,208 12.293,91 9.663,658
-
7.003,436
31.591,256
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
12/19

vi . Luego para visualizar los resultados reemplazamos en la frmula del
estadstico t los datos obtenidos en el out put y confirmamos el t - value:
( )
1 2
1 2
1 2
2 2
1 2
1 2

X X
D
X X
D
D
X X
t
s s
n n


= =
+


1 2
12.293,91
1, 251
9.827,639
X X
t

= =


vi i . Por ltimo, tomamos la decisin estadstica con relacin a la hiptesis nula.
Dado que aplicando la Regl a de Deci si n de Fi sher , tenemos que:

Si P- Val ue < P H
0
y H
1

Pero: Si 0,215 > 0,05 H
0
y H
1

y concluimos que no hay diferencias en los Benef i ci os ant es de i mpuest os en
1995, en las 83 empresas entre los Sect or es Ser vi ci os e I ndust r i a.
d) Por ultimo, una quinta forma de probar la hiptesis de independencia es
mediante el estadstico Chi Cuadr ado.
En la tabla 6: Dest i no de sobr evi vi ent es al hundi mi ent o del TI TANI C by
Sex o, ponemos a prueba la hiptesis nula de que no hay diferencias entre los
hombres y mujeres que perecieron. En cambio el investigador sostendr que en
los datos se puede poner a prueba la hiptesis de que en el siniestro del TITANIC
se evidenci una vez ms la aplicacin del principio marinero Primero las mujeres
y los nios y segundo los hombres. Por lo que esperaramos hallar en la cel da
v er i f i cador a (rayado oblicuo en r oj o) mujeres/nios y sobrevieron una
proporcin ( p) mayor que en la celda hombre y sobrevivieron. Observemos qu
decisin nos indica tomar Chi Cuadrado respecto de la hiptesis nula.
0 hombres y sobrevivieron mujeres y sobrevivieron
1 hombres y sobrevivieron mujeres y sobrevivieron
H % 0
H % 0
p p d
p p d
= = = =
= = = =


AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
13/19
TABLA 6

Tabla de contingencia: Destino en el hundimiento del TITANIC segn el Sexo del pasajero
Adaptado y reelaborado de Sanchez Carrin (1999: 331-333) (S.S. Tit anic, Whit e St ar Line, 14
de abril de 1912)[RJR]
Sexo del pasajero


Hombres
Mujeres-
Nios
Total d%
Recuento 637 163 800
% de Sexo de
pasajero
82,2%
32,0% 62,3% +50,2%
Residuo 154,5 -154,5
Residuos
tipificados
7,0 -8,7
Perecieron

Residuos
corregidos
18,2 -18,2
Recuento 138 347 485
% de Sexo de
pasajero
17,8%
68,0%
37,7% -50,2%
Residuo -154,5 154,5
Residuos
tipificados
-9,0 11,1
Destino en el
hundimiento
Se salvaron
Residuos
corregidos
-18,2
18,2

Total Recuento 775 510 1285
% de Sexo de
pasajero
100,0% 100,0% 100,0%
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
14/19
TABLA 7

Pruebas de chi-cuadrado

Valor gl
Sig. asinttica
(bilateral)
P-value
Sig. exacta
(bilateral)
Sig. exacta
(unilateral)
Chi-cuadrado de Pearson 330,307(b) 1 ,000
Correccin por continuidad
de Yates (a)
328,172 1 ,000
Razn de verosimilitud 338,182 1 ,000
Estadstico exacto de
Fisher
,000 ,000
Asociacin lineal por lineal 330,050 1 ,000
N de casos vlidos 1285
a Calculado slo para una tabla de 2x2.
b 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es
192,49.
TABLA 8

Medidas simtricas

Valor
Sig.
aproximada
Nominal por nominal Phi ,507 ,000
V de Cramer ,507 ,000
Coeficiente de Contingencia ,452 ,000
N de casos vlidos 1285
a Asumiendo la hiptesis alternativa.
b Empleando el error tpico asinttico basado en la hiptesis nula.

Las conclusiones que se pueden obtener a partir de los resultados de las distintas
medias, pruebas y coeficientes, son:
La diferencia porcentual (d% = 82,2-32,0=50,2%) acta como medida de la
influencia que tuvo el sexo en la suerte corrida por los pasajeros.
Se confirma una distribucin diagonal de las frecuencias condicionales relativas,
efectivamente, la celda verificadora esperada segn el principio marinero, confirma
que el porcentaje de mujeres/nios que sobrevivieron es 3,8 veces ms (68,0/17,8)
que los hombres que se salvaron. Siendo importante esta magnitud de l a di f er enci a
por cent ual .
Los Residuos tipificados corregidos ( 18,2) se ubican a 9,2 Desvos Standard
respecto del valor crtico 1,96 esperado por azar (18,2/1,96= 9,2), con un intervalo
de confianza de .95. Un tal desvo no puede ser atribuido al azar sino que cabe
esperar que para producirse una tal diferencia es probable (95 veces de cada 100)
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
15/19
que haya operado una decisin y una voluntad en el alto mando del S.S. TITANIC, de
hacer cumplir el principio marinero de salvar a las mujeres y nios primero.
El valor del Chi cuadrado calculado o emprico (Chi-square value) es de una magnitud
muy grande (330,307) y acusa una Si gni f i caci n asi nt t i ca bi l at er al de .000. Esta
cifra es una probabilidad y significa = P- Val ue. Cuando esta probabilidad es inferior a
0,05, (P: Nivel de Significacin = 5%) se suele rechazar la hiptesis de independencia
H
o
de no relacin entre las variables segn la Regl a de deci si n de Fi sher -, para
aceptar la hiptesis alternativa H
1
, que indica que la relacin entre las variables existe
y es estadsticamente significativa y no se debe al azar. Se puede concluir que el
capitn del S. S. Titanic hizo honor a la armada britnica aplicando con firmeza el
principio marinero que dice: Primero las muj eres y los nios, y luego los hombres,
permitiendo que sobrevivan ms mujeres que hombres, ms all del azar, que es lo
sostenido por la hiptesis del investigador. En smbolos:
Resumen del model o

Chi squar e v al ue: 330, 337
Chi Cuadr ado- Cor r ecci n por cont i nui dad de Yat es: 328, 172
P : 0,05 (Nivel de significacin)
P- v al ue: 0,000 (Significacin asinttica bilateral)
Gr ados de Li ber t ad: 1 [df: (c-1)*(f-1)]
Chi Cuadr ado de Tabl a: 3,841 (Ver Tabla de Chi Cuadrado para 1 gl y P:
0,05)
Regl a de deci si n de Fi sher :

Si P- Val ue < P H
0
y H
1


Si 0,000 < 0,05 H
0
y H1

Regl a de deci si n de Pear son:

2 2
calculado tabla
0 1
Si X > X H H


0 1
Si 300,337 > 3,841 H H




AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CA
16/19

P 0, 05 =
Di st r i buci n de l a Cur v a de Chi - Cuadr ado:





0
Aceptacion H
0
Rechazo H
P-value= 0,000


Zona de Riesgo

( )
2 2
teorico 1; 0 , 05 X X 3,841 = =
2
calculado X 300, 337 Chi square value = =
[Elaboracin Propia. RJR]
Finalmente, la magnitud de los coef i ci ent es de asoci aci n indican,
efectivamente, una relacin entre ambas variables del orden de 0,452 y 0,507.
Expresando una mediana fuerza de asociacin teniendo en cuenta que estos
coeficientes varan entre 0 y 1.
CALCULADORA CHI-CUADRADO
3

CORRECCION DE CONTINUIDAD DE YATES


A B SUM
I
637

163

800

II
138

347

485

SUM
775

510

1285

Chi-square value (X):
328.172423

Difference (p<0.05)?
yes

Difference (p<0.01)?
yes


[RJR]

3
Calculadora Chi Cuadrado-Correccin por continuidad de Yates. (En lnea): Disponible:
http://members.tripod.com/~gineco/CHISQUAR.HTM [Consulta: 11 de octubre de 2004]
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CAS
17/19
Table: Chi-Square Probabilities
The areas given across the top are the areas to the right of the critical value. To look up an area on the left, subtract it from one, and then look it up (ie: 0.05 on the left is 0.95
on the right)







AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CAS
18/19
df 0.995 0.99 0.975 0.95 0.90 0.10 0.05 0.025 0.01 0.005
1 --- --- 0.001 0.004 0.016 2.706
3.841
5.024 6.635 7.879
2 0.010 0.020 0.051 0.103 0.211 4.605 5.991 7.378 9.210 10.597
3 0.072 0.115 0.216 0.352 0.584 6.251 7.815 9.348 11.345 12.838
4 0.207 0.297 0.484 0.711 1.064 7.779 9.488 11.143 13.277 14.860
5 0.412 0.554 0.831 1.145 1.610 9.236 11.070 12.833 15.086 16.750
6 0.676 0.872 1.237 1.635 2.204 10.645 12.592 14.449 16.812 18.548
7 0.989 1.239 1.690 2.167 2.833 12.017 14.067 16.013 18.475 20.278
8 1.344 1.646 2.180 2.733 3.490 13.362 15.507 17.535 20.090 21.955
9 1.735 2.088 2.700 3.325 4.168 14.684 16.919 19.023 21.666 23.589
10 2.156 2.558 3.247 3.940 4.865 15.987 18.307 20.483 23.209 25.188
11 2.603 3.053 3.816 4.575 5.578 17.275 19.675 21.920 24.725 26.757
12 3.074 3.571 4.404 5.226 6.304 18.549 21.026 23.337 26.217 28.300
13 3.565 4.107 5.009 5.892 7.042 19.812 22.362 24.736 27.688 29.819
14 4.075 4.660 5.629 6.571 7.790 21.064 23.685 26.119 29.141 31.319
15 4.601 5.229 6.262 7.261 8.547 22.307 24.996 27.488 30.578 32.801
16 5.142 5.812 6.908 7.962 9.312 23.542 26.296 28.845 32.000 34.267
17 5.697 6.408 7.564 8.672 10.085 24.769 27.587 30.191 33.409 35.718
18 6.265 7.015 8.231 9.390 10.865 25.989 28.869 31.526 34.805 37.156
19 6.844 7.633 8.907 10.117 11.651 27.204 30.144 32.852 36.191 38.582
20 7.434 8.260 9.591 10.851 12.443 28.412 31.410 34.170 37.566 39.997
21 8.034 8.897 10.283 11.591 13.240 29.615 32.671 35.479 38.932 41.401
22 8.643 9.542 10.982 12.338 14.041 30.813 33.924 36.781 40.289 42.796
23 9.260 10.196 11.689 13.091 14.848 32.007 35.172 38.076 41.638 44.181
24 9.886 10.856 12.401 13.848 15.659 33.196 36.415 39.364 42.980 45.559
25 10.520 11.524 13.120 14.611 16.473 34.382 37.652 40.646 44.314 46.928
26 11.160 12.198 13.844 15.379 17.292 35.563 38.885 41.923 45.642 48.290
AYUDA SPSS - CHI CUADRADO- NOTAS METODOLGI CAS
19/19
27 11.808 12.879 14.573 16.151 18.114 36.741 40.113 43.195 46.963 49.645
28 12.461 13.565 15.308 16.928 18.939 37.916 41.337 44.461 48.278 50.993
29 13.121 14.256 16.047 17.708 19.768 39.087 42.557 45.722 49.588 52.336
30 13.787 14.953 16.791 18.493 20.599 40.256 43.773 46.979 50.892 53.672
40 20.707 22.164 24.433 26.509 29.051 51.805 55.758 59.342 63.691 66.766
50 27.991 29.707 32.357 34.764 37.689 63.167 67.505 71.420 76.154 79.490
60 35.534 37.485 40.482 43.188 46.459 74.397 79.082 83.298 88.379 91.952
70 43.275 45.442 48.758 51.739 55.329 85.527 90.531 95.023 100.425 104.215
80 51.172 53.540 57.153 60.391 64.278 96.578 101.879 106.629 112.329 116.321
90 59.196 61.754 65.647 69.126 73.291 107.565 113.145 118.136 124.116 128.299
100 67.328 70.065 74.222 77.929 82.358 118.498 124.342 129.5

Potrebbero piacerti anche