Sei sulla pagina 1di 44

Prof.

Ren Castro

Psicoestadstica

UBA

Inferencia estadstica por pruebas no paramtricas de hiptesis con


variables categricas nominales. Chi cuadrado (X2).
Se denomina VARIABLE CATEGORICA o CUALITATIVA a las que describen una
cualidad, atributo, propiedad o caractersticas de un sujeto, fenmeno, factor, cosa, etc. y
cuyos valores son categoras o clases excluyentes.
Ejemplo: el sexo, la raza o clasificacin tnica, la clase social, la categora laboral,
participar o n en un programa de investigacin o participacin, el tipo de tratamiento
aplicado, los distintos departamentos de una empresa, padecer o n de un determinado
sntoma, estado civil, nivel socioeconmico, color del pelo, color de los ojos, etc. Es una
variable sobre las que nicamente es posible obtener una medida en escala de tipo
nominal (u ordinal, pero con muy pocos valores). Cuando se trabaja con este tipo de
variables, los datos pueden organizarse en tablas de doble o ms entradas en las que
cada entrada representa un criterio de clasificacin o categora (una variable categrica).
Como resultado de esta clasificacin, la frecuencia, el nmero de casos o el
porcentaje de los mismos se presentan organizadas en casillas que contienen
informacin sobre la relacin existente entre ambos criterios. A estas tablas de
frecuencias se les denomina tablas de contingencia.
Escala Nominal.- No poseen propiedades cuantitativas y sirven nicamente para asignar,
designar o identificar las clases. Los datos empleados con las escalas nominales constan
generalmente de la frecuencia de los valores o de la tabulacin de nmero de casos en
cada clase, segn la variable que se est estudiando. El nivel nominal permite mencionar
similitudes y diferencias (relacin igualdad o desigualdad) entre los casos particulares.
Los datos evaluados en una escala nominal se llaman tambin "observaciones
cualitativas", debido a que describen la cualidad, atributo o calidad de una persona o cosa
estudiada, u "observaciones categricas" porque los valores se agrupan en categoras.
Por lo regular, los datos nominales o cualitativos se describen en trminos de frecuencia,
porcentaje o proporciones. Para exhibir este tipo de informacin se usan con mayor
frecuencia tablas de contingencia y grficas de barras. Ejemplo: color de ojos, estado civil,
sexo, ansiedad, agresividad, alexitimia, claustrofobia, etc. Usada principalmente por
variables cualitativas o categricas.
Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras
(caracterstica que define a las escalas nominales) sino que mantiene una especie de
relacin entre s. Tambin permite asignar un lugar especfico a cada objeto de un mismo
conjunto, de acuerdo con la intensidad, nivel, fuerza, etc.; presentes en el momento de la
medicin. Una caracterstica importante de la escala ordinal es el hecho de que, aunque
hay orden entre las categoras, la diferencia entre dos categoras adyacentes no es la
misma en toda la extensin de la escala. Algunas escalas consisten en calificaciones de
mltiples factores que se agregan despus para llegar a un ndice general. Usada
principalmente por variables cualitativas o categricas.
Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala
de posicin", donde las observaciones se clasifican de mayor a menor (o viceversa). Al
igual que en las escalas nominales, se emplean a menudo porcentajes y proporciones
en escalas ordinales. Ejemplo: nivel socioeconmico (Alto, Medio, Bajo), agresividad
(intensa, promedio, baja), etc.
Psicologa

Pgina 1

Prof. Ren Castro

Psicoestadstica

UBA

Descripcin de Pruebas no paramtricas


Las pruebas y modelos estadsticos no paramtricos son aquellos cuya distribucin de
los datos no se ajusta a un tipo de distribucin conocida, como por ejemplo la distribucin
normal. Su distribucin no puede ser definida ni conocida a priori, pues son los datos
observados los que la determinan, por esto el empleo de estos mtodos se hace
recomendable cuando no se puede asumir que los datos se ajusten a una distribucin
conocida.
Las pruebas no paramtricas nos permiten analizar datos en escala nominal u ordinal a
pesar de que no se conozcan los parmetros de una poblacin (su media, moda,
mediana, su distribucin, su forma, etc.) y es utilizada para hacer un contraste de
hiptesis.
Empleo:

Cuando los datos puntualizan a las escalas nominal u ordinal.


Se utiliza solo la frecuencia.
Se tabula el nmero de casos en cada clase estudiada
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social. (Muestras pequeas no representativas >5).
Cuando se requiere de establecer el nivel de confianza o significatividad en las
diferencias.
Cuando la muestra es seleccionada no probabilsticamente.
Pruebas no paramtricas
Descripcin.
Para escala nominal:

Leyes de la probabilidad y prueba binomial.


Prueba
de Pearson para una muestra.
Prueba
de Pearson para dos y ms muestras independientes.
Prueba de bondad del ajuste mediante .
Prueba
de proporciones para tres o ms muestras independientes.
Prueba de probabilidad exacta de Fischer y Yates.
Prueba de McNemar para muestras dependientes.
Prueba Q de Cochran para tres o ms muestras dependientes.
Anlisis secuencial.
Para escala ordinal:

Prueba de Kolmogorov-Smirnov para una muestra.


Prueba de U Mann-Whitney para dos muestras independientes.

Psicologa

Pgina 2

Prof. Ren Castro

Psicoestadstica

UBA

Prueba de Wilcoxon de rangos sealados y pares igualados para dos muestras


dependientes.
Anlisis de varianza de una entrada de Kruskal-Wallis para ms de dos muestras
independientes.
Anlisis de varianza de doble entrada por rangos de Friedman para ms de dos muestras
dependientes.

Psicologa

Pgina 3

Prof. Ren Castro

Psicoestadstica

UBA

Prueba ji, chi, X2cuadrada de Pearson para una muestra


2

La prueba estadstica de X para una muestra se emplea frecuentemente como prueba de


bondad de ajuste, sin embargo, en un plan experimental, en el que se cuenta con un grupo
muestral, con diversas subclases y las mediciones estn en escala nominal, resulta muy til este
procedimiento. Esta prueba permite determinar si existe o no una diferencia significativa entre el
nmero de casos observados en la realidad (prctica) en cada categora y el nmero de casos
esperados (teora), en base a la hiptesis nula. Responde a la pregunta: Se ajusta bien la
distribucin de los datos observados a la distribucin terica o esperada?.
Lo que se requiere es una hiptesis nula que permita especificar las frecuencias que han de
esperarse en cada categora y, posteriormente, un examen de esta hiptesis nula. La hiptesis
nula puede examinarse mediante la siguiente frmula:

Donde:
2
X = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Si la hiptesis nula es cierta (no hay relacin/asociacin entre las variables, o lo que es igual, no
hay diferencia entre frecuencias observadas y esperadas, por lo que hay independencia entre las
2
variables en estudio), la funcin X sigue una distribucin de valores denominada Chi Cuadrado
2
(X ), con (f-1)*(c-1) grados de libertad, en la cual todos los valores cumplen con la condicin de la
Ho.
Por esto, si existe una coincidencia grande entre las frecuencias observadas (fo) y las
2
esperadas (fe), la X resultante ser pequea, por lo que se aceptar Ho (no se rechazar). Al
2
aumentar la discrepancia (fo fe), el valor de X aumenta, por lo que se puede rechazar la
hiptesis nula Ho.
2

La ji o chi cuadrada (X ) se utiliza cuando:

Cuando los datos puntualizan a las escalas nominal u ordinal.


Se utiliza solo la frecuencia.
Poblaciones pequeas.
Cuando se desconocen los parmetros media, moda, etc.
Cuando los datos son independientes.
Cuando se quiere contrastar o comparar hiptesis.
Investigaciones de tipo social - muestras pequeas no representativas >5.
Cuando se requiere de establecer el nivel de confianza o significatividad en las diferencias.
Cuando la muestra es seleccionada no probabilsticamente.
2
X permite establecer diferencias entre f y se utiliza solo en escala nominal.
Poblacin > a 5 y < a 20 (no limitativo).
Pasos.
1. Establecer tipo y escala de la variable
2. Hiptesis de trabajo o de investigacin
3. Eleccin de la prueba.

Psicologa

Pgina 4

Prof. Ren Castro


4.
5.
6.
7.
8.
9.

10.
11.
12.
13.
14.
15.
16.

Psicoestadstica

UBA

Planteamiento de las hiptesis estadsticas (Ho y Ha).


Nivel de significacin ().
Zona de rechazo.
Grfica de la zona de aceptacin y rechazo de Ho.
Arreglar las categoras y las frecuencias observadas en una tabla.
Aplicar la prueba estadstica: calcular los valores de las frecuencias tericas esperadas para
2
este modelo experimental o tipo de distribucin X segn Ho o teora o hiptesis previa.
Presentar en una tabla.
Calcular las diferencias de las frecuencias observadas en el experimento con respecto a las
frecuencias esperadas.
Elevar al cuadrado las diferencias y dividirlas entre los valores esperados de cada categora.
2
Efectuar la sumatoria de los valores calculados. Obtener el valor X calculado.
Calcular los grados de libertad (gl) en funcin de nmero de categoras [K]: gl = K - 1.
2
Comparar el estadstico X calculado con los valores de la distribucin de ji cuadrada en la tabla.
2
2
Decidir si se acepta o rechaza la hiptesis, si X calculada es mayor (>) X tabla(k-1), se rechaza
Ho.
Interpretar los resultados obtenidos.
Ejemplo:

Un investigador quiere comparar si hay diferencias en la cantidad de cigarros fumados por causa
del estrs en personas que trabajan.
Variable categrica nominal
Cantidad de cigarrillos fumados por causa del estrs o fumar por causa del estrs.
Hiptesis de trabajo o de investigacin:
Si las personas que laboran en empresas consumen la misma cantidad de cigarrillos por causa del
estrs, entonces una muestra del personal de una agencia de ventas de autos (2013-2014) no
presentar diferencias entre la cantidad de cigarrillos fumados por causa del estrs.
Eleccin de la prueba.
El modelo experimental tiene una muestra y la variable es categrica en escala nominal,
presentando la frecuencia de los valores o de la tabulacin de nmero de casos en cada clase, se
2
elige la prueba X de Pearson para una muestra (vase al final de la gua: Flujogramas/Flujograma
1).
Planteamiento de las hiptesis estadsticas (Ho y Ha).
Modelo para estas hiptesis:
Ho: no hay diferencia entre las frecuencias o no hay dependencia entre las variables estudiadas.
La variacin es causada por el azar.
Ha: si hay diferencia entre las frecuencias o existe dependencia entre las variables estudiadas. La
variacin es causada por la posible variable independiente.
Planteamiento de las hiptesis del problema:

Hiptesis alterna (Ha). Existir diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en personas que trabajan. La hiptesis alterna tambin se conoce como H1.

Hiptesis nula (Ho). No existir diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en personas que trabajan, por lo que el consumo de cigarros por causa del estrs
se puede considerar como efecto del azar.

Psicologa

Pgina 5

Prof. Ren Castro

Psicoestadstica

UBA

Nivel de significacin: =0,05


El valor alfa () es la probabilidad de rechazar Ho, siendo Ho verdadera. Tambin se conoce como
error de tipo 1 o error de tipo alfa () o falso positivo: no aceptar la Ho, siendo verdadera. Se afirma
la existencia de una diferencia entre hiptesis cuando en realidad no existe. Seguidamente se tiene
que decidir qu tan baja probabilidad es posible aceptar antes de rechazar el modelo propuesto en
la Ho. Generalmente, el nivel de confianza escogido es de 5%. Si la probabilidad es menor de 0,05,
la diferencia es significativa y se rechaza Ho, y si es menor de 0,01, esta es considerada
altamente significativa. Por esto, para todo valor de probabilidad igual o menor que 0,05, se
acepta Ha y se rechaza Ho.
Para el valor o nivel de significacin de 0,05:
a)
b)
c)

Si el valor de X tabla es superior al valor de X calculado, se acepta o no se rechaza Ho.


2
2
Si el valor de X tabla es menor al valor de X calculado, se rechaza Ho y se acepta Ha.
2
Si el valor de probabilidad de X calculado (para el # de grados de libertad prefijados) es
igual o menor que 0,05, (por ejemplo 0,04/0,03/0,02/0,01/0,005, etc.) se acepta Ha y se
rechaza Ho, ya que esto indicara la existencia de diferencias significativas entre las
variables (ojo: los programas de estadstica como SPSS, R, Statgraphics, etc., usan esta
forma de presentar los resultados de un anlisis).
2
Este valor puede obtenerse directamente de la tabla de valores crticos de X , adjunta al
2
final de esta gua. Por ejemplo, si X calculado da un valor de 7,07 para un (1) grado de
2
2
libertad, se busca en la tabla de valores crticos de X en la fila de valores X para un grado
de libertad (la primera fila debajo de los valores alfa () de probabilidad). Puede observarse
que el valor de 7,07 se encuentra entre los valores de 6,63 (para 0,01 de probabilidad) y
7,87 (para 0,005 de probabilidad). Ya que ambos valores de probabilidad son menores que
0,05, se acepta Ha y se rechaza Ho.
Si la probabilidad tiene un valor numricamente alto (mayores que 0,05, como
0,06/0,07/0,1, etc.) se considera que la desviacin es debida al azar y que los datos
respaldan la Ho por lo que se rechaza Ha. Si la probabilidad es numricamente baja
(menores que 0,05, como 0,04/0,03/0,02/0,01/0,0005, etc.), la desviacin no es debida al
azar y que los datos respaldan la Ha.

Zona de rechazo.
2

Si el valor de X calculado es mayor que el valor de X tabla (para = 0,05 y un # de gl


2
establecidos) se rechaza Ho y se acepta Ha. Si el valor de probabilidad del X calculado es menor
que 0,05 (ejemplo 0,03, 0,02, 0,01, etc.), para el # de grados de libertad prefijados, se rechaza Ho
y se acepta la Ha.
Grfica de la zona de aceptacin y rechazo de Ho.

Si el del X2 calculado es numricamente mayor a


0,05 (0,06/0,07/0,8), se acepta Ho.

Psicologa

Si el del X2 calculado es numricamente menor a


0,05 (0,04/0,02/0,001), se acepta H1

Pgina 6

Prof. Ren Castro

Psicoestadstica

UBA

Aplicacin de la prueba estadstica.


Para realizar el contraste de Bondad de Ajuste debemos calcular las frecuencias esperadas de
cada suceso bajo la hiptesis de uniformidad entre los valores. El clculo de la frecuencia
esperada se efecta en virtud de que para una hiptesis nula, a todas las casillas corresponde un
valor igual, por lo tanto:
Clculo de la frecuencia esperada:

fo = 18
fe = 6
Tabla con los datos de las frecuencias observadas y esperadas:
Variable (escala nominal)
Tipo de
frecuencia

Total

Fuma por causa


del estrs

No sabe

No fuma por
causa del estrs

Observada (fo)

18

Esperada (fe)

18

Frmula de X

Donde:
2

X = valor estadstico de ji cuadrada.


fo = frecuencia observada.
fe = frecuencia esperada.

Clculos de X2:

Calcular el nmero de grados de libertad (gl):


gl = k 1 = 3 - 1 = 2 siendo k el nmero de categoras estudiadas.

Psicologa

Pgina 7

Prof. Ren Castro

Psicoestadstica

UBA

Clculo de la estadstica de prueba X para los datos de fumar o no por causa del estrs.
Variable

Frecuencia
observada (fo)

Frecuencia
esperada (fe)

(fo-fe)

(fo-fe)2

(fo-fe)2/fe

Fuma por causa del


estrs

1,5000

No sabe

-4

16

2,6667

No fuma por causa del


estrs

0,1667

4,3333

Nivel de significacin: = 0,05


2

El valor calculado de X se compara con los valores crticos de la tabla de valores crticos de X .
2
Se puede observar que para una probabilidad de 0,05 corresponde un valor crtico de X tabla
2
(0,05, 2) de 5.99; por lo tanto, el estadstico ji cuadrado calculado o X calculado de 4,33 es menor
2
que el valor X de la tabla, o tiene una probabilidad mayor que 0,05 (puede estar entre 0,1 y 0,25,
ambos valores superiores o mayores a 0,05, exactamente da 0,1145, obtenido mediante
DISTR.CHI de Excel).
Decisin.
2

En virtud de que: a) el valor de X tabla es superior al valor de X calculado, se acepta o no se


2
2
rechaza Ho o b) la X calculada es menor (<) que X tabla, por lo que se acepta Ho. Tambin puede
2
2
afirmarse que: c) el valor de X calculado es de 4,33. Si observamos la tabla de valores crticos de X ,
para 2 grados de libertad, este valor se encuentra entre 2,773 para 0,25 de probabilidad, y 4,605
para 0,1 de probabilidad (0,1147 de probabilidad calculada con DISTR.CHI de Excel). Esto indica
2
que la probabilidad obtenida al calcular el valor de X es numricamente mayor que 0,05, por lo
que est dentro de la regin de aceptacin o no rechazo de Ho, por lo que se acepta Ho y se
rechaza Ha.

X calculado= 4,33

X tabla (0,05;2)= 5,99

Si el del X2 calculado es numricamente mayor a


0,05 (0,06/0,07/0,8), se acepta Ho.

Si el del X2 calculado es numricamente menor a


0,05 (0,04/0,02/0,001), se acepta H1

Entonces tenemos que:


2

Dado que la X calculada es 4,33, el cual es menor (<) que X tabla(0,05, 2) es 5,99 se acepta Ho. Por ende,
no hay diferencias significativas entre el consumo de cigarros por causa del estrs.

Psicologa

Pgina 8

Prof. Ren Castro

Psicoestadstica

UBA

Interpretacin.
El consumo de cigarros por causa del estrs se puede considerar como efecto del azar.

Psicologa

Pgina 9

Prof. Ren Castro

Psicoestadstica

UBA

Prueba ji cuadrada de Pearson para dos y ms muestras


independientes. Tablas de contingencia.
Cuando las observaciones de una investigacin corresponden a muestras independientes y las
mediciones se tienen en escala nominal, la prueba de ji cuadrada es el procedimiento de eleccin
para el contraste de hiptesis. Esta prueba estadstica se emplea en el anlisis de dos o ms
grupos y de dos o ms variables.
Ejemplos: existe alguna diferencia en la tasa de delincuencia de los nios procedentes de
diferentes niveles socioeconmicos?, o en otras palabras, la tasa de delincuencia en nios es
independiente del nivel socioeconmico o depende en parte de ese nivel?. Si se trata de una
encuesta de opiniones podramos determinar su existe una diferencia de opiniones entre hombres
y mujeres respecto las compras de alimentos para la casa, colores de los autos, etc.?. El clculo de
las frecuencias esperadas se basan tanto en la hiptesis nula (la variable X es independiente de la
variable Y) como en las frecuencias totales obtenidas, multiplicndose las frecuencias subtotales o
marginales comunes a una casilla y dividindose entre la sumatoria total de las frecuencias, como
se ver ms adelante.
La frmula es:

Donde:
2
X = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Pasos:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

Establecer tipo y escala de la variable


Hiptesis de trabajo o de investigacin
Eleccin de la prueba.
Planteamiento de las hiptesis estadsticas (Ho y Ha).
Nivel de significacin ().
Zona de rechazo.
Grfica de la zona de aceptacin y rechazo de Ho.
Aplicar la prueba estadstica: arreglar las observaciones en una tabla de contingencias.
Determinar el valor terico de las frecuencias para cada casilla.
Calcular las diferencias entre los valores observados con respecto a los tericos de cada casilla.
Elevar al cuadrado las diferencias y dividirlas entre el valor terico de la casilla correspondiente.
2
Obtener la sumatoria de los valores anteriores, que es el estadstico X .
Calcular los grados de libertad (gl): gl = (K columnas -1) X [H hileras -1].
2
El valor de X se compara con los valores crticos de ji cuadrada de la tabla de valores crticos de
2
X y de acuerdo con los grados de libertad, y se determina la probabilidad.
2
2
15. Decidir si se acepta o rechaza la hiptesis Ho, si X calculada es mayor (>) que X tabla, se
rechaza Ho.
16. Interpretar los resultados obtenidos.

Psicologa

Pgina 10

Prof. Ren Castro

Psicoestadstica

UBA

Ejemplo:
Comparar si el factor gnero influye en la cantidad de cigarros fumados por causa del estrs en
personas que trabajan.
Variables categricas nominales
Variable 1: Variable independiente: hombres y mujeres.
Variable 2: Variable dependiente: Cantidad de cigarrillos fumados debido al estrs
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes y la variable es categrica en escala
nominal, presentando la frecuencia de los valores o de la tabulacin de nmero de casos en cada
clase, con un tamao de muestra mayor de 20, lo que en este caso mejora su eficacia. Adems, es
un estudio social que comprende una poblacin pequea en el que: a) se quiere contrastar o
evaluar una hiptesis y b) no se conoce a priori la distribucin de los datos de las variables
2
estudiadas. Por esto, se elige la prueba X de Pearson para dos muestras independientes (vase
al final de la gua: Flujogramas/Flujograma 2).
Hiptesis de trabajo o de investigacin:
Modelo para estas hiptesis:
Si
Entonces

muestra

V.Ind.
V.Ind.

relacin
relacin

V. dep. (seccin terica).


V. dep. (seccin prctica).

Si los hombres y las mujeres que laboran en empresas consumen la misma cantidad de
cigarrillo fumados por causa del estrs, entonces una muestra del personal femenino y
masculino de un departamento de cobranzas de un banco regional (2013-2014) no presentar
diferencias entre la cantidad de cigarrillos fumados por causa del estrs.
Ejemplos de relaciones entre variables:
Relacin en seccin terica
Relacin en seccin prctica

En conclusin
Gua para la redaccin de:

Caso A
la misma/igual/idntica/
semejantes/similares
no presentarn diferencias/ no
se observarn diferencias/no
se detectarn diferencias/ no
hay diferencias
Observar: se nulifican
diferencias, se niegan las
diferencias, no existen
diferencias, no hay diferencias
Ho (hiptesis nula)

Caso B
Diferente/ desigual/ dismiles/
desemejante/ dispar/ distinto
se encontrarn diferencias/
presentar diferencias/ se
observarn diferencias/ Si hay
diferencias
Observar: se afirman las
diferencias, hay diferencias,
existen diferencias, se
confirman las diferencias
H1 (hiptesis alterna)

Planteamiento de las hiptesis estadsticas (Ho hiptesis nula y Ha o H1 hiptesis alterna).


Modelo para estas hiptesis:
Ho: no hay diferencia entre las frecuencias de la variable dependiente o no hay dependencia entre
las variables estudiadas. La variacin no es importante y es causada por el azar. (Ho: f1=f2=f3=fn).

Psicologa

Pgina 11

Prof. Ren Castro

Psicoestadstica

UBA

Ha: si hay diferencia entre las frecuencias de la variable dependiente o existe dependencia entre
las variables estudiadas. La variacin es importante y es causada por la posible variable
independiente. (Ha: f1f2f3fn o al menos 2 frecuencias son diferentes).
Planteamiento de las hiptesis estadsticas del problema:

Hiptesis nula (Ho). No habr diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en hombres y mujeres que trabajan, ya que no hay dependencia entre las
variables estudiadas por lo que las escasas variaciones en el consumo de cigarros por causa del
estrs se puede considerar como efecto del azar.

Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en hombres y mujeres que trabajan, ya que existe dependencia entre las variables
estudiadas por lo que las relevantes variaciones en el consumo de cigarros se puede considerar
como efecto/causa del estrs. La hiptesis alterna tambin se conoce como H1.,
Nivel de significacin: ( = 0,05).
El valor alfa () es la probabilidad de rechazar Ho, siendo Ho verdadera: (error de tipo 1 o error de
tipo alfa () o falso positivo) no aceptar la Ho, siendo verdadera. Para este valor:
2

a) Si el valor de X tabla es superior al valor de X calculado, se acepta o no se rechaza Ho.


2
2
b) Si el valor de X tabla es menor al valor de X calculado, se rechaza Ho y se acepta Ha.
2
c) Dicho de otro modo, para todo valor de probabilidad de X calculado que sea
numricamente igual o menor que 0,05, se acepta Ha y se rechaza Ho (los paquetes
estadsticos SPSS, R, Statgraphics, etc. presentan los resultados de esta forma). Si la
probabilidad tiene un valor numricamente alto (mayores que 0,05, como 0,06/0,07/0,1, etc.)
se considera que la desviacin es debida al azar y que los datos respaldan la Ho por lo que se
rechaza Ha. Si la probabilidad es numricamente baja (menores que 0,05, como
0,04/0,03/0,02/0,01/0,0005, etc.), la desviacin no es debida al azar y que los datos respaldan
la Ha.
Zona de rechazo.
2
2
Si el valor de X calculado es mayor que el valor de X tabla (para = 0,05 y un # de gl
establecidos) se acepta Ha y se rechaza Ho. Dicho de otro modo:
2
2
Si el valor de X tabla es menor al valor de X calculado se acepta Ha y se rechaza Ho.
2
2
Si el valor de X tabla es mayor al valor de X calculado se acepta Ho y se rechaza H1.
2
Si el valor de probabilidad de X calculado es menor que 0,05 (como 0,04/0,03/0,005, etc.)
para el # de grados de libertad prefijados, se acepta la Ha.
Grfica de la zona de aceptacin y rechazo de Ho.

X tabla (/GL)

Si el del X2 calculado es numricamente mayor a


0,05 (0,06/0,07/0,8), se acepta Ho.

Psicologa

Si el del X2 calculado es numricamente menor a


0,05 (0,04/0,02/0,001), se acepta H1

Pgina 12

Prof. Ren Castro

Psicoestadstica

UBA

Entonces tenemos que:


Tabla de contingencia 3X2 con las frecuencias observadas

Variable fumar por estrs


Variable gnero

MARGINAL O
SUBTOTAL

FUMA POR CAUSA


DEL ESTRS

NO SABE

NO FUMA POR
CAUSA DEL ESTRS

HOMBRE

15

10

25

50

MUJER

20

35

60

MARGINAL O
SUBTOTAL

35

15

60

110
TOTAL

Aplicacin de la prueba estadstica.


Calculamos los valores de la frecuencia terica esperada para cada casilla.
En este caso, el clculo de las frecuencias esperadas se realiza multiplicndose las frecuencias
subtotales o marginales comunes a una casilla y dividindose entre la sumatoria total de las
frecuencias.

Agrupamos estos valores de la frecuencia esperada en una tabla:


Tabla de las frecuencias esperadas:

HOMBRE
MUJER
MARGINAL O
TOTAL

FUMA POR CAUSA


DEL ESTRS
15,91
19,09
35

6,82
8,18

NO FUMA POR
CAUSA DEL ESTRS
27,27
32,73

MARGINAL O
TOTAL
50
60

15

60

110

NO SABE

Una grfica de la frecuencia observada y esperada sera la siguiente:

Psicologa

Pgina 13

Prof. Ren Castro

Psicoestadstica

UBA

Frecuencia observada y esperada para gnero y fumar o no por estres


35

Frec. Absol. sim. (FAS)

35
30

25

25

32,73

27,27
20 19,09

20

15 15,91

15

10

8,18

6,82

10

5
0
Hombre
fuma por
estrs

Hombre no Hombre no Mujer fuma


sabe
fuma por
por estrs
estrs

Mujer no
sabe

Mujer no
fuma por
F. observada
estrs

Gnero fuma o no por estrs

F. esperada

Una vez obtenidos los valores tericos, aplicamos la frmula de X .

Donde:
2

X = valor estadstico de ji cuadrada.


fo = frecuencia observada.
fe = frecuencia esperada.
2

Clculo de X :

Tambin podemos hacer estos clculos en forma tabular:


2

Calculo de la estadstica de prueba X para los datos de gnero vs. causa del fumar

Psicologa

Pgina 14

Prof. Ren Castro

Psicoestadstica

UBA

Variable
gnero

Variable fumar

fo

fe

(fo-fe)

(fo-fe)2

(fo-fe)2/fe

HOMBRE

Fuma por causa del


estrs

15

15,91

-0,91

0,8281

0,0520

HOMBRE

No sabe

10

6,82

3,18

10,1124

1,4828

25

27,27

-2,27

5,1529

0,1890

20

19,09

0,91

0,8281

0,0434

HOMBRE
MUJER

No fuma por causa del


estrs
Fuma por causa del
estrs

MUJER

No sabe

8,18

-3,18

10,1124

1,2362

MUJER

No fuma por causa del


estrs

35

32,73

2,27

5,1529

0,1574

X2

3,1608

Clculo de los grados de libertad (gl).


gl = (K - 1) (H - 1) = (3 - 1) (2 - 1) = 2 (k = columnas y h = hileras o filas)
Nivel de significacin: = 0,05.
2

El valor de X calculado de 3,15 con 2 grados de libertad. Este dato se compara con los de la
2
tabla de valores crticos de ji cuadrada; en la misma se puede obtener el valor de X (0,05,2) es 5,99,
2
que corresponde a la probabilidad de 0,05, lo cual significa que: a) el valor X tabla es menor que el
2
valor X calculado, por lo que no se puede rechazar la hiptesis nula y b) el estadstico calculado
tiene una probabilidad numricamente mayor que 0,05, ya que 3,16 se encuentra entre los valores
de 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad (probablemente 0,2054,
obtenido por DIST:CHI de Excel) por lo que no podemos rechazar la hiptesis nula. Dicho de
2
otra forma, si observamos la tabla de valores crticos de X al final de la gua, los valores de X2
ms parecidos a 3,15 son: 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad para 2
2
grados de libertad. En esta tabla, para estos grados de libertad (2), estos valores de X son los ms
2
parecidos al valor de X calculado de 3,15 obtenido, y sus niveles de significacin ya son
2
numricamente mayores que 0,05. El valor de probabilidad real (P valor de X calculado es 0,2054,
obtenido con DIST.CHI de Excel) es numricamente mayor de 0,05. Por todo esto, no podemos
rechazar la hiptesis nula.

Decisin.
2

En razn de que el valor de X o ji cuadrada calculada es de 3,15 y es menor que el valor de X2


tabla (0,05,2) cuyo valor es de 5,99, se acepta la Ho y se rechaza la Ha. Tambin pude decirse que
2
la X calculada tiene una probabilidad numricamente mayor que 0,05 (en este caso es 0,2054),
por lo que cae en la zona de aceptacin de Ho. Entonces no hay diferencias significativas entre el
consumo de cigarros por causa del estrs entre hombres y mujeres que trabajan.
Ver grfica a continuacin.

Psicologa

Pgina 15

Prof. Ren Castro

X calculado= 3,16

Psicoestadstica

UBA

X tabla (0,05;2)= 5,99

Si el del X calculado es numricamente mayor a


0,05 (0,06/0,07/0,8), se acepta Ho.

Si el del X calculado es numricamente menor a


0,05 (0,04/0,02/0,001), se acepta H1

Otra forma de ver este grfico sera:

(Escala

aproximada)
2

Si el del X calculado es numricamente mayor a 0,05


(0,06/0,07/0,8), se acepta Ho.

Si el del X calculado es numricamente


menor a 0,05 (0,04/0,02/0,001), se acepta H1

Resultado de Statgraphics Centurion XV:


Pruebas de Independencia
Prueba
Estadstico
Chi-Cuadrada
3,165

Gl
2

Valor-P
0,2055

El StatAdvisor

Psicologa

Pgina 16

Prof. Ren Castro

Psicoestadstica

UBA

Esta tabla muestra los resultados de la prueba de hiptesis ejecutada para determinar si se
rechaza, o no, la idea de que las clasificaciones de fila y columna son independientes (Ho). Puesto
que el valor-P es mayor o igual que 0,05, no se puede rechazar la hiptesis de que filas y
columnas son independientes (Ho) con un nivel de confianza del 95,0%. Por lo tanto, la fila
observada para un caso en particular, pudiera no tener relacin con su columna.
Puede observarse que los paquetes estadsticos no emplean el valor crtico o tabla del estadstico
2
2
calculado (X ), sino que trabajan con el P valor del estadstico calculado, que en este caso es X
para aceptar o rechazar la Ho.
Interpretacin.
El consumo de cigarros entre hombres y mujeres que trabajan, no se debe al estrs, se debe a
diversos factores ocasionado por el azar.

Psicologa

Pgina 17

Prof. Ren Castro

Psicoestadstica

UBA

Prueba ji (X2) cuadrada de Pearson para tres o ms muestras independientes


Ejemplo:
En una investigacin transversal de enfermedad diarreica en nios menores de seis aos, un
mdico tuvo el inters de conocer si existan diferencias respecto a la condicin socioeconmica de
una poblacin a la que estudio, o dicho de otro modo, la incidencia de la enfermedad diarreica en
nios menores de seis aos es independiente del nivel o condicin socioeconmica o depende en
parte de ese nivel?.
Variable categrica ordinal
Variable 1: variable independiente: condicin o nivel socioeconmico (alto, medio, bajo).
Variable categrica nominal
Variable 2: variable dependiente: nios menores de 6 aos en condicin diarreica (con diarrea y sin
diarrea).
Eleccin de la prueba estadstica.
El modelo experimental tiene 3 o ms muestras independientes y las variables son categricas
en escala nominal y ordinal, presentando la frecuencia de los valores o de la tabulacin de
nmero de casos en cada clase, con un tamao de muestra por casilla mayor de 5. Adems,
estamos interesados en contrastar las 3 muestras independientes estudiadas, es un estudio
social que comprende una poblacin relativamente pequea en el que: a) se quiere contrastar o
evaluar una hiptesis y b) no se conoce a priori la distribucin de los datos de las variables
2
estudiadas. Por esto, se elige la prueba X de Pearson para 3 o ms muestras independientes
(vase al final de la gua: Flujogramas/Flujograma 4).
Hiptesis de trabajo o de investigacin:
Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en los
tres grupos de condicin socioeconmica.
Modelo para estas hiptesis:
Si
Entonces

muestra

V.Ind.

relacin

V. dep. (seccin terica).

V.Ind.

relacin

V. dep. (seccin prctica).

Planteamiento de la hiptesis de investigacin de este ejemplo:


Si el nivel socioeconmico afecta/influye en la incidencia de la enfermedad diarrica en nios
menores de 6 aos, entonces una muestra no probabilstica de nios menores de 6 aos
pertenecientes a 3 distintos estratos sociales de la ciudad de Maracay (2013-2014) presentarn
diferencias en la incidencia de la enfermedad diarrica.
Ejemplos de relaciones entre variables:
Relacin en seccin
terica
Relacin en seccin
prctica

En conclusin
Gua para la redaccin de:

Psicologa

Caso A
No afecta/ no influye/ no altera/
la misma/igual/idntica/
semejantes/similares
no presentarn diferencias/ no
se observarn diferencias/no se
detectarn diferencias/ no hay
diferencias
Observar: se nulifican
diferencias, no hay diferencias,
no existen diferencias, se niegan
las diferencias
Ho (hiptesis nula)

Caso B
Afecta/ influye/ altera/
Diferente/ desiguales/
dismiles
se encontrarn diferencias/
presentar diferencias/ se
observarn diferencias/ Si
hay diferencias
Observar: se afirman las
diferencias, hay diferencias,
existen diferencias, se
confirman las diferencias
H1 (hiptesis alterna)

Pgina 18

Prof. Ren Castro

Psicoestadstica

UBA

Planteamiento de las hiptesis estadsticas (Ho y Ha).


Modelo para estas hiptesis:
Ho (nulifica diferencias entre las frecuencias): no hay diferencia entre las frecuencias observadas
para la variable dependiente, por lo que existe independencia o no hay dependencia/relacin entre
las variables estudiadas. La variacin es causada por el azar. (Ho: f1=f2=f3=fn).
Ha (afirma/confirma diferencias entre las frecuencias): si hay diferencia entre las frecuencias de la
variable dependiente o existe dependencia o relacin entre las variables estudiadas. La variacin
es causada por la posible variable independiente. (Ha: f1f2f3fn o al menos 2 frecuencias son
diferentes).
Planteamiento de las hiptesis estadsticas del problema:

Hiptesis alterna (Ha). Existen diferencias relevantes entre las frecuencias o incidencias de la
enfermedad diarreica en nios menores de 6 aos que pertenecen a las tres clases econmicas
estudias. En otras palabras, las diferencias que se observan en las frecuencias de enfermedad
diarreica en las tres clases socioeconmicas no se deben al azar, por lo que se puede afirmar que
existe una relacin o dependencia entre las variables estudiadas (Nivel socioeconmico y la
presencia de la enfermedad).

Hiptesis nula (Ho). No existen diferencias significativas entre las frecuencias de la enfermedad
diarreica en nios menores de 6 aos que pertenecen a las tres clases econmicas estudias. En
otras palabras, las diferencias que se observan en las frecuencias de enfermedad diarreica en las
tres clases socioeconmicas se deben al azar, por lo que se puede afirmar que no existe una
relacin entre las variables estudiadas o que las mismas son independientes entre si (Nivel
socioeconmico y la presencia de la enfermedad).
Nota: si se da el caso de la aceptacin de la hiptesis alterna, esto pudiera deberse a que la mayor
frecuencia, incidencia o presencia de la enfermedad diarreica se observa en la condicin
socioeconmica baja; a su vez, la mayor frecuencia observada en nios sanos se presenta en el
nivel socioeconmico alto. Estas diferencias son significativas. Esta hiptesis alterna (Ha o H1) es la
que posee una mayor diferencia de la presencia de la enfermedad entre las clases sociales.
Nivel de significacin: ( = 0,05).
Nota: debemos recordar que alfa () es la probabilidad de rechazar la hiptesis nula (Ho), siendo
esta verdadera, tambin conocido como la probabilidad de cometer el error de tipo alfa (), falso
positivo o error de tipo 1. Dicho de otro modo, se afirma la existencia de una diferencia entre las
frecuencias observada y esperada cuando en realidad no existe.
Zona de rechazo.
2

Si el valor de X calculado es mayor que el valor de X tabla (para = 0,05 y un # de gl


establecidos) se acepta Ha y se rechaza Ho (
).
2

Si el valor de probabilidad de X calculado es numricamente menor que 0,05 (como


0,04/0,03/0,005, etc.) para el # de grados de libertad prefijados, se acepta la Ha.
Dicho de otro modo:
a)
b)

Si el valor de X tabla es superior al valor de X calculado, se acepta o no se rechaza Ho.


2
2
Si el valor de X tabla es menor al valor de X calculado, se rechaza Ho y se acepta Ha.

Psicologa

Pgina 19

Prof. Ren Castro


c)

Psicoestadstica

UBA

Dicho de otro modo, para todo valor de probabilidad de X2 calculado que sea igual o
menor que 0,05, se acepta Ha y se rechaza Ho (los paquetes estadsticos SPSS, R,
Statgraphics, etc. presentan los resultados de esta forma). Si la probabilidad tiene un valor
numricamente alto (mayores que 0,05, como 0,06/0,07/0,1, etc.) se considera que la
desviacin es debida al azar y que los datos respaldan la Ho por lo que se rechaza Ha. Si
la
probabilidad
es
numricamente
baja
(menores
que
0,05,
como
0,04/0,03/0,02/0,01/0,0005, etc.), la desviacin no es debida al azar y que los datos
respaldan la Ha.

Grfica de la zona de aceptacin y rechazo de Ho.

Si el del X2 calculado es numricamente mayor a 0,05


(0,06/0,07/0,8), se acepta Ho.

Si el del X2 calculado es numricamente


menor a 0,05 (0,04/0,02/0,001), se acepta H1

Entonces tenemos que:


Tabla de contingencia (2X3) del estado de la enfermedad diarreica con grupo condicin
socioeconmica (frecuencias observadas).
Grupo segn estado de la enfermedad
Grupo segn nivel
socioeconmico

Con diarrea

Sin diarrea

MARGINAL O
SUBTOTAL

Alta
Media
Baja

15
20
60

25
32
15

40
52
75

MARGINAL O
SUBTOTAL

95

72

167
TOTAL

Aplicacin de la prueba estadstica.


Calculamos los valores de la frecuencia terica esperada para cada casilla.
Se calculan las frecuencias esperadas basndonos en la hiptesis nula, la cual afirma que: a) no
existen diferencias significativas entre las frecuencias de las variables estudiadas (nivel
socioeconmico y presencia de la enfermedad), b) las variables son independientes o no guardan
relacin entre si y c) las diferencias se deben al azar o a efectos de muestreo. En este caso, si la
hiptesis nula (Ho) es correcta y la incidencia de la enfermedad es independiente del nivel
socioeconmico, deberamos esperar a que hubiera la misma proporcin de sujetos que
contrajeron la dolencia en cualquier de los tres niveles socioeconmicos, por lo que el clculo de

Psicologa

Pgina 20

Prof. Ren Castro

Psicoestadstica

UBA

las frecuencias esperadas se realiza multiplicndose las frecuencias subtotales o marginales


comunes a una casilla y dividindose entre la sumatoria total de las frecuencias.

Agrupamos estos valores de la frecuencia esperada en una tabla:


Tabla de las frecuencias esperadas:
Grupo segn estado de la enfermedad
Con diarrea

Sin diarrea

MARGINAL O
SUBTOTAL DE LAS
FILAS

Alta

22,75

17,24

40

Media

29,58

22,42

52

Baja

42,66

32,33

75

MARGINAL O
SUBTOTAL DE LAS
COLUMNAS

95

72

167

Grupo segn nivel


socioeconmico

TOTAL
Una vez obtenidos los valores tericos, aplicamos la frmula.

Donde:
2

X = valor estadstico de ji cuadrada.


fo = frecuencia observada.
fe = frecuencia esperada.

Clculo de X :

Psicologa

Pgina 21

Prof. Ren Castro

Psicoestadstica

UBA

Tambin podemos hacer estos clculos en forma tabular:


2

Clculo de la estadstica de prueba X


socioeconmico.

Variable
Variable
nivel socio
estado
econmico enfermedad
Alta
Con diarrea

para los datos de estado enfermedad vs. nivel

Fo

fe

(fo-fe)

(fo-fe)2

(fo-fe)2/fe

15

22,75

-7,75

60,0625

2,6401

Alta

Sin diarrea

25

17,25

7,75

60,0625

3,4819

Media

Con diarrea

20

29,58

-9,58

91,7764

3,1027

Media

Sin diarrea

32

22,42

9,58

91,7764

4,0935

Baja

Con diarrea

60

42,66

17,34

300,6756

7,0482

Baja

Sin diarrea

15

32,34

-17,34

300,6756
2

9,2973

29,6637

Las diferencias entre las frecuencias se pueden observar mejor en este grfico:

Frecuencia (obs/esp) para cada nivel socioeconomico y estado


enfermedad
60
frecuencia observada

Frecuencia absoluta (FAS)

60

frecuencia esperada

50

42,66

40
29,58
30
20

22,75
15

25
20

17,25

32,34

32
22,42

15

10
0
Con diarrea

Sin diarrea

Con diarrea

Sin diarrea

Clase Alta

Clase Alta

Clase Media Clase Media

Con diarrea

Sin diarrea

Clase Baja

Clase Baja

Nivel socioeconmico y estado enfermedad


Clculo de los grados de libertad (gl).
gl = (K - 1) x (H - 1) = (2 - 1) x (3 - 1) = 2 (k = columnas y h = hileras o filas).

Psicologa

Pgina 22

Prof. Ren Castro

Psicoestadstica

UBA

Nivel de significacin: = 0,05.


2

El valor de X calculado de 29,664 con 2 grados de libertad. Este dato se compara con los de la tabla
2
de valores crticos de ji cuadrada; en la misma se puede obtener el valor de X (0,05,2) es 5,99, que
2
corresponde a la probabilidad de 0,05, lo cual significa que: a) el valor X calculado es mayor que
2
2
el valor X tabla, por lo que se puede rechazar la hiptesis nula y b) el estadstico calculado (X
calculado) tiene una probabilidad menor que 0,05 por lo que podemos rechazar la hiptesis nula.
2
Si observamos la tabla de valores crticos de X al final de la gua, el mayor valor que podemos
2
obtener de X para 2 grados de libertad es 10,597 para un nivel de significacin de 0,005. En esta
2
2
tabla, para estos grados de libertad (2), este valor de X es el ms parecido al valor de X calculado de
29,664 obtenido, y su nivel de significacin ya es menor que 0,05. En una tabla ms grande, el
2
valor crtico de ji o X cuadrada con 2 grados de libertad ms cercano al calculado es de 27,63, con
2
-7
una probabilidad igual a 0,000001 (P valor de X calculado es 3,61x10 , obtenido con DIST.CHI de
Excel). Por todo esto, podemos rechazar la hiptesis nula.
Decisin.
2

En razn de que el valor de X o ji cuadrada calculada es de 29,664 y es mayor que el valor de X


2
tabla (0,05,2) cuyo valor es de 5,99, se rechaza la Ho y se acepta la Ha. El estadstico X calculado
-7
de 29,64 con 2 grados de libertad tiene una probabilidad de 3,61x10 (DIST.CHI) y menor que
0,05, por lo que se rechaza Ho. Por lo tanto, se acepta Ha y se rechaza Ho. Todo esto se confirma
con los resultados obtenidos en paquete estadstico Statgraphics Centurin XV para este
problema:

Statgraphics Centurin XV:


Pruebas de Independencia
Prueba
Estadstico
Chi-Cuadrada

29,664

Gl

Valor-P

0,0000

El StatAdvisor
Esta tabla muestra los resultados de la prueba de hiptesis ejecutada para determinar si se
rechaza, o no, la idea de que las clasificaciones de fila y columna son independientes. Puesto que
el valor-P es menor que 0,05, se puede rechazar la hiptesis de que filas y columnas son
independientes con un nivel de confianza del 95,0%. Por lo tanto, la fila observada para un caso
particular, est relacionada con su columna.

Esto puede apreciarse en los siguientes grficos:

X tabla (0,05/2)= 5,99

Si la probabilidad del X calculado es numricamente


mayor a 0,05 (0,06/0,07/0,8), se acepta Ho.

Psicologa

-7

X calculado (3,61x10 /2)= 29,664

(valores de prob./escala aproximada)


2

Si la probabilidad del X calculado es


numricamente menor a 0,05 (0,04/0,02/0,001),
se acepta H1

Pgina 23

Prof. Ren Castro

Psicoestadstica

UBA

Interpretacin.
Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en los
tres grupos de condicin socioeconmica, por lo que ambas variables estn relacionadas o son
dependientes. La poblacin de nios de condicin socioeconmica baja muestra la frecuencia ms
alta de diarrea, con respecto a los otros grupos sociales. Estas diferencias son significativas al nivel
-7
de confianza de p menor que 3,61x10 (DIST.CHI), segn la grfica anterior.
Entre las clases socioeconmicas media y alta parece no existir diferencia alguna, lo cual se puede
2
comprobar al construir las tablas de contingencias y al ejecutar la prueba X como ejercicio e
interpretarla.
Contingencia 2 X 2; clase media y alta en oposicin a clase baja.
Grupo
Con diarrea
Clase baja + media
35
Clase baja
60
Total
95
2
X (1gl) = 29.66 p menor que 0,001

Sin diarrea
57
15
72

Total
92
75
167

Contingencia 2 X 2; clase media y alta en oposicin a clase baja.


Grupo
Con diarrea Sin diarrea
Total
Clase alta
15
25
40
Clase media
60
15
75
Total
35
57
92
2
X (1gl) = 0,008 p menor que 0,05
2

Nota: muchos investigadores consideran que la prueba X de independencia como un


2
planteamiento alternativo a la consideracin de la prueba X utilizada para evaluar diferencias
potenciales entre variables que influyen en muestras pertenecientes a determinadas poblaciones,
por lo que para una tabla de contingencias que tiene C columnas y F filas, hileras o renglones, la
2
prueba X puede generalizarse como una prueba de independencia mediante la presentacin de

Psicologa

Pgina 24

Prof. Ren Castro

Psicoestadstica

UBA

una anlisis confirmatorio ms formal basado en una hiptesis de independencia en las respuestas
conjuntas de dos variables categricas.
Segn estos autores, como prueba de independencia, las hiptesis nulas y alternativas seran:
Ho: las dos variables categricas son independientes (es decir, no hay relacin entre ellas).
H1: las dos variables categricas estn relacionadas (es decir, son dependientes entre ellas).
Segn este planteamiento, el nivel de significacin, zona de rechazo, la grfica de aceptacin y
rechazo, la aplicacin de la prueba estadstica, la frmula de los estadsticos de prueba, su
aplicacin y las reglas de decisin son las mismas, las hiptesis establecidas y las conclusiones a
las que se llegan son diferentes.
En consecuencia, por ejemplo, en el caso anterior, llegamos a la conclusin de que haba
evidencia de la existencia de diferencias significativas entre las frecuencias observadas de
enfermedad diarreica en los tres grupos de condicin socioeconmica. Desde un punto de vista
diferente, podemos llegar a la conclusin de que existe una relacin significativa o dependencia
entre la incidencia de la enfermedad diarreica y la condicin socioeconmica de los nios
estudiados.

Psicologa

Pgina 25

Prof. Ren Castro

Psicoestadstica

UBA

Prueba ji cuadrada de proporciones para tres o ms muestras


independientes
2

La prueba de ji cuadrada de proporciones (X ) es un modelo estadstico aplicable cuando en el


modelo experimental se tienen mltiples muestras (tres o ms muestras) independientes.
La razn de dicha prueba estadstica radica en que si el tamao de las muestras es pequeo
2
(menor que 5), conservar la misma eficacia que la X de Pearson con tamaos grandes de
muestra.
La frmula de esta prueba es:

Donde:
2

X = estadstica de ji cuadrada.
= proporcin promedio de que acontezca el suceso.
= proporcin promedio de que no acontezca el suceso, expresada en proporcin.
p = proporcin observada del suceso.
Ni = tamao de la muestra del subgrupo.
Pasos.
1. Elaborar una tabla de contingencias y calcular las proporciones de cada subgrupo. Determinar
las probabilidades promedio de que acontezca o no el suceso.
2. Calcular las diferencias de las probabilidades observadas con respecto a la probabilidad
2
promedio (p - ), elevarlas al cuadrado (p - ) , multiplicarlas por el tamao de la muestra del
2
subgrupo y obtener la sumatoria Ni (p - ) .
3. Calcular el recproco del producto de
y

4. Multiplicar este ltimo valor por la sumatoria calculada, que corresponde al estadstico X p.
5. Calcular los grados de libertad y el nmero de hileras -1 (H - 1).
2
6. Comparar el estadstico de ji cuadrada de proporciones en la tabla de valores crticos de X , de
modo que se obtenga la probabilidad.
7. Decidir si se acepta o rechaza la hiptesis.

Ejemplo:
Un investigador desea conocer el efecto que ejerce el ambiente fsico de sobreestimulacin en las
caractersticas estructurales del cerebro, de manera que lo propone como alternativa para mejorar
las alteraciones que la desnutricin proteicocalrica produce en el encfalo. En virtud de ello,
planea un diseo experimental con 24 ratas de la raza Wistar, a la mitad de las cuales induce a la

Psicologa

Pgina 26

Prof. Ren Castro

Psicoestadstica

UBA

desnutricin con una dieta baja en protenas. A las ratas restantes les aporta una dieta normal para
roedores. Divide estos dos subgrupos de animales en tres condiciones ambientales.

Al trmino del experimento, los animales son sacrificados y se les extrae el cerebro, para obtener el
peso hmedo. El investigador considera a la masa total como un primer indicador de los cambios
estructurales del encfalo.
En virtud de que los pesos enceflicos poseen varianzas desiguales, no se distribuyen
normalmente y los intervalos de los pesos no tienen una progresin aritmtica, el investigador
decide no utilizar una prueba paramtrica. Por ello, elige distribuir los pesos en funcin de la
mediana.
Eleccin de la prueba estadstica.
El modelo experimental tiene tres o ms grupos independientes y la variable es categrica en
escala nominal, presentando la frecuencia de los valores o de la tabulacin de nmero de casos en
2
cada clase, con un tamao de muestra por casilla mayor de 5. Por esto, se elige la prueba X de
Pearson para 3 o ms muestras independientes (vase al final de la gua: Flujogramas/Flujograma
4).
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las frecuencias observadas de las ratas, cuyos pesos se distribuyeron en
funcin de la mediana, muestran diferencias significativas entre bien nutridos y desnutridos.
Asimismo, hay diferencias en los animales aislados y estimulados.
Hiptesis nula (Ho) Las diferencias en las frecuencias en la distribucin con base en la mediana de
los pesos enceflicos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0,05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0,05, se acepta Ho y se rechaza Ha.
Aplicacin de la prueba estadstica.
Las frecuencias observadas de los pesos cerebrales distribuidos en funcin de la mediana y el
clculo de las proporciones para cada subgrupo.
Peso enceflico de 24 ratas.

Psicologa

Pgina 27

Prof. Ren Castro

Psicoestadstica

UBA

Clculo de los grados de libertad (gl).


gl = H - 1 = 6 - 1 = 5
2

El estadstico X p de 12 se compara con los valores crticos de X y se determina la probabilidad.


Se puede observar que el valor de 11.07 con cinco grados de libertad corresponde a un valor de p
igual a 0,05. El calculado es mayor que el crtico y, por lo tanto, con p menor que 0,05.
Decisin.
En razn de que el valor estadstico tiene una probabilidad menor que 0,05, cae en el nivel de
significancia, de manera que se acepta Ha y se rechaza Ho.
Interpretacin.
Existen diferencias significativas, al nivel de confianza de p menor que 0,05, entre las frecuencias
de los pesos de los cerebros distribuidos en relacin con la mediana. En los animales bien nutridos
se observan bajas frecuencias inferiores a la mediana, en oposicin a lo observado en ratas
desnutridas.
Respecto al ambiente, parece que no hay diferencias entre los aislados y los estimulados; sin
embargo, al aplicarse la prueba estadstica, los animales no contestan la pregunta planteada por la
hiptesis alterna, en el sentido de que en los estimulados y los aislados tambin existen
diferencias.

Recuerde que esto es solo una gua, incremente sus conocimientos consultando la
literatura especializada recomendada para este curso en la biblioteca de la UBA, la
disponible en las pginas especializadas en INTERNET o la que usted pueda obtener en
las bibliotecas locales.
Tambin puede ver el siguiente video: Anlisis de la relacin entre dos variables cualitativas:
Test Chi cuadrado. Mdulo 4 https://www.youtube.com/watch?v=XvPEeQAjTW8.

Psicologa

Pgina 28

Prof. Ren Castro

Psicologa

Psicoestadstica

UBA

Pgina 29

Prof. Ren Castro

Psicologa

Psicoestadstica

UBA

Pgina 30

Prof. Ren Castro

Psicologa

Psicoestadstica

UBA

Pgina 31

Prof. Ren Castro

Psicoestadstica

UBA

Valores crticos de X2
Para una combinacin particular de grados de libertad y nivel de significacin, las
entradas representan los valores crticos de X2 correspondientes a un rea de extremo
superior especificada (). Valores crticos obtenidos mediante la funcin
PRUEBA.CHI.INV de Excel. Los valores tabulados pueden emplearse en una prueba
bilateral o de dos colas, cuando la Ho indica igualdad y la Ha indica desigualdad de
proporciones, medias, etc. El X2 calculado a un alfa () dado es significativo si es igual o
mayor que el valor indicado en la tabla.

1-

Nivel de significacin (puede emplearse en una prueba bilateral o de dos colas)


GL

0,995

0,99

0,975

0,95

0,9

0,75

0,25

0,1

0,05

0,025

0,01

0,005

0,000

0,000

0,001

0,004

0,016

0,102

1,323

2,706

3,841

5,024

6,635

7,879

0,010

0,020

0,051

0,103

0,211

0,575

2,773

4,605

5,991

7,378

9,210

10,597

0,072

0,115

0,216

0,352

0,584

1,213

4,108

6,251

7,815

9,348

11,345

12,838

0,207

0,297

0,484

0,711

1,064

1,923

5,385

7,779

9,488

11,143

13,277

14,860

0,412

0,554

0,831

1,145

1,610

2,675

6,626

9,236

11,070

12,833

15,086

16,750

0,676

0,872

1,237

1,635

2,204

3,455

7,841

10,645

12,592

14,449

16,812

18,548

0,989

1,239

1,690

2,167

2,833

4,255

9,037

12,017

14,067

16,013

18,475

20,278

1,344

1,646

2,180

2,733

3,490

5,071

10,219

13,362

15,507

17,535

20,090

21,955

1,735

2,088

2,700

3,325

4,168

5,899

11,389

14,684

16,919

19,023

21,666

23,589

10

2,156

2,558

3,247

3,940

4,865

6,737

12,549

15,987

18,307

20,483

23,209

25,188

11

2,603

3,053

3,816

4,575

5,578

7,584

13,701

17,275

19,675

21,920

24,725

26,757

12

3,074

3,571

4,404

5,226

6,304

8,438

14,845

18,549

21,026

23,337

26,217

28,300

13

3,565

4,107

5,009

5,892

7,042

9,299

15,984

19,812

22,362

24,736

27,688

29,819

14

4,075

4,660

5,629

6,571

7,790

10,165

17,117

21,064

23,685

26,119

29,141

31,319

15

4,601

5,229

6,262

7,261

8,547

11,037

18,245

22,307

24,996

27,488

30,578

32,801

Psicologa

Pgina 32

Prof. Ren Castro

Psicoestadstica

UBA

Nivel de significacin (puede emplearse en una prueba bilateral o de dos colas)


GL

0,995

0,99

0,975

0,95

0,9

0,75

0,25

0,1

0,05

0,025

0,01

0,005

16

5,142

5,812

6,908

7,962

9,312

11,912

19,369

23,542

26,296

28,845

32,000

34,267

17

5,697

6,408

7,564

8,672

10,085

12,792

20,489

24,769

27,587

30,191

33,409

35,718

18

6,265

7,015

8,231

9,390

10,865

13,675

21,605

25,989

28,869

31,526

34,805

37,156

19

6,844

7,633

8,907

10,117

11,651

14,562

22,718

27,204

30,144

32,852

36,191

38,582

20

7,434

8,260

9,591

10,851

12,443

15,452

23,828

28,412

31,410

34,170

37,566

39,997

21

8,034

8,897

10,283

11,591

13,240

16,344

24,935

29,615

32,671

35,479

38,932

41,401

22

8,643

9,542

10,982

12,338

14,041

17,240

26,039

30,813

33,924

36,781

40,289

42,796

23

9,260

10,196

11,689

13,091

14,848

18,137

27,141

32,007

35,172

38,076

41,638

44,181

24

9,886

10,856

12,401

13,848

15,659

19,037

28,241

33,196

36,415

39,364

42,980

45,559

25

10,520

11,524

13,120

14,611

16,473

19,939

29,339

34,382

37,652

40,646

44,314

46,928

26

11,160

12,198

13,844

15,379

17,292

20,843

30,435

35,563

38,885

41,923

45,642

48,290

27

11,808

12,879

14,573

16,151

18,114

21,749

31,528

36,741

40,113

43,195

46,963

49,645

28

12,461

13,565

15,308

16,928

18,939

22,657

32,620

37,916

41,337

44,461

48,278

50,993

29

13,121

14,256

16,047

17,708

19,768

23,567

33,711

39,087

42,557

45,722

49,588

52,336

30

13,787

14,953

16,791

18,493

20,599

24,478

34,800

40,256

43,773

46,979

50,892

53,672

31

14,458

15,655

17,539

19,281

21,434

25,390

35,887

41,422

44,985

48,232

52,191

55,003

32

15,134

16,362

18,291

20,072

22,271

26,304

36,973

42,585

46,194

49,480

53,486

56,328

33

15,815

17,074

19,047

20,867

23,110

27,219

38,058

43,745

47,400

50,725

54,776

57,648

34

16,501

17,789

19,806

21,664

23,952

28,136

39,141

44,903

48,602

51,966

56,061

58,964

35

17,192

18,509

20,569

22,465

24,797

29,054

40,223

46,059

49,802

53,203

57,342

60,275

Psicologa

Pgina 33

Prof. Ren Castro

Psicoestadstica

UBA

Nivel de significacin (puede emplearse en una prueba bilateral o de dos colas)


GL

0,995

0,99

0,975

0,95

0,9

0,75

0,25

0,1

0,05

0,025

0,01

0,005

36

17,887

19,233

21,336

23,269

25,643

29,973

41,304

47,212

50,998

54,437

58,619

61,581

37

18,586

19,960

22,106

24,075

26,492

30,893

42,383

48,363

52,192

55,668

59,893

62,883

38

19,289

20,691

22,878

24,884

27,343

31,815

43,462

49,513

53,384

56,896

61,162

64,181

39

19,996

21,426

23,654

25,695

28,196

32,737

44,539

50,660

54,572

58,120

62,428

65,476

40

20,707

22,164

24,433

26,509

29,051

33,660

45,616

51,805

55,758

59,342

63,691

66,766

41

21,421

22,906

25,215

27,326

29,907

34,585

46,692

52,949

56,942

60,561

64,950

68,053

42

22,138

23,650

25,999

28,144

30,765

35,510

47,766

54,090

58,124

61,777

66,206

69,336

43

22,859

24,398

26,785

28,965

31,625

36,436

48,840

55,230

59,304

62,990

67,459

70,616

60

35,534

37,485

40,482

43,188

46,459

52,294

66,981

74,397

79,082

83,298

88,379

91,952

80

51,172

53,540

57,153

60,391

64,278

71,145

88,130

96,578

101,879

106,629

112,329

116,321

100

67,328

70,065

74,222

77,929

82,358

90,133

109,141

118,498

124,342

129,561

135,807

140,169

120

83,852

86,923

91,573

95,705

100,624

109,220

130,055

140,233

146,567

152,211

158,950

163,648

140

100,655

104,034

109,137

113,659

119,029

128,380

150,894

161,827

168,613

174,648

181,840

186,847

Regin de
aceptacin de Ho

Psicologa

Regin de rechazo de
Ho

Pgina 34

Prof. Ren Castro

Psicoestadstica

UBA

Anexo.
Tipos de Variables, escalas y funciones CHI de Excel.
a) Se denomina VARIABLE CATEGORICA o CUALITATIVA a las que describen un
atributo, propiedad o caractersticas de un sujeto, fenmeno, factor, cosa, etc. y
cuyos valores son categoras o clases excluyentes. Ejemplo: el sexo, la raza o
clasificacin tnica, la clase social, la categora laboral, participar o n en un
programa de investigacin o participacin, el tipo de tratamiento aplicado, los
distintos departamentos de una empresa, padecer o n de un determinado
sntoma, estado civil, nivel socioeconmico, color del pelo, color de los ojos, etc.
Es una variable sobre las que nicamente es posible obtener una medida en
escala de tipo nominal (u ordinal, pero con muy pocos valores). Cuando se trabaja
con este tipo de variables, los datos pueden organizarse en tablas de doble o ms
entradas en las que cada entrada representa un criterio de clasificacin o
categora (una variable categrica). Como resultado de esta clasificacin, la
frecuencia, el nmero de casos o el porcentaje de los mismos se presentan
organizadas en casillas que contienen informacin sobre la relacin existente entre
ambos criterios. A estas tablas de frecuencias se les denomina tablas de
contingencia.
b) Se denomina VARIABLE CUANTITATIVAS O NUMERICAS a aquellas cuyas
medidas posibles se pueden expresar por nmeros, las que se han obtenido por
medicin o recuento. Por ejemplo: temperatura corporal, edades, nmero de
pacientes hospitalizados, nmero de accidentes, tiempo de espera para ser
atendido en un servicio, etc.
Tipos De Variables Cuantitativas
Se denomina VARIABLE CUANTITATIVA DISCRETA a aquellas cuyas posibles
medidas son un conjunto finito o infinito numerable de valores numricos.
Por ejemplo: nmero de hijos por familia, nmero de accidentes por da, nmero de hojas
por tallo de una cierta planta, etc.
Se denomina VARIABLE CUANTITATIVA CONTINUA a aquellas cuyo valor observado
est determinado por nmeros reales, generalmente esas variables pueden tomar toda
una gama de valores dentro de la recta real.
Ejemplo: Peso de una persona, estatura; edad; presin sangunea, etc.

Psicologa

Pgina 35

Prof. Ren Castro

Psicoestadstica

UBA

Definiciones segn otra bibliografa


Tipos de variables:
Clasificacin:
Las variables pueden ser clasificadas como cuantitativas (intervalares) o cualitativas
(categricas), dependiendo si los valores presentados tienen o no un orden de magnitud
natural (cuantitativas), o simplemente un atributo no sometido a cuantificacin
(cualitativa).
Una variable es medida utilizando una escala de medicin. La eleccin de la(s) escala(s)
de medicin a utilizar depende, en primer lugar, del tipo de variable en estudio, y, adems,
del manejo estadstico a la que se someter la informacin. En trminos prcticos, existe
una correspondencia directa entre el concepto de variable y escala de medicin.
Un atributo corresponde a un valor especfico e una variable, como ser el caso de la
variable sexo, la que posee dos atributos: varn o mujer. En variables que exploran el
grado de acuerdo o desacuerdo frente a una afirmacin los atributos podran ser:
1 = muy en desacuerdo
2 = en desacuerdo
3 = indiferente
4 = de acuerdo
5 = muy de acuerdo
Dependiendo de los valores que puede tener una variable cualitativa, sta puede a su vez
ser dicotmicas (cuando slo pueden adoptar un slo valor sin jerarqua entre s; hombre mujer, positivo-negativo, presente-ausente), o bien, poli o multicotmicas ,si existe la
posibilidad de que adopten mltiples valores (edad, talla, nivel socioeconmico, grupos
sanguneos, calificacin previsional de usuarios).
1. Las variables cualitativas pueden agruparse en variables nominales u ordinales.
Hablaremos de variable nominal cuando los datos correspondan a una variable
cualitativa que se agrupa sin ninguna jerarqua entre s, como por ejemplo:
nombres de personas, de establecimientos, raza, grupos sanguneos, estado civil.
Estas variables no tienen ningn orden inherente a ellas ni un orden de jerarqua.
2. Si las categoras o valores que adopte una variable cualitativa poseen un orden,
secuencia o progresin natural esperable, hablaremos de variable ordinal, como
por ejemplo: grados de desnutricin, respuesta a un tratamiento, nivel
socioeconmico, intensidad de consumo de alcohol, das de la semana, meses del
ao, escalas de Killip o Apgar. A pesar de este orden jerrquico no es posible
obtener valoracin numrica lgica entre dos valores.
3. Las variables de tipo cuantitativo pueden a su vez ser clasificadas como continuas
o discretas. Las escalas cuantitativas son reconocidas tambin como escalas
intervalares o numricas.
Psicologa

Pgina 36

Prof. Ren Castro

Psicoestadstica

UBA

Si entre dos valores determinados existen infinitas posibilidades de valores,


hablaremos de una variable de tipo continuo. Ejemplos de este tipo de variables
son: el peso, la talla, la presin arterial o el nivel de colesterol srico. En la
prctica, salvo contadas excepciones no se dispone de mtodos de medicin
sofisticados como para poder medir exactamente los valores, por ejemplo, de talla.
En estricto rigor, la probabilidad que dos individuos tengan exactamente la misma
talla o edad es muy baja.
Si la variable a medir slo puede adoptar un slo valor numrico, entero, con
valores intermedios que carecen de sentido, hablaremos de variable cuantitativa
de tipo discreto. Son ejemplos de ellas: el nmero de hijos, de unidades vecinales
del sector, nmero de exmenes de laboratorio o de pacientes atendidos.
Tanto las variables discretas como las continuas pueden agruparse construyendo
intervalos, entre cuyos valores extremos se ubicarn las diferentes observaciones
registradas. Sin embargo, estrictamente hablando, slo las variables continuas
pueden ser objeto de categorizacin mediante intervalos.

Continuas

Cuantitativas (intervalares)
Discretas

Ej. Nmero de hijos, episodios de infeccin


urinaria
Categricas (cualitativas)
Nominales
Ordinales
-Dicotmicas : Ej vivo/muerto, sexo
Ej.Etapificacin tumores, Apgar, Killip
-Policotmicas : Ej. Grupo sanguneo, raza
Ej. Presin arterial, peso, edad, talla, IMC

Escalas de medicin para variables


Definicin de escala
Cualquier recurso para determinar la magnitud o cantidad de un objeto o hecho de cualquier
clase; instrumento para asignar un nmero o guarismo que indicar cunto hay de algo; un recurso
de medicin que provee un conjunto de normas (numeradas de acuerdo con ciertas reglas de
trabajo) con las que se puede comparar el objeto que ser medido, para asignarle un nmero o
valor matemtico que represente su magnitud. El trmino es de amplia aplicacin: una escala de
alguna clase est incluida en toda medicin o estimacin. Implcito en cada caso hay un conjunto
de reglas para asignar nmeros o valores: son estas reglas las que dan significado a las
cantidades. Los objetos pueden ser perceptuales o conceptuales.
La escala de medida de una caracterstica tiene consecuencias en la manera de presentacin
de la informacin y el resumen. La escala de medicin -grado de precisin de la medida de la
caracterstica- tambin determina los mtodos estadsticos que se usan para analizar los datos.
Por lo tanto, es importante definir las caractersticas por medir. Las escalas de medicin ms
frecuentes son las siguientes:
Escala Nominal.- No poseen propiedades cuantitativas y sirven nicamente para asignar, designar
o identificar las clases. Los datos empleados con las escalas nominales constan generalmente de
la frecuencia de los valores o de la tabulacin de nmero de casos en cada clase, segn la variable

Psicologa

Pgina 37

Prof. Ren Castro

Psicoestadstica

UBA

que se est estudiando. El nivel nominal permite mencionar similitudes y diferencias entre los
casos particulares. Los datos evaluados en una escala nominal se llaman tambin "observaciones
cualitativas", debido a que describen la cualidad, atributo o calidad de una persona o cosa
estudiada, u "observaciones categricas" porque los valores se agrupan en categoras. Por lo
regular, los datos nominales o cualitativos se describen en trminos de porcentaje o proporciones.
Para exhibir este tipo de informacin se usan con mayor frecuencia tablas de contingencia y
grficas de barras. Ejemplo: color de ojos, estado civil, sexo, etc. Usada principalmente por variables
cualitativas o categricas.
Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras
(caracterstica que define a las escalas nominales) sino que mantiene una especie de relacin
entre s. Tambin permite asignar un lugar especfico a cada objeto de un mismo conjunto, de
acuerdo con la intensidad, fuerza, etc.; presentes en el momento de la medicin. Una caracterstica
importante de la escala ordinal es el hecho de que, aunque hay orden entre las categoras, la
diferencia entre dos categoras adyacentes no es la misma en toda la extensin de la escala.
Algunas escalas consisten en calificaciones de mltiples factores que se agregan despus para
llegar a un ndice general. Usada principalmente por variables cualitativas o categricas.
Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala de
posicin", donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en
las escalas nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.
Ejemplo: nivel socioeconmico (Alto, Medio, Bajo), agresividad (intensa, promedio, baja), etc.
Escala de Intervalo.- Refleja distancias equivalentes entre los objetos y en la propia escala. Es
decir, el uso de sta escala permite indicar exactamente la separacin entre 2 puntos, lo cual, de
acuerdo al principio de isomorfismos, se traduce en la certeza de que los objetos as medidos
estn igualmente separados a la distancia o magnitud expresada en la escala, por lo que emplea
un intervalo igual y regular entre dos puntos de medida. Tambin posee un punto cero relativo,
debajo del cual la variable sigue existiendo y que es cuantitativamente distinto entre las distintas
escalas empleadas para medir un mismo fenmeno (temperatura medida en C, F, K, etc.,
tiempo medido segn diferentes civilizaciones como mayas, chinos, japoneses, calendario
gregoriano, etc., coeficiente intelectual, etc.). Usada principalmente por variables cuantitativas o
intervalares.
Escala de Razn.- Constituye el nivel ptimo de medicin, posee un cero verdadero o absoluto
como origen, tambin denominada escala de cocientes o proporciones. La existencia de un cero,
natural y absoluto, significa la posibilidad de que el objeto estudiado carezca de propiedad medida,
adems de permitir todas las operaciones aritmticas y el uso de nmeros representada
cantidades reales de la propiedad medida.
Con esto notamos que esta escala puede ser usada para medir la velocidad de respuesta de cierto
fenmenos psicolgicos, pero no de todos, pues no se puede hablar de cero inteligencia o cero
aprendizaje, etc. Usada principalmente por variables cuantitativas o intervalares. Consultas:

http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=237:descripcionn
opara&catid=53:pruebasnopara&Itemid=62

http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=239:ji-unamuestra&catid=53:pruebasnopara&Itemid=62

Psicologa

Pgina 38

Prof. Ren Castro

Psicoestadstica

UBA

http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=240:ji-masmuestras&catid=53:pruebasnopara&Itemid=62

DISTRIBUCIN CHI-CUADRADO EN EXCEL


FUNCIONES CON LA DISTRIBUCIN Y PRUEBAS X2
DISTR.CHI
Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribucin chi
cuadrado de una sola cola. La distribucin X2 est asociada a una prueba X2. Utilice la
prueba X2 para comparar los valores observados con los esperados. Por ejemplo, un
experimento gentico podra estar basado en la hiptesis de que la prxima generacin
de plantas presentar un conjunto determinado de colores. Al comparar los resultados
observados con los resultados esperados, puede decidir si su hiptesis original es vlida.
Sintaxis
DISTR.CHI(x;grados_de_libertad)
X es el valor al que desea evaluar la distribucin.
Grados_de_libertad es el nmero de grados de libertad.
Observaciones
Si uno de los argumentos no es numrico, DISTR.CHI devuelve el valor de error
#VALOR!
Si el argumento x es negativo, DISTR.CHI devuelve el valor de error #NUM!
Si el argumento grados_de_libertad no es un entero, se trunca.
Si el argumento grados_de_libertad < 1 o si grados_de_libertad 10^10,
DISTR.CHI devuelve el valor de error #NUM!
DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una variable
aleatoria de X2.
Funcin PRUEBA.CHI
Devuelve la prueba de independencia. PRUEBA.CHI devuelve el valor de la distribucin
chi cuadrado (X2) para la estadstica y los grados de libertad apropiados. Puede usar
pruebas X2 para determinar si un experimento se ajusta a los resultados hipotticos.
IMPORTANTE Esta funcin se ha sustituido por una o ms funciones nuevas que
pueden proporcionar una mayor exactitud y cuyos nombres reflejan mejor su uso. Esta
funcin sigue estando disponible para la compatibilidad con versiones anteriores de Excel.
Sin embargo, si no se requiere la compatibilidad con versiones anteriores, sera
aconsejable usar las nuevas funciones de ahora en adelante, porque describen con ms
exactitud su funcionalidad.Para obtener ms informacin sobre la nueva funcin,
consulte Funcin PRUEBA.CHICUAD.

Psicologa

Pgina 39

Prof. Ren Castro

Psicoestadstica

UBA

Sintaxis
PRUEBA.CHI (intervalo_real,intervalo_esperado)
Argumento

Descripcin

intervalo_real

El intervalo de datos que contiene las observaciones para probar los


valores esperados.

intervalo_esperado

El intervalo de datos que contiene la relacin del producto de totales de

fila y columna con el total general.


Comentarios generales

Si los argumentos tienen un nmero distinto de puntos de datos, esta funcin devuelve el valor de
error #N/A.

La prueba 2 primero calcula una estadstica 2 con la frmula:

donde:
A ij = frecuencia real en la fila i, columna j
E ij = frecuencia esperada en la fila i, columna j
r = nmero de filas
c = nmero de columnas

Un valor bajo de X es un indicador de independencia. Como puede ver en la frmula, X siempre es


positivo o 0, y es 0 slo si A ij = E ij por cada i,j.

PRUEBA.CHI devuelve la probabilidad de que un valor de la estadstica X sea al menos tan alto
como el valor calculado por la frmula anterior se pueda producir por casualidad con el supuesto de
2

independencia. Al calcular esta probabilidad, PRUEBA.CHI usa la distribucin X con un nmero


apropiado de grados de libertad, g l. Si r > 1 y c > 1, g l = (r - 1)x(c - 1). Si r = 1 y c > 1, g l = c - 1 o si
r > 1 y c = 1, g l = r - 1. r = c= 1 no se permite y se devuelve #N/A.

El uso de PRUEBA.CHI resulta muy adecuado cuando cada E ij no es demasiado pequeo. Algunos
estadsticos sugieren que cada E ij debe ser mayor o igual que 5.
Muestra
Para que el siguiente ejemplo resulte ms sencillo de comprender, puede copiar los datos en una
hoja en blanco y, a continuacin, escribir la funcin debajo de los datos. No seleccione los
encabezados de fila o columna (1, 2, 3...A, B, C...) cuando copie los datos de ejemplo en una hoja
en blanco.
Hombres (real)

Mujeres (real)

Descripcin

58

35

De acuerdo

11

25

Neutral

10

23

En desacuerdo

Hombres (esperado)

Mujeres (esperado)

Descripcin

Psicologa

Pgina 40

Prof. Ren Castro

Psicoestadstica

UBA

Hombres (real)

Mujeres (real)

Descripcin

45,35

47,65

De acuerdo

17,56

18,44

Neutral

16,09

16,91

En desacuerdo

Frmula

Descripcin (resultado)

=PRUEBA.CHI(A2:B4,A6:B8)

Estadstica 2 de los datos de la tabla es


16,16957 con 2 grados de libertad
(0,000308)

O ms resumido:
PRUEBA.CHI
Devuelve la prueba de independencia. PRUEBA.CHI devuelve el valor de la distribucin
chi cuadrado (X2) para la estadstica y los grados de libertad apropiados. Las pruebas X2
pueden utilizarse para determinar si un experimento se ajusta a los resultados tericos.
Sintaxis
PRUEBA.CHI(rango_actual;rango_esperado)
Rango_actual es el rango de datos que contiene observaciones para probar frente a
valores esperados.
Rango_esperado es el rango de datos que contiene la relacin del producto de los totales
de filas y columnas con el total global.
Observaciones
Si rango_actual y rango_esperado tienen un nmero diferente de puntos de datos,
PRUEBA.CHI devuelve el valor de error #N/A.
La prueba X2 primero calcula una estadstica X2 y despus suma las diferencias entre
los valores reales y los valores esperados. La ecuacin para esta funcin es
PRUEBA.CHI=p( X>X2 ), donde:
y donde:
Aij = frecuencia actual en la isima fila, jsima columna
Eij = frecuencia esperada en la isima fila, jsima columna
r = nmero de filas
c = nmero de columnas
PRUEBA.CHI devuelve la probabilidad para una estadstica X2 y grados de libertad, gl,
donde gl = (r - 1)(c - 1).
PRUEBA.CHI.INV
Devuelve para una probabilidad dada, de una sola cola, el valor de la variable aleatoria
siguiendo una distribucin chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...),
entonces PRUEBA.CHI.INV(probabilidad,...) = x. Utilice esta funcin para comparar los
resultados observados con los resultados esperados, a fin de decidir si la hiptesis
original es vlida.
Sintaxis
PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Psicologa

Pgina 41

Prof. Ren Castro

Psicoestadstica

UBA

Probabilidad es una probabilidad asociada con la distribucin chi cuadrado.


Grados_de_libertad es el nmero de grados de libertad.
Observaciones

Si uno de los argumentos no es numrico, PRUEBA.CHI.INV devuelve el valor de


error #VALOR!
Si probabilidad < 0 o si probabilidad > 1, PRUEBA.CHI.INV devuelve el valor de
error #NUM!
Si el argumento grados_de_libertad no es un entero, se trunca.
Si grados_de_libertad < 1 o si grados_de_libertad 10^10, PRUEBA.CHI.INV
devuelve el valor de error #NUM!

.CHI.INV usa una tcnica iterativa para calcular la funcin. Dado un valor de probabilidad,
PRUEBA.CHI.INV itera hasta que el resultado tenga una exactitud de 3x10^-7. Si
PRUEBA.CHI.INV no converge despus de 100 iteraciones, la funcin devuelve el valor
de error #N/A.
Para completar este tema, puede ver un video en YouTube: Universidad de Salamanca.
Anlisis de la relacin entre dos variables cualitativas: Test Chi cuadrado Disponible en:
https://www.youtube.com/watch?v=XvPEeQAjTW8.
Anlisis de la relacin entre dos variables cualitativas. Chi cuadrado: causas de la
significacin Mdulo 4 Disponible: https://www.youtube.com/watch?v=qAHXnbp1lHY

Psicologa

Pgina 42

Prof. Ren Castro

Psicoestadstica

UBA

Usar Statgraphics a fin de generar grficos de Chi cuadrado para la gua.

Distribuciones de Probabilidad
Distribucin: Chi-Cuadrada
Parmetros: G. L.
Dist. 1
2
Dist. 2
Dist. 3
Dist. 4
Dist. 5
El StatAdvisor
Este procedimiento permite analizar cualquiera de 45 distribuciones de probabilidad. Actualmente, se ha seleccionado la
distribucin Chi-Cuadrada. Puede crear varias grficas, calcular reas de colas y valores crticos, as como generar
nmeros aleatorios de la distribucin elegida. Pueden especificarse hasta cinco pares de parmetros pulsando el botn
secundario del ratn y seleccionando Opciones de Anlisis.

Chi-Cuadrada
Probabilidad = 0,0500001
0,6
G. L.
0,5

d en sid ad

0,4
0,3
0,2
0,1
0
0

10

12

14

16

18

20

22

24

26

28

30

Distribucin Acumulada
Distribucin: Chi-Cuadrada
rea Cola Inferior (<)
Variable Dist. 1
Dist. 2
29,664
1,0

Dist. 3

Dist. 4

Dist. 5

Densidad de Probabilidad
Variable Dist. 1
29,664
1,80932E-7

Dist. 2

Dist. 3

Dist. 4

Dist. 5

rea Cola Superior (>)


Variable Dist. 1
29,664
3,61863E-7

Dist. 2

Dist. 3

Dist. 4

Dist. 5

El StatAdvisor
Esta ventana evala la distribucin acumulada de la Distribucin Chi-Cuadrada. Calcular las reas de colas para hasta 5
valores crticos de la distribucin. Tambin calcular la probabilidad de densidad la funcin de masa. Por ejemplo, el
resultado indica que, para la primera distribucin especificada, la probabilidad de obtener un valor menor que 29,664 es

Psicologa

Pgina 43

Prof. Ren Castro

Psicoestadstica

UBA

1,0. Tambin, la probabilidad de obtener un valor mayor que 29,664 es 3,61863E-7. La altura de la funcin de densidad
de probabilidad en 29,664 es 1,80932E-7.

Leer el pdf Distribuciones de probabilidad en Ayuda Manuales en lnea de Statgraphics.


El valor de la variable en los 3 cuadros anteriores es el valor de X2 ya sea tabla o
calculado, en el caso anterior, es el X2 calculado de un ejemplo de la gua.

Psicologa

Pgina 44

Potrebbero piacerti anche