Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ren Castro
Psicoestadstica
UBA
Pgina 1
Psicoestadstica
UBA
Psicologa
Pgina 2
Psicoestadstica
UBA
Psicologa
Pgina 3
Psicoestadstica
UBA
Donde:
2
X = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Si la hiptesis nula es cierta (no hay relacin/asociacin entre las variables, o lo que es igual, no
hay diferencia entre frecuencias observadas y esperadas, por lo que hay independencia entre las
2
variables en estudio), la funcin X sigue una distribucin de valores denominada Chi Cuadrado
2
(X ), con (f-1)*(c-1) grados de libertad, en la cual todos los valores cumplen con la condicin de la
Ho.
Por esto, si existe una coincidencia grande entre las frecuencias observadas (fo) y las
2
esperadas (fe), la X resultante ser pequea, por lo que se aceptar Ho (no se rechazar). Al
2
aumentar la discrepancia (fo fe), el valor de X aumenta, por lo que se puede rechazar la
hiptesis nula Ho.
2
Psicologa
Pgina 4
10.
11.
12.
13.
14.
15.
16.
Psicoestadstica
UBA
Un investigador quiere comparar si hay diferencias en la cantidad de cigarros fumados por causa
del estrs en personas que trabajan.
Variable categrica nominal
Cantidad de cigarrillos fumados por causa del estrs o fumar por causa del estrs.
Hiptesis de trabajo o de investigacin:
Si las personas que laboran en empresas consumen la misma cantidad de cigarrillos por causa del
estrs, entonces una muestra del personal de una agencia de ventas de autos (2013-2014) no
presentar diferencias entre la cantidad de cigarrillos fumados por causa del estrs.
Eleccin de la prueba.
El modelo experimental tiene una muestra y la variable es categrica en escala nominal,
presentando la frecuencia de los valores o de la tabulacin de nmero de casos en cada clase, se
2
elige la prueba X de Pearson para una muestra (vase al final de la gua: Flujogramas/Flujograma
1).
Planteamiento de las hiptesis estadsticas (Ho y Ha).
Modelo para estas hiptesis:
Ho: no hay diferencia entre las frecuencias o no hay dependencia entre las variables estudiadas.
La variacin es causada por el azar.
Ha: si hay diferencia entre las frecuencias o existe dependencia entre las variables estudiadas. La
variacin es causada por la posible variable independiente.
Planteamiento de las hiptesis del problema:
Hiptesis alterna (Ha). Existir diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en personas que trabajan. La hiptesis alterna tambin se conoce como H1.
Hiptesis nula (Ho). No existir diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en personas que trabajan, por lo que el consumo de cigarros por causa del estrs
se puede considerar como efecto del azar.
Psicologa
Pgina 5
Psicoestadstica
UBA
Zona de rechazo.
2
Psicologa
Pgina 6
Psicoestadstica
UBA
fo = 18
fe = 6
Tabla con los datos de las frecuencias observadas y esperadas:
Variable (escala nominal)
Tipo de
frecuencia
Total
No sabe
No fuma por
causa del estrs
Observada (fo)
18
Esperada (fe)
18
Frmula de X
Donde:
2
Clculos de X2:
Psicologa
Pgina 7
Psicoestadstica
UBA
Clculo de la estadstica de prueba X para los datos de fumar o no por causa del estrs.
Variable
Frecuencia
observada (fo)
Frecuencia
esperada (fe)
(fo-fe)
(fo-fe)2
(fo-fe)2/fe
1,5000
No sabe
-4
16
2,6667
0,1667
4,3333
El valor calculado de X se compara con los valores crticos de la tabla de valores crticos de X .
2
Se puede observar que para una probabilidad de 0,05 corresponde un valor crtico de X tabla
2
(0,05, 2) de 5.99; por lo tanto, el estadstico ji cuadrado calculado o X calculado de 4,33 es menor
2
que el valor X de la tabla, o tiene una probabilidad mayor que 0,05 (puede estar entre 0,1 y 0,25,
ambos valores superiores o mayores a 0,05, exactamente da 0,1145, obtenido mediante
DISTR.CHI de Excel).
Decisin.
2
X calculado= 4,33
Dado que la X calculada es 4,33, el cual es menor (<) que X tabla(0,05, 2) es 5,99 se acepta Ho. Por ende,
no hay diferencias significativas entre el consumo de cigarros por causa del estrs.
Psicologa
Pgina 8
Psicoestadstica
UBA
Interpretacin.
El consumo de cigarros por causa del estrs se puede considerar como efecto del azar.
Psicologa
Pgina 9
Psicoestadstica
UBA
Donde:
2
X = valor estadstico de ji cuadrada.
fo = frecuencia observada.
fe = frecuencia esperada.
Pasos:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
Psicologa
Pgina 10
Psicoestadstica
UBA
Ejemplo:
Comparar si el factor gnero influye en la cantidad de cigarros fumados por causa del estrs en
personas que trabajan.
Variables categricas nominales
Variable 1: Variable independiente: hombres y mujeres.
Variable 2: Variable dependiente: Cantidad de cigarrillos fumados debido al estrs
Eleccin de la prueba estadstica.
El modelo experimental tiene dos muestras independientes y la variable es categrica en escala
nominal, presentando la frecuencia de los valores o de la tabulacin de nmero de casos en cada
clase, con un tamao de muestra mayor de 20, lo que en este caso mejora su eficacia. Adems, es
un estudio social que comprende una poblacin pequea en el que: a) se quiere contrastar o
evaluar una hiptesis y b) no se conoce a priori la distribucin de los datos de las variables
2
estudiadas. Por esto, se elige la prueba X de Pearson para dos muestras independientes (vase
al final de la gua: Flujogramas/Flujograma 2).
Hiptesis de trabajo o de investigacin:
Modelo para estas hiptesis:
Si
Entonces
muestra
V.Ind.
V.Ind.
relacin
relacin
Si los hombres y las mujeres que laboran en empresas consumen la misma cantidad de
cigarrillo fumados por causa del estrs, entonces una muestra del personal femenino y
masculino de un departamento de cobranzas de un banco regional (2013-2014) no presentar
diferencias entre la cantidad de cigarrillos fumados por causa del estrs.
Ejemplos de relaciones entre variables:
Relacin en seccin terica
Relacin en seccin prctica
En conclusin
Gua para la redaccin de:
Caso A
la misma/igual/idntica/
semejantes/similares
no presentarn diferencias/ no
se observarn diferencias/no
se detectarn diferencias/ no
hay diferencias
Observar: se nulifican
diferencias, se niegan las
diferencias, no existen
diferencias, no hay diferencias
Ho (hiptesis nula)
Caso B
Diferente/ desigual/ dismiles/
desemejante/ dispar/ distinto
se encontrarn diferencias/
presentar diferencias/ se
observarn diferencias/ Si hay
diferencias
Observar: se afirman las
diferencias, hay diferencias,
existen diferencias, se
confirman las diferencias
H1 (hiptesis alterna)
Psicologa
Pgina 11
Psicoestadstica
UBA
Ha: si hay diferencia entre las frecuencias de la variable dependiente o existe dependencia entre
las variables estudiadas. La variacin es importante y es causada por la posible variable
independiente. (Ha: f1f2f3fn o al menos 2 frecuencias son diferentes).
Planteamiento de las hiptesis estadsticas del problema:
Hiptesis nula (Ho). No habr diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en hombres y mujeres que trabajan, ya que no hay dependencia entre las
variables estudiadas por lo que las escasas variaciones en el consumo de cigarros por causa del
estrs se puede considerar como efecto del azar.
Hiptesis alterna (Ha). Habr diferencia significativa entre la cantidad de cigarros fumados por
causa del estrs en hombres y mujeres que trabajan, ya que existe dependencia entre las variables
estudiadas por lo que las relevantes variaciones en el consumo de cigarros se puede considerar
como efecto/causa del estrs. La hiptesis alterna tambin se conoce como H1.,
Nivel de significacin: ( = 0,05).
El valor alfa () es la probabilidad de rechazar Ho, siendo Ho verdadera: (error de tipo 1 o error de
tipo alfa () o falso positivo) no aceptar la Ho, siendo verdadera. Para este valor:
2
X tabla (/GL)
Psicologa
Pgina 12
Psicoestadstica
UBA
MARGINAL O
SUBTOTAL
NO SABE
NO FUMA POR
CAUSA DEL ESTRS
HOMBRE
15
10
25
50
MUJER
20
35
60
MARGINAL O
SUBTOTAL
35
15
60
110
TOTAL
HOMBRE
MUJER
MARGINAL O
TOTAL
6,82
8,18
NO FUMA POR
CAUSA DEL ESTRS
27,27
32,73
MARGINAL O
TOTAL
50
60
15
60
110
NO SABE
Psicologa
Pgina 13
Psicoestadstica
UBA
35
30
25
25
32,73
27,27
20 19,09
20
15 15,91
15
10
8,18
6,82
10
5
0
Hombre
fuma por
estrs
Mujer no
sabe
Mujer no
fuma por
F. observada
estrs
F. esperada
Donde:
2
Clculo de X :
Calculo de la estadstica de prueba X para los datos de gnero vs. causa del fumar
Psicologa
Pgina 14
Psicoestadstica
UBA
Variable
gnero
Variable fumar
fo
fe
(fo-fe)
(fo-fe)2
(fo-fe)2/fe
HOMBRE
15
15,91
-0,91
0,8281
0,0520
HOMBRE
No sabe
10
6,82
3,18
10,1124
1,4828
25
27,27
-2,27
5,1529
0,1890
20
19,09
0,91
0,8281
0,0434
HOMBRE
MUJER
MUJER
No sabe
8,18
-3,18
10,1124
1,2362
MUJER
35
32,73
2,27
5,1529
0,1574
X2
3,1608
El valor de X calculado de 3,15 con 2 grados de libertad. Este dato se compara con los de la
2
tabla de valores crticos de ji cuadrada; en la misma se puede obtener el valor de X (0,05,2) es 5,99,
2
que corresponde a la probabilidad de 0,05, lo cual significa que: a) el valor X tabla es menor que el
2
valor X calculado, por lo que no se puede rechazar la hiptesis nula y b) el estadstico calculado
tiene una probabilidad numricamente mayor que 0,05, ya que 3,16 se encuentra entre los valores
de 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad (probablemente 0,2054,
obtenido por DIST:CHI de Excel) por lo que no podemos rechazar la hiptesis nula. Dicho de
2
otra forma, si observamos la tabla de valores crticos de X al final de la gua, los valores de X2
ms parecidos a 3,15 son: 2,773 para 0,25 de probabilidad y 4,605 para 0,1 de probabilidad para 2
2
grados de libertad. En esta tabla, para estos grados de libertad (2), estos valores de X son los ms
2
parecidos al valor de X calculado de 3,15 obtenido, y sus niveles de significacin ya son
2
numricamente mayores que 0,05. El valor de probabilidad real (P valor de X calculado es 0,2054,
obtenido con DIST.CHI de Excel) es numricamente mayor de 0,05. Por todo esto, no podemos
rechazar la hiptesis nula.
Decisin.
2
Psicologa
Pgina 15
X calculado= 3,16
Psicoestadstica
UBA
(Escala
aproximada)
2
Gl
2
Valor-P
0,2055
El StatAdvisor
Psicologa
Pgina 16
Psicoestadstica
UBA
Esta tabla muestra los resultados de la prueba de hiptesis ejecutada para determinar si se
rechaza, o no, la idea de que las clasificaciones de fila y columna son independientes (Ho). Puesto
que el valor-P es mayor o igual que 0,05, no se puede rechazar la hiptesis de que filas y
columnas son independientes (Ho) con un nivel de confianza del 95,0%. Por lo tanto, la fila
observada para un caso en particular, pudiera no tener relacin con su columna.
Puede observarse que los paquetes estadsticos no emplean el valor crtico o tabla del estadstico
2
2
calculado (X ), sino que trabajan con el P valor del estadstico calculado, que en este caso es X
para aceptar o rechazar la Ho.
Interpretacin.
El consumo de cigarros entre hombres y mujeres que trabajan, no se debe al estrs, se debe a
diversos factores ocasionado por el azar.
Psicologa
Pgina 17
Psicoestadstica
UBA
muestra
V.Ind.
relacin
V.Ind.
relacin
En conclusin
Gua para la redaccin de:
Psicologa
Caso A
No afecta/ no influye/ no altera/
la misma/igual/idntica/
semejantes/similares
no presentarn diferencias/ no
se observarn diferencias/no se
detectarn diferencias/ no hay
diferencias
Observar: se nulifican
diferencias, no hay diferencias,
no existen diferencias, se niegan
las diferencias
Ho (hiptesis nula)
Caso B
Afecta/ influye/ altera/
Diferente/ desiguales/
dismiles
se encontrarn diferencias/
presentar diferencias/ se
observarn diferencias/ Si
hay diferencias
Observar: se afirman las
diferencias, hay diferencias,
existen diferencias, se
confirman las diferencias
H1 (hiptesis alterna)
Pgina 18
Psicoestadstica
UBA
Hiptesis alterna (Ha). Existen diferencias relevantes entre las frecuencias o incidencias de la
enfermedad diarreica en nios menores de 6 aos que pertenecen a las tres clases econmicas
estudias. En otras palabras, las diferencias que se observan en las frecuencias de enfermedad
diarreica en las tres clases socioeconmicas no se deben al azar, por lo que se puede afirmar que
existe una relacin o dependencia entre las variables estudiadas (Nivel socioeconmico y la
presencia de la enfermedad).
Hiptesis nula (Ho). No existen diferencias significativas entre las frecuencias de la enfermedad
diarreica en nios menores de 6 aos que pertenecen a las tres clases econmicas estudias. En
otras palabras, las diferencias que se observan en las frecuencias de enfermedad diarreica en las
tres clases socioeconmicas se deben al azar, por lo que se puede afirmar que no existe una
relacin entre las variables estudiadas o que las mismas son independientes entre si (Nivel
socioeconmico y la presencia de la enfermedad).
Nota: si se da el caso de la aceptacin de la hiptesis alterna, esto pudiera deberse a que la mayor
frecuencia, incidencia o presencia de la enfermedad diarreica se observa en la condicin
socioeconmica baja; a su vez, la mayor frecuencia observada en nios sanos se presenta en el
nivel socioeconmico alto. Estas diferencias son significativas. Esta hiptesis alterna (Ha o H1) es la
que posee una mayor diferencia de la presencia de la enfermedad entre las clases sociales.
Nivel de significacin: ( = 0,05).
Nota: debemos recordar que alfa () es la probabilidad de rechazar la hiptesis nula (Ho), siendo
esta verdadera, tambin conocido como la probabilidad de cometer el error de tipo alfa (), falso
positivo o error de tipo 1. Dicho de otro modo, se afirma la existencia de una diferencia entre las
frecuencias observada y esperada cuando en realidad no existe.
Zona de rechazo.
2
Psicologa
Pgina 19
Psicoestadstica
UBA
Dicho de otro modo, para todo valor de probabilidad de X2 calculado que sea igual o
menor que 0,05, se acepta Ha y se rechaza Ho (los paquetes estadsticos SPSS, R,
Statgraphics, etc. presentan los resultados de esta forma). Si la probabilidad tiene un valor
numricamente alto (mayores que 0,05, como 0,06/0,07/0,1, etc.) se considera que la
desviacin es debida al azar y que los datos respaldan la Ho por lo que se rechaza Ha. Si
la
probabilidad
es
numricamente
baja
(menores
que
0,05,
como
0,04/0,03/0,02/0,01/0,0005, etc.), la desviacin no es debida al azar y que los datos
respaldan la Ha.
Con diarrea
Sin diarrea
MARGINAL O
SUBTOTAL
Alta
Media
Baja
15
20
60
25
32
15
40
52
75
MARGINAL O
SUBTOTAL
95
72
167
TOTAL
Psicologa
Pgina 20
Psicoestadstica
UBA
Sin diarrea
MARGINAL O
SUBTOTAL DE LAS
FILAS
Alta
22,75
17,24
40
Media
29,58
22,42
52
Baja
42,66
32,33
75
MARGINAL O
SUBTOTAL DE LAS
COLUMNAS
95
72
167
TOTAL
Una vez obtenidos los valores tericos, aplicamos la frmula.
Donde:
2
Clculo de X :
Psicologa
Pgina 21
Psicoestadstica
UBA
Variable
Variable
nivel socio
estado
econmico enfermedad
Alta
Con diarrea
Fo
fe
(fo-fe)
(fo-fe)2
(fo-fe)2/fe
15
22,75
-7,75
60,0625
2,6401
Alta
Sin diarrea
25
17,25
7,75
60,0625
3,4819
Media
Con diarrea
20
29,58
-9,58
91,7764
3,1027
Media
Sin diarrea
32
22,42
9,58
91,7764
4,0935
Baja
Con diarrea
60
42,66
17,34
300,6756
7,0482
Baja
Sin diarrea
15
32,34
-17,34
300,6756
2
9,2973
29,6637
Las diferencias entre las frecuencias se pueden observar mejor en este grfico:
60
frecuencia esperada
50
42,66
40
29,58
30
20
22,75
15
25
20
17,25
32,34
32
22,42
15
10
0
Con diarrea
Sin diarrea
Con diarrea
Sin diarrea
Clase Alta
Clase Alta
Con diarrea
Sin diarrea
Clase Baja
Clase Baja
Psicologa
Pgina 22
Psicoestadstica
UBA
El valor de X calculado de 29,664 con 2 grados de libertad. Este dato se compara con los de la tabla
2
de valores crticos de ji cuadrada; en la misma se puede obtener el valor de X (0,05,2) es 5,99, que
2
corresponde a la probabilidad de 0,05, lo cual significa que: a) el valor X calculado es mayor que
2
2
el valor X tabla, por lo que se puede rechazar la hiptesis nula y b) el estadstico calculado (X
calculado) tiene una probabilidad menor que 0,05 por lo que podemos rechazar la hiptesis nula.
2
Si observamos la tabla de valores crticos de X al final de la gua, el mayor valor que podemos
2
obtener de X para 2 grados de libertad es 10,597 para un nivel de significacin de 0,005. En esta
2
2
tabla, para estos grados de libertad (2), este valor de X es el ms parecido al valor de X calculado de
29,664 obtenido, y su nivel de significacin ya es menor que 0,05. En una tabla ms grande, el
2
valor crtico de ji o X cuadrada con 2 grados de libertad ms cercano al calculado es de 27,63, con
2
-7
una probabilidad igual a 0,000001 (P valor de X calculado es 3,61x10 , obtenido con DIST.CHI de
Excel). Por todo esto, podemos rechazar la hiptesis nula.
Decisin.
2
29,664
Gl
Valor-P
0,0000
El StatAdvisor
Esta tabla muestra los resultados de la prueba de hiptesis ejecutada para determinar si se
rechaza, o no, la idea de que las clasificaciones de fila y columna son independientes. Puesto que
el valor-P es menor que 0,05, se puede rechazar la hiptesis de que filas y columnas son
independientes con un nivel de confianza del 95,0%. Por lo tanto, la fila observada para un caso
particular, est relacionada con su columna.
Psicologa
-7
Pgina 23
Psicoestadstica
UBA
Interpretacin.
Existen diferencias significativas entre las frecuencias observadas de enfermedad diarreica en los
tres grupos de condicin socioeconmica, por lo que ambas variables estn relacionadas o son
dependientes. La poblacin de nios de condicin socioeconmica baja muestra la frecuencia ms
alta de diarrea, con respecto a los otros grupos sociales. Estas diferencias son significativas al nivel
-7
de confianza de p menor que 3,61x10 (DIST.CHI), segn la grfica anterior.
Entre las clases socioeconmicas media y alta parece no existir diferencia alguna, lo cual se puede
2
comprobar al construir las tablas de contingencias y al ejecutar la prueba X como ejercicio e
interpretarla.
Contingencia 2 X 2; clase media y alta en oposicin a clase baja.
Grupo
Con diarrea
Clase baja + media
35
Clase baja
60
Total
95
2
X (1gl) = 29.66 p menor que 0,001
Sin diarrea
57
15
72
Total
92
75
167
Psicologa
Pgina 24
Psicoestadstica
UBA
una anlisis confirmatorio ms formal basado en una hiptesis de independencia en las respuestas
conjuntas de dos variables categricas.
Segn estos autores, como prueba de independencia, las hiptesis nulas y alternativas seran:
Ho: las dos variables categricas son independientes (es decir, no hay relacin entre ellas).
H1: las dos variables categricas estn relacionadas (es decir, son dependientes entre ellas).
Segn este planteamiento, el nivel de significacin, zona de rechazo, la grfica de aceptacin y
rechazo, la aplicacin de la prueba estadstica, la frmula de los estadsticos de prueba, su
aplicacin y las reglas de decisin son las mismas, las hiptesis establecidas y las conclusiones a
las que se llegan son diferentes.
En consecuencia, por ejemplo, en el caso anterior, llegamos a la conclusin de que haba
evidencia de la existencia de diferencias significativas entre las frecuencias observadas de
enfermedad diarreica en los tres grupos de condicin socioeconmica. Desde un punto de vista
diferente, podemos llegar a la conclusin de que existe una relacin significativa o dependencia
entre la incidencia de la enfermedad diarreica y la condicin socioeconmica de los nios
estudiados.
Psicologa
Pgina 25
Psicoestadstica
UBA
Donde:
2
X = estadstica de ji cuadrada.
= proporcin promedio de que acontezca el suceso.
= proporcin promedio de que no acontezca el suceso, expresada en proporcin.
p = proporcin observada del suceso.
Ni = tamao de la muestra del subgrupo.
Pasos.
1. Elaborar una tabla de contingencias y calcular las proporciones de cada subgrupo. Determinar
las probabilidades promedio de que acontezca o no el suceso.
2. Calcular las diferencias de las probabilidades observadas con respecto a la probabilidad
2
promedio (p - ), elevarlas al cuadrado (p - ) , multiplicarlas por el tamao de la muestra del
2
subgrupo y obtener la sumatoria Ni (p - ) .
3. Calcular el recproco del producto de
y
4. Multiplicar este ltimo valor por la sumatoria calculada, que corresponde al estadstico X p.
5. Calcular los grados de libertad y el nmero de hileras -1 (H - 1).
2
6. Comparar el estadstico de ji cuadrada de proporciones en la tabla de valores crticos de X , de
modo que se obtenga la probabilidad.
7. Decidir si se acepta o rechaza la hiptesis.
Ejemplo:
Un investigador desea conocer el efecto que ejerce el ambiente fsico de sobreestimulacin en las
caractersticas estructurales del cerebro, de manera que lo propone como alternativa para mejorar
las alteraciones que la desnutricin proteicocalrica produce en el encfalo. En virtud de ello,
planea un diseo experimental con 24 ratas de la raza Wistar, a la mitad de las cuales induce a la
Psicologa
Pgina 26
Psicoestadstica
UBA
desnutricin con una dieta baja en protenas. A las ratas restantes les aporta una dieta normal para
roedores. Divide estos dos subgrupos de animales en tres condiciones ambientales.
Al trmino del experimento, los animales son sacrificados y se les extrae el cerebro, para obtener el
peso hmedo. El investigador considera a la masa total como un primer indicador de los cambios
estructurales del encfalo.
En virtud de que los pesos enceflicos poseen varianzas desiguales, no se distribuyen
normalmente y los intervalos de los pesos no tienen una progresin aritmtica, el investigador
decide no utilizar una prueba paramtrica. Por ello, elige distribuir los pesos en funcin de la
mediana.
Eleccin de la prueba estadstica.
El modelo experimental tiene tres o ms grupos independientes y la variable es categrica en
escala nominal, presentando la frecuencia de los valores o de la tabulacin de nmero de casos en
2
cada clase, con un tamao de muestra por casilla mayor de 5. Por esto, se elige la prueba X de
Pearson para 3 o ms muestras independientes (vase al final de la gua: Flujogramas/Flujograma
4).
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Las frecuencias observadas de las ratas, cuyos pesos se distribuyeron en
funcin de la mediana, muestran diferencias significativas entre bien nutridos y desnutridos.
Asimismo, hay diferencias en los animales aislados y estimulados.
Hiptesis nula (Ho) Las diferencias en las frecuencias en la distribucin con base en la mediana de
los pesos enceflicos se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0,05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0,05, se acepta Ho y se rechaza Ha.
Aplicacin de la prueba estadstica.
Las frecuencias observadas de los pesos cerebrales distribuidos en funcin de la mediana y el
clculo de las proporciones para cada subgrupo.
Peso enceflico de 24 ratas.
Psicologa
Pgina 27
Psicoestadstica
UBA
Recuerde que esto es solo una gua, incremente sus conocimientos consultando la
literatura especializada recomendada para este curso en la biblioteca de la UBA, la
disponible en las pginas especializadas en INTERNET o la que usted pueda obtener en
las bibliotecas locales.
Tambin puede ver el siguiente video: Anlisis de la relacin entre dos variables cualitativas:
Test Chi cuadrado. Mdulo 4 https://www.youtube.com/watch?v=XvPEeQAjTW8.
Psicologa
Pgina 28
Psicologa
Psicoestadstica
UBA
Pgina 29
Psicologa
Psicoestadstica
UBA
Pgina 30
Psicologa
Psicoestadstica
UBA
Pgina 31
Psicoestadstica
UBA
Valores crticos de X2
Para una combinacin particular de grados de libertad y nivel de significacin, las
entradas representan los valores crticos de X2 correspondientes a un rea de extremo
superior especificada (). Valores crticos obtenidos mediante la funcin
PRUEBA.CHI.INV de Excel. Los valores tabulados pueden emplearse en una prueba
bilateral o de dos colas, cuando la Ho indica igualdad y la Ha indica desigualdad de
proporciones, medias, etc. El X2 calculado a un alfa () dado es significativo si es igual o
mayor que el valor indicado en la tabla.
1-
0,995
0,99
0,975
0,95
0,9
0,75
0,25
0,1
0,05
0,025
0,01
0,005
0,000
0,000
0,001
0,004
0,016
0,102
1,323
2,706
3,841
5,024
6,635
7,879
0,010
0,020
0,051
0,103
0,211
0,575
2,773
4,605
5,991
7,378
9,210
10,597
0,072
0,115
0,216
0,352
0,584
1,213
4,108
6,251
7,815
9,348
11,345
12,838
0,207
0,297
0,484
0,711
1,064
1,923
5,385
7,779
9,488
11,143
13,277
14,860
0,412
0,554
0,831
1,145
1,610
2,675
6,626
9,236
11,070
12,833
15,086
16,750
0,676
0,872
1,237
1,635
2,204
3,455
7,841
10,645
12,592
14,449
16,812
18,548
0,989
1,239
1,690
2,167
2,833
4,255
9,037
12,017
14,067
16,013
18,475
20,278
1,344
1,646
2,180
2,733
3,490
5,071
10,219
13,362
15,507
17,535
20,090
21,955
1,735
2,088
2,700
3,325
4,168
5,899
11,389
14,684
16,919
19,023
21,666
23,589
10
2,156
2,558
3,247
3,940
4,865
6,737
12,549
15,987
18,307
20,483
23,209
25,188
11
2,603
3,053
3,816
4,575
5,578
7,584
13,701
17,275
19,675
21,920
24,725
26,757
12
3,074
3,571
4,404
5,226
6,304
8,438
14,845
18,549
21,026
23,337
26,217
28,300
13
3,565
4,107
5,009
5,892
7,042
9,299
15,984
19,812
22,362
24,736
27,688
29,819
14
4,075
4,660
5,629
6,571
7,790
10,165
17,117
21,064
23,685
26,119
29,141
31,319
15
4,601
5,229
6,262
7,261
8,547
11,037
18,245
22,307
24,996
27,488
30,578
32,801
Psicologa
Pgina 32
Psicoestadstica
UBA
0,995
0,99
0,975
0,95
0,9
0,75
0,25
0,1
0,05
0,025
0,01
0,005
16
5,142
5,812
6,908
7,962
9,312
11,912
19,369
23,542
26,296
28,845
32,000
34,267
17
5,697
6,408
7,564
8,672
10,085
12,792
20,489
24,769
27,587
30,191
33,409
35,718
18
6,265
7,015
8,231
9,390
10,865
13,675
21,605
25,989
28,869
31,526
34,805
37,156
19
6,844
7,633
8,907
10,117
11,651
14,562
22,718
27,204
30,144
32,852
36,191
38,582
20
7,434
8,260
9,591
10,851
12,443
15,452
23,828
28,412
31,410
34,170
37,566
39,997
21
8,034
8,897
10,283
11,591
13,240
16,344
24,935
29,615
32,671
35,479
38,932
41,401
22
8,643
9,542
10,982
12,338
14,041
17,240
26,039
30,813
33,924
36,781
40,289
42,796
23
9,260
10,196
11,689
13,091
14,848
18,137
27,141
32,007
35,172
38,076
41,638
44,181
24
9,886
10,856
12,401
13,848
15,659
19,037
28,241
33,196
36,415
39,364
42,980
45,559
25
10,520
11,524
13,120
14,611
16,473
19,939
29,339
34,382
37,652
40,646
44,314
46,928
26
11,160
12,198
13,844
15,379
17,292
20,843
30,435
35,563
38,885
41,923
45,642
48,290
27
11,808
12,879
14,573
16,151
18,114
21,749
31,528
36,741
40,113
43,195
46,963
49,645
28
12,461
13,565
15,308
16,928
18,939
22,657
32,620
37,916
41,337
44,461
48,278
50,993
29
13,121
14,256
16,047
17,708
19,768
23,567
33,711
39,087
42,557
45,722
49,588
52,336
30
13,787
14,953
16,791
18,493
20,599
24,478
34,800
40,256
43,773
46,979
50,892
53,672
31
14,458
15,655
17,539
19,281
21,434
25,390
35,887
41,422
44,985
48,232
52,191
55,003
32
15,134
16,362
18,291
20,072
22,271
26,304
36,973
42,585
46,194
49,480
53,486
56,328
33
15,815
17,074
19,047
20,867
23,110
27,219
38,058
43,745
47,400
50,725
54,776
57,648
34
16,501
17,789
19,806
21,664
23,952
28,136
39,141
44,903
48,602
51,966
56,061
58,964
35
17,192
18,509
20,569
22,465
24,797
29,054
40,223
46,059
49,802
53,203
57,342
60,275
Psicologa
Pgina 33
Psicoestadstica
UBA
0,995
0,99
0,975
0,95
0,9
0,75
0,25
0,1
0,05
0,025
0,01
0,005
36
17,887
19,233
21,336
23,269
25,643
29,973
41,304
47,212
50,998
54,437
58,619
61,581
37
18,586
19,960
22,106
24,075
26,492
30,893
42,383
48,363
52,192
55,668
59,893
62,883
38
19,289
20,691
22,878
24,884
27,343
31,815
43,462
49,513
53,384
56,896
61,162
64,181
39
19,996
21,426
23,654
25,695
28,196
32,737
44,539
50,660
54,572
58,120
62,428
65,476
40
20,707
22,164
24,433
26,509
29,051
33,660
45,616
51,805
55,758
59,342
63,691
66,766
41
21,421
22,906
25,215
27,326
29,907
34,585
46,692
52,949
56,942
60,561
64,950
68,053
42
22,138
23,650
25,999
28,144
30,765
35,510
47,766
54,090
58,124
61,777
66,206
69,336
43
22,859
24,398
26,785
28,965
31,625
36,436
48,840
55,230
59,304
62,990
67,459
70,616
60
35,534
37,485
40,482
43,188
46,459
52,294
66,981
74,397
79,082
83,298
88,379
91,952
80
51,172
53,540
57,153
60,391
64,278
71,145
88,130
96,578
101,879
106,629
112,329
116,321
100
67,328
70,065
74,222
77,929
82,358
90,133
109,141
118,498
124,342
129,561
135,807
140,169
120
83,852
86,923
91,573
95,705
100,624
109,220
130,055
140,233
146,567
152,211
158,950
163,648
140
100,655
104,034
109,137
113,659
119,029
128,380
150,894
161,827
168,613
174,648
181,840
186,847
Regin de
aceptacin de Ho
Psicologa
Regin de rechazo de
Ho
Pgina 34
Psicoestadstica
UBA
Anexo.
Tipos de Variables, escalas y funciones CHI de Excel.
a) Se denomina VARIABLE CATEGORICA o CUALITATIVA a las que describen un
atributo, propiedad o caractersticas de un sujeto, fenmeno, factor, cosa, etc. y
cuyos valores son categoras o clases excluyentes. Ejemplo: el sexo, la raza o
clasificacin tnica, la clase social, la categora laboral, participar o n en un
programa de investigacin o participacin, el tipo de tratamiento aplicado, los
distintos departamentos de una empresa, padecer o n de un determinado
sntoma, estado civil, nivel socioeconmico, color del pelo, color de los ojos, etc.
Es una variable sobre las que nicamente es posible obtener una medida en
escala de tipo nominal (u ordinal, pero con muy pocos valores). Cuando se trabaja
con este tipo de variables, los datos pueden organizarse en tablas de doble o ms
entradas en las que cada entrada representa un criterio de clasificacin o
categora (una variable categrica). Como resultado de esta clasificacin, la
frecuencia, el nmero de casos o el porcentaje de los mismos se presentan
organizadas en casillas que contienen informacin sobre la relacin existente entre
ambos criterios. A estas tablas de frecuencias se les denomina tablas de
contingencia.
b) Se denomina VARIABLE CUANTITATIVAS O NUMERICAS a aquellas cuyas
medidas posibles se pueden expresar por nmeros, las que se han obtenido por
medicin o recuento. Por ejemplo: temperatura corporal, edades, nmero de
pacientes hospitalizados, nmero de accidentes, tiempo de espera para ser
atendido en un servicio, etc.
Tipos De Variables Cuantitativas
Se denomina VARIABLE CUANTITATIVA DISCRETA a aquellas cuyas posibles
medidas son un conjunto finito o infinito numerable de valores numricos.
Por ejemplo: nmero de hijos por familia, nmero de accidentes por da, nmero de hojas
por tallo de una cierta planta, etc.
Se denomina VARIABLE CUANTITATIVA CONTINUA a aquellas cuyo valor observado
est determinado por nmeros reales, generalmente esas variables pueden tomar toda
una gama de valores dentro de la recta real.
Ejemplo: Peso de una persona, estatura; edad; presin sangunea, etc.
Psicologa
Pgina 35
Psicoestadstica
UBA
Pgina 36
Psicoestadstica
UBA
Continuas
Cuantitativas (intervalares)
Discretas
Psicologa
Pgina 37
Psicoestadstica
UBA
que se est estudiando. El nivel nominal permite mencionar similitudes y diferencias entre los
casos particulares. Los datos evaluados en una escala nominal se llaman tambin "observaciones
cualitativas", debido a que describen la cualidad, atributo o calidad de una persona o cosa
estudiada, u "observaciones categricas" porque los valores se agrupan en categoras. Por lo
regular, los datos nominales o cualitativos se describen en trminos de porcentaje o proporciones.
Para exhibir este tipo de informacin se usan con mayor frecuencia tablas de contingencia y
grficas de barras. Ejemplo: color de ojos, estado civil, sexo, etc. Usada principalmente por variables
cualitativas o categricas.
Escala Ordinal.- Las clases en las escalas ordinales no solo se diferencian unas de otras
(caracterstica que define a las escalas nominales) sino que mantiene una especie de relacin
entre s. Tambin permite asignar un lugar especfico a cada objeto de un mismo conjunto, de
acuerdo con la intensidad, fuerza, etc.; presentes en el momento de la medicin. Una caracterstica
importante de la escala ordinal es el hecho de que, aunque hay orden entre las categoras, la
diferencia entre dos categoras adyacentes no es la misma en toda la extensin de la escala.
Algunas escalas consisten en calificaciones de mltiples factores que se agregan despus para
llegar a un ndice general. Usada principalmente por variables cualitativas o categricas.
Debe mencionarse brevemente una clase espacial de escala ordinal llamada "escala de
posicin", donde las observaciones se clasifican de mayor a menor (o viceversa). Al igual que en
las escalas nominales, se emplean a menudo porcentajes y proporciones en escalas ordinales.
Ejemplo: nivel socioeconmico (Alto, Medio, Bajo), agresividad (intensa, promedio, baja), etc.
Escala de Intervalo.- Refleja distancias equivalentes entre los objetos y en la propia escala. Es
decir, el uso de sta escala permite indicar exactamente la separacin entre 2 puntos, lo cual, de
acuerdo al principio de isomorfismos, se traduce en la certeza de que los objetos as medidos
estn igualmente separados a la distancia o magnitud expresada en la escala, por lo que emplea
un intervalo igual y regular entre dos puntos de medida. Tambin posee un punto cero relativo,
debajo del cual la variable sigue existiendo y que es cuantitativamente distinto entre las distintas
escalas empleadas para medir un mismo fenmeno (temperatura medida en C, F, K, etc.,
tiempo medido segn diferentes civilizaciones como mayas, chinos, japoneses, calendario
gregoriano, etc., coeficiente intelectual, etc.). Usada principalmente por variables cuantitativas o
intervalares.
Escala de Razn.- Constituye el nivel ptimo de medicin, posee un cero verdadero o absoluto
como origen, tambin denominada escala de cocientes o proporciones. La existencia de un cero,
natural y absoluto, significa la posibilidad de que el objeto estudiado carezca de propiedad medida,
adems de permitir todas las operaciones aritmticas y el uso de nmeros representada
cantidades reales de la propiedad medida.
Con esto notamos que esta escala puede ser usada para medir la velocidad de respuesta de cierto
fenmenos psicolgicos, pero no de todos, pues no se puede hablar de cero inteligencia o cero
aprendizaje, etc. Usada principalmente por variables cuantitativas o intervalares. Consultas:
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=237:descripcionn
opara&catid=53:pruebasnopara&Itemid=62
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=239:ji-unamuestra&catid=53:pruebasnopara&Itemid=62
Psicologa
Pgina 38
Psicoestadstica
UBA
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=240:ji-masmuestras&catid=53:pruebasnopara&Itemid=62
Psicologa
Pgina 39
Psicoestadstica
UBA
Sintaxis
PRUEBA.CHI (intervalo_real,intervalo_esperado)
Argumento
Descripcin
intervalo_real
intervalo_esperado
Si los argumentos tienen un nmero distinto de puntos de datos, esta funcin devuelve el valor de
error #N/A.
donde:
A ij = frecuencia real en la fila i, columna j
E ij = frecuencia esperada en la fila i, columna j
r = nmero de filas
c = nmero de columnas
PRUEBA.CHI devuelve la probabilidad de que un valor de la estadstica X sea al menos tan alto
como el valor calculado por la frmula anterior se pueda producir por casualidad con el supuesto de
2
El uso de PRUEBA.CHI resulta muy adecuado cuando cada E ij no es demasiado pequeo. Algunos
estadsticos sugieren que cada E ij debe ser mayor o igual que 5.
Muestra
Para que el siguiente ejemplo resulte ms sencillo de comprender, puede copiar los datos en una
hoja en blanco y, a continuacin, escribir la funcin debajo de los datos. No seleccione los
encabezados de fila o columna (1, 2, 3...A, B, C...) cuando copie los datos de ejemplo en una hoja
en blanco.
Hombres (real)
Mujeres (real)
Descripcin
58
35
De acuerdo
11
25
Neutral
10
23
En desacuerdo
Hombres (esperado)
Mujeres (esperado)
Descripcin
Psicologa
Pgina 40
Psicoestadstica
UBA
Hombres (real)
Mujeres (real)
Descripcin
45,35
47,65
De acuerdo
17,56
18,44
Neutral
16,09
16,91
En desacuerdo
Frmula
Descripcin (resultado)
=PRUEBA.CHI(A2:B4,A6:B8)
O ms resumido:
PRUEBA.CHI
Devuelve la prueba de independencia. PRUEBA.CHI devuelve el valor de la distribucin
chi cuadrado (X2) para la estadstica y los grados de libertad apropiados. Las pruebas X2
pueden utilizarse para determinar si un experimento se ajusta a los resultados tericos.
Sintaxis
PRUEBA.CHI(rango_actual;rango_esperado)
Rango_actual es el rango de datos que contiene observaciones para probar frente a
valores esperados.
Rango_esperado es el rango de datos que contiene la relacin del producto de los totales
de filas y columnas con el total global.
Observaciones
Si rango_actual y rango_esperado tienen un nmero diferente de puntos de datos,
PRUEBA.CHI devuelve el valor de error #N/A.
La prueba X2 primero calcula una estadstica X2 y despus suma las diferencias entre
los valores reales y los valores esperados. La ecuacin para esta funcin es
PRUEBA.CHI=p( X>X2 ), donde:
y donde:
Aij = frecuencia actual en la isima fila, jsima columna
Eij = frecuencia esperada en la isima fila, jsima columna
r = nmero de filas
c = nmero de columnas
PRUEBA.CHI devuelve la probabilidad para una estadstica X2 y grados de libertad, gl,
donde gl = (r - 1)(c - 1).
PRUEBA.CHI.INV
Devuelve para una probabilidad dada, de una sola cola, el valor de la variable aleatoria
siguiendo una distribucin chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...),
entonces PRUEBA.CHI.INV(probabilidad,...) = x. Utilice esta funcin para comparar los
resultados observados con los resultados esperados, a fin de decidir si la hiptesis
original es vlida.
Sintaxis
PRUEBA.CHI.INV(probabilidad;grados_de_libertad)
Psicologa
Pgina 41
Psicoestadstica
UBA
.CHI.INV usa una tcnica iterativa para calcular la funcin. Dado un valor de probabilidad,
PRUEBA.CHI.INV itera hasta que el resultado tenga una exactitud de 3x10^-7. Si
PRUEBA.CHI.INV no converge despus de 100 iteraciones, la funcin devuelve el valor
de error #N/A.
Para completar este tema, puede ver un video en YouTube: Universidad de Salamanca.
Anlisis de la relacin entre dos variables cualitativas: Test Chi cuadrado Disponible en:
https://www.youtube.com/watch?v=XvPEeQAjTW8.
Anlisis de la relacin entre dos variables cualitativas. Chi cuadrado: causas de la
significacin Mdulo 4 Disponible: https://www.youtube.com/watch?v=qAHXnbp1lHY
Psicologa
Pgina 42
Psicoestadstica
UBA
Distribuciones de Probabilidad
Distribucin: Chi-Cuadrada
Parmetros: G. L.
Dist. 1
2
Dist. 2
Dist. 3
Dist. 4
Dist. 5
El StatAdvisor
Este procedimiento permite analizar cualquiera de 45 distribuciones de probabilidad. Actualmente, se ha seleccionado la
distribucin Chi-Cuadrada. Puede crear varias grficas, calcular reas de colas y valores crticos, as como generar
nmeros aleatorios de la distribucin elegida. Pueden especificarse hasta cinco pares de parmetros pulsando el botn
secundario del ratn y seleccionando Opciones de Anlisis.
Chi-Cuadrada
Probabilidad = 0,0500001
0,6
G. L.
0,5
d en sid ad
0,4
0,3
0,2
0,1
0
0
10
12
14
16
18
20
22
24
26
28
30
Distribucin Acumulada
Distribucin: Chi-Cuadrada
rea Cola Inferior (<)
Variable Dist. 1
Dist. 2
29,664
1,0
Dist. 3
Dist. 4
Dist. 5
Densidad de Probabilidad
Variable Dist. 1
29,664
1,80932E-7
Dist. 2
Dist. 3
Dist. 4
Dist. 5
Dist. 2
Dist. 3
Dist. 4
Dist. 5
El StatAdvisor
Esta ventana evala la distribucin acumulada de la Distribucin Chi-Cuadrada. Calcular las reas de colas para hasta 5
valores crticos de la distribucin. Tambin calcular la probabilidad de densidad la funcin de masa. Por ejemplo, el
resultado indica que, para la primera distribucin especificada, la probabilidad de obtener un valor menor que 29,664 es
Psicologa
Pgina 43
Psicoestadstica
UBA
1,0. Tambin, la probabilidad de obtener un valor mayor que 29,664 es 3,61863E-7. La altura de la funcin de densidad
de probabilidad en 29,664 es 1,80932E-7.
Psicologa
Pgina 44