Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2
=
(FoFe)
2
Fe
El residual o diferencia entre frecuencias observadas y esperadas de cada espacio
se eleva al cuadrado, anulando los signos negativos. Para normalizar los residuos
elevados al cuadrado de cada espacios de propiedad, se divide por la frecuencia
esperada. Al sumar los resultados se obtiene el ji cuadrado emprico (X
e
2
), que
puede adoptar valores desde cero hasta infinito. Cuanto ms pequeo sea el valor
10
de ji cuadrado, ms fcil es no estar en condiciones de rechazar la hiptesis nula.
Como el valor de ji cuadrado aumenta con el tamao de la muestra, no habiendo
un lmite superior, para decidir el rechazo o no rechazo de la hiptesis nula, es
necesario compararlo con el ji cuadrado terico (X
t
2
). El ji cuadrado terico, crtico
o de tabla proviene de una distribucin estadstica que relaciona valores tericos
de ji cuadrado con sus posibilidades de ocurrencia por el slo efecto del error
muestral.
La distribucin terica de ji cuadrado permite conocer cul es el valor con el que
comparar el ji cuadrado emprico, segn los grados de libertad de la tabla y el nivel
de confianza con que se decida trabajar. Los grados de libertad de una tabla se
determinan segn la mnima cantidad de frecuencias condicionales que necesitan
conocerse para poder calcular las restantes, para frecuencias marginales dadas.
Se calcula multiplicando la cantidad de columnas menos uno por la cantidad de
filas menos uno [GL= (c-1) x (f-1)]. Por ejemplo, una tabla de dos columnas por
dos filas tiene un grado de libertad.
El nivel de confianza es el complemento del riesgo. Este ltimo es la probabilidad
de rechazar la hiptesis nula siendo esta verdadera, o lo que es lo mismo, la
probabilidad de cometer error de tipo I. El error de tipo I consiste en aceptar la
hiptesis de trabajo, cuando en realidad la relacin no existe en el universo bajo
estudio. La situacin inversa es el error de tipo II, o probabilidad de no rechazar la
hiptesis nula siendo esta falsa. En el error de tipo II se rechaza la hiptesis de
trabajo, cuando s es estadsticamente significativa. En ambas situaciones no se
trata de errores en tanto decisiones desacertadas por la impericia del investigador,
sino que son errores estadsticos, probabilidades que quienes investigan asumen
como riesgos propios de los instrumentos estadsticos que se utilizan. Por
convencin, suele trabajarse con un 95% de confianza en Ciencias Sociales, lo
cual equivale a decir que el riesgo o significacin ms habitual es de 0.05. El
clculo del error de tipo II es ms complejo porque requiere de la utilizacin de
supuestos adicionales.
Si al comparar los valores obtenidos, el ji cuadrado terico es mayor al ji cuadrado
emprico (X
t
2
> X
e
2
) la hiptesis nula no puede ser rechazada, por lo que la
hiptesis de trabajo no es aceptada. Por el contrario, si el ji cuadrado terico es
menor o igual al ji cuadrado emprico (X
t
2
X
e
2
) la hiptesis nula se rechaza y se
acepta la hiptesis de trabajo, considerando que existe una relacin
estadsticamente significativa entre las variables.
En la actualidad, los paquetes estadsticos informticos como el SPSS -Statistical
Package for the Social Sciences- adems de arrojar el valor de ji cuadrado
11
emprico para un cuadro determinado, calculan la significacin emprica o p-valor,
que indica la probabilidad de que sea cierta la hiptesis nula en la poblacin para
determinado ji cuadrado emprico. El nivel de significacin terico con el que se
compara habitualmente es 0.05 -eventualmente 0.01-, de modo tal que los niveles
de significacin emprica menores indicarn que se est en condiciones de
rechazar la hiptesis nula. La ventaja de utilizar este procedimiento operativo para
hacer la prueba de hiptesis es que se puede conocer con exactitud y sin
necesidad de consultar la tabla de la distribucin terica de ji cuadrado con qu
nivel de confianza se puede rechazar la hiptesis nula. Por ejemplo, si el p-valor
fuera de 0.007, se determina que la hiptesis nula puede rechazarse con 99.3%
de confianza.
Cuando se analiza el valor que asume ji cuadrado, ste est indicando
simplemente si la relacin supuesta entre las variables en la hiptesis de trabajo
es estadsticamente significativa o no. Con esto, se define estadsticamente el
contexto en que se trabaja con la hiptesis, de modo tal que si la asociacin entre
variables es estadsticamente significativa se puede realizar una inferencia
estadstica de la muestra al universo de estudio. Ello quiere decir que se puede
rechazar con determinado nivel de confianza que la hiptesis nula sea cierta en el
universo y que la asociacin en los casos analizados se deba solamente a errores
muestrales.
Cuando el ji cuadrado terico es mayor al ji cuadrado emprico y la hiptesis nula
no puede ser rechazada, la hiptesis de trabajo no puede ser aceptada como
estadsticamente significativa. La ausencia de significacin estadstica puede
deberse a diversos motivos, tales como el modo de construir las variables, una
insuficiente cantidad de casos, las caractersticas de la estrategia de medicin,
etc. El hecho de que no haya significacin estadstica en la relacin entre las
variables analizadas, no impide avanzar en la produccin de conocimiento y que
no pueda estarse frente a un caso de significacin terica y sociolgica. A los
fines sociolgicos, la situacin en que el ji cuadrado no asume significacin no
menoscaba la relevancia terica de una hiptesis y, en contrapartida, el hecho de
que una relacin entre variables sea estadsticamente significativa no es suficiente
por s mismo para producir conocimiento cientfico. Cabe destacar que este Test
de Hiptesis no es til para el anlisis si es tomado aisladamente de los otros
recursos con los que contamos como lo son los Coeficientes de Asociacin y la
Lectura Porcentual que veremos a continuacin.
12
Asociacin y medidas de asociacin
La asociacin es una forma de covariacin entre variables, medida a partir de
cmo se distribuyen las unidades de anlisis en los espacios de propiedades. Las
medidas de asociacin, a diferencia de las de correlacin, no operan con las
categoras o valores de las variables. Por este motivo, pueden ser utilizadas con
variables de cualquier nivel de medicin, a diferencia del coeficiente de correlacin
que requiere variables cuantitativas. Los coeficientes de asociacin (tambin
conocidos como coeficientes no paramtricos) no permiten realizar inferencias al
universo, sino que indican la fuerza de la relacin en la muestra que se analiza.
Los coeficientes de asociacin son medidas resumen de la fuerza de la asociacin
entre variables y, algunos de ellos, permiten tambin conocer la direccin. A
diferencia del ji cuadrado (que como veremos ms adelante no tiene lmite
superior de variacin, puesto que su valor depende de la cantidad de casos) los
coeficientes de asociacin son estandarizados, variando entre cero, que indica
independencia estadstica y uno, que indica asociacin perfecta
9
.
Phi () y V de Cramer (V) son coeficientes derivados de ji cuadrado, con lo cual
operan a partir de las diferencias entre frecuencias observadas y esperadas. El
primero es el resultante de dividir el valor de ji cuadrado por la cantidad de casos
[ = (
2
/ n)], de modo tal que quede un valor estandarizado entre 0 y 1.
Como en tablas de ms de dos por dos el valor de Phi puede superar la unidad, V
de Cramer incorpora un factor de correccin en su frmula para poder ser utilizado
en cuadros de cualquier cantidad de categoras. No obstante, por suponer una
definicin exigente de asociacin perfecta, V tiende a subestimar el grado de
relacin, lo cual debe ser tenido en cuenta en la interpretacin del valor de este
coeficiente, de la misma manera que, como se desarrollar, en la interpretacin de
los coeficientes rinconales debe tenerse presente que pueden asumir altos valores
por la definicin menos restrictiva de asociacin (Garca Ferrando, 1995).
Algunos coeficientes, como Tau-b (b), Q de Yule (Q) y Gamma () operan en
base a la reduccin proporcional del error. La relacin entre las variables puede
entonces tambin ser interpretada como la proporcin en que se reduce el error de
prediccin de las categoras de la variable dependiente cuando se conoce su
distribucin en las categoras de la independiente, contra el error de prediccin
9
Como veremos ms adelante en el documento, en los cuadros con un alto nmero de casos el ji
cuadrado tiende a ser significativo, una de las razones por las cuales es nodal examinar la fuerza
de la asociacin mediante los coeficientes.
13
cuando slo se conoce la distribucin univariada de la variable dependiente
(Garca Ferrando, 1995: 233; Roales Riesgo, 1999).
Algunos coeficientes pueden llevar signo positivo o negativo, de modo que varan
entre -1 y 1, pasando por 0, siendo -1 asociacin perfecta negativa y 1 asociacin
perfecta positiva. El signo indica el sentido de la relacin, el cual slo resulta
pertinente cuando se trabaja con ambas variables de nivel de medicin como
mnimo ordinal.
La eleccin del coeficiente adecuado depende del nivel de medicin de las
variables, del tipo de hiptesis y, en algunas situaciones, del tamao del cuadro.
Las variables que hemos seleccionado, las categoras de stas que hemos
definido y las relaciones que hemos establecido en nuestras hiptesis son
producto del enfoque terico a partir del cual hemos abordado el fenmeno de
estudio.
-Nivel de medicin de las variables. Si son nominales con cuadros de ms de dos
por dos se utiliza V de Cramer; si son nominales u ordinales en cuadros de dos
por dos se utiliza Phi y Q de Yule y si son ordinales en cuadros de ms de dos por
dos se utiliza Tau b y Gamma. La eleccin de Tau-b es recomendable cuando las
tablas son cuadradas, es decir, poseen el mismo nmero de filas que de
columnas.
-Tipo de hiptesis. Las hiptesis rinconales son aquellas que tienen una sola
condicin acerca del modo en que se vinculan las variables, es decir, relacionan
una categora de la variable dependiente con una categora de la variable
independiente. Son hiptesis menos exigentes, puesto que para que haya
asociacin perfecta en una tabla de dos por dos alcanza con que una sola
frecuencia sea cero. Si la hiptesis es rinconal se utiliza Q o Gamma, que son
coeficientes curvilineales. En la interpretacin de los valores de estos coeficientes,
debe tenerse presente que los mismos se basan en una definicin menos
restrictiva de asociacin perfecta, relativa a una hiptesis rinconal, que puede
cumplirse a la perfeccin poniendo una sola condicin.
Las hiptesis diagonales son ms exigentes puesto que para corroborarse, los
casos deben concentrarse en la diagonal de una tabla, y para que exista
asociacin perfecta no puede haber ningn caso en los espacios fuera de la
diagonal. Por ejemplo, si la hiptesis es diagonal se utiliza Phi, coeficiente lineal,
que pone dos condiciones para que haya asociacin perfecta en tablas de dos por
dos, por lo cual se necesitaran dos espacios de propiedad con cero casos. Para
14
hiptesis diagonales de cuadros de ms de 2x2, utilizaremos Tau b, coeficiente
lineal
10
.
-Tamao del cuadro. Q y Phi se utilizan para cuadros de dos por dos. Si los
cuadros tienen ms categoras, se utiliza Gamma en lugar de Q y Tau-b en lugar
de Phi.
COEFICIENTES DE ASOCIACIN
11
Hiptesis
Lineal Curvilineal
Tipo de
Variable
Nominal - Ms de
2x2
V de Cramer (V)
Nominal/Ordinal
- 2x2
Phi ()
Q de Yule
(Q)
Ordinal - Ms de
2x2
Tau b (b) Gamma ()
El valor que arroje un coeficiente de asociacin ha de ser interpretado segn
cunto se aproxime al 0 y al 1 (o menos 1), independencia estadstica y asociacin
perfecta positiva o negativa, respectivamente. A medida que los coeficientes
comienzan a alejarse de 0 estn expresando algn tipo de relacin entre las
variables.
Ahora bien, el valor de un coeficiente de asociacin en un anlisis determinado no
puede ser interpretado aisladamente, sino en funcin de las comparaciones que
establezca. Dichas comparaciones
12
intentarn mostrar las maneras en que
nuestra variable dependiente se encuentra afectada por diferentes variables
independientes. En este sentido, no existen valores altos, medios o bajos en los
anlisis de los coeficientes, sino que el valor que la covariacin entre las variables
adopte ser interpretado a la luz del valor que adquiera otra covariacin. Los
fenmenos que estamos analizando no se explican por la influencia de una sola
variable ni son estticos.
10
Los coeficientes de asociacin y su exigencia para los tipos de variables e hiptesis constituyen
modelos ideales. La eleccin del tipo de variable y la hiptesis propuesta depender de la teora
con la que hayamos abordado nuestro fenmeno en estudio.
11
Existen otros coeficientes de asociacin, pero estos cinco cubren las alternativas de uso
habitual.
12
Para que las comparaciones respecto a la fuerza de incidencia de distintas variables
independientes sean correctas, es necesario realizarlas con el mismo coeficiente, preferentemente
para variables nominales si hay por lo menos una de dicho nivel de medicin.
15
Tambin el conocimiento terico acumulado sobre el comportamiento del
fenmeno contribuir a determinar cun alto o bajo es el resultado, en relacin con
expectativas tericas o derivadas de la experiencia previa.
En consecuencia, el proceso de conocimiento que implica acercarnos a nuestro
fenmeno de estudio compromete el anlisis y la comparacin de un nmero
significativo de variables dadas por nuestro marco terico de anlisis. De esta
manera, la comparacin se vuelve una instancia nodal de nuestro proceso de
construccin del conocimiento y la seleccin de variables y su interpretacin
posibilita subordinar los recursos tcnicos a las decisiones terico-metodolgicas,
contribuyendo a la produccin de conocimiento tericamente relevante.
Lectura analtica de porcentajes
La lectura de tablas de contingencia permite un anlisis cuantitativo refinado,
analtico y artesanal. Los cuadros o tablas de contingencia surgen de la tabulacin
simultnea de dos o ms variables, en funcin de las hiptesis.
Una vez que se tiene una tabla con las frecuencias absolutas distribuidas en los
espacios de propiedades, es necesario calcular porcentajes para poder realizar
comparaciones vlidas con mayor facilidad. Porcentualizar es una manera de
estandarizar las frecuencias condicionales para liberarlas de los efectos de las
diferencias de los marginales y hacer comparable una parte respecto al todo
(Baranger, 1999). No obstante, es necesario saber sobre qu total de casos han
sido calculados los porcentajes, ya sea para poder reporcentualizar agrupando
categoras o, ms importante, para tener los debidos recaudos en la interpretacin
de porcentajes calculados sobre pocos casos.
Generalmente, los porcentajes pueden presentarse sin decimales o con un
decimal. La cantidad de decimales con la cual pueda trabajarse depende de la
cantidad de casos, lo cual debe tenerse en cuenta para evitar que los porcentajes
aparenten un nivel de exactitud que no pueden tener cuando se trabaja con una
muestra pequea.
Los porcentajes pueden ser calculados sobre el total (n) de una tabla, sobre los
subtotales de fila -asumiendo que se dispuso all variable dependiente- o sobre los
subtotales de columna -asumiendo que se trata de la variable independiente-.
Si se procura conocer qu porcentaje de la poblacin puede ser clasificado en dos
o ms atributos simultneamente -por ejemplo, varn y de nivel educativo alto- es
necesario calcular los porcentajes sobre el total de la tabla.
Si se busca describir perfiles de la poblacin y subpoblaciones, en ocasiones
puede ser til calcular los porcentajes de filas, es decir, aquellos calculados en el
16
sentido de la variable dependiente. Estos porcentajes slo pueden servir a los
fines descriptivos univariados de las caractersticas de distintos subgrupos. La
variable dependiente no opera como tal sino como si fuera una constante, por
ejemplo, qu porcentaje de los que tienen nivel educativo alto son varones,
brindando as una idea de la composicin interna o perfil de cierto subgrupo.
Para realizar una lectura en funcin de las hiptesis es necesario calcular los
porcentajes en el sentido de la variable independiente y leerlos comparando en el
sentido de la variable dependiente (Zeisel, 1974). De este modo, podemos
analizar la influencia de la variable independiente sobre la dependiente. Por
ejemplo, saber qu porcentaje de los varones tiene nivel educativo alto, al
comparar con el porcentaje que tienen las mujeres en dicho nivel educativo,
permite a partir de las diferencias porcentuales aproximarse a la incidencia de la
variable sexo en el nivel educativo alcanzado.
Esta distribucin porcentual bivariable pone en relacin las distribuciones
condicionales con una distribucin global de la variable dependiente. La
distribucin de la variable dependiente dentro de las categoras de la variable
independiente permite examinar las condiciones que se supone que influyen en
cmo se distribuye. La variable independiente puede ser entendida como
condicin que hace probable cierto resultado, por lo cual es necesario comparar
diferentes condiciones -categoras de la variable independiente- para resultados
equivalentes -de una misma categora de la variable dependiente-, examinando
qu le ocurre a la variable de estudio cuando se le aplica cada una de las
categoras de la variable independiente.
La lectura de un cuadro puede comenzarse por las frecuencias marginales de la
variable dependiente, que no son ms que la distribucin univariada de esa
variable, es decir, su distribucin sin tomar en cuenta las categoras de la variable
independiente. Luego, los marginales pueden ser tiles para comparar con cada
frecuencia condicional, examinando qu ocurre con la distribucin de la variable
dependiente cuando est presente la variable independiente. Si las distribuciones
de la variable dependiente en cada categora de la variable independiente son las
mismas que la distribucin univariada, en principio no habra asociacin entre las
variables.
Lo central de la lectura de cuadros bivariados es la lectura de las frecuencias
condicionales, comparando en el sentido de la variable dependiente. Segn lo que
establezca la hiptesis, se proceder a comparar el porcentaje de casos que
corresponde a una categora de la variable dependiente entre la subpoblacin de
una categora de la variable independiente, con el porcentaje de casos de otra
17
subpoblacin -delimitada por otra categora de la variable independiente- que
corresponde a la misma categora de la variable dependiente. Esta es la
comparacin bsica a partir de la cual se van introduciendo complejizaciones,
segn la cantidad de categoras que tenga el cuadro.
Cuando se trata de un cuadro de dos por dos, bastar con comparar dos
porcentajes para leer el cuadro por completo, puesto que habiendo ledo los dos
porcentajes de una categora de la variable dependiente, los de la otra categora
de la variable dependiente son complementarios. La diferencia entre los dos
porcentajes comparados ser la diferencia porcentual o psilon () que sintetiza
todo el cuadro, indicando la fuerza de la relacin. A medida que se trate de un
cuadro ms grande, se van abriendo las posibilidades de comparaciones.
Probablemente no sea necesario leer todos los porcentajes cuando haya muchas
categoras de las variables, siendo siempre la hiptesis lo que orientar la lectura,
indicando qu espacios de propiedad son los ms relevantes segn las
expectativas tericas. En los cuadros de ms de dos por dos, ya no habr una
nica diferencia porcentual sino varias y por ende ninguna de ellas sintetizar en
una nica medida la fuerza de toda la relacin.
Cabe poner de relieve que si bien la lectura porcentual permite analizar
minuciosamente un cuadro, no debe perderse de vista el panorama general del
plan de anlisis, de modo que los avances parciales en el conocimiento a partir de
la interpretacin de cada cuadro, puedan ser articulados de un modo coherente y
enfocado en dar cumplimiento a los objetivos, confrontando con los datos
producidos el conjunto de supuestos que se decidi someter a contrastacin en la
investigacin. La lectura de un cuadro no debe ser entendida como un fin en s
mismo sino como un medio para el anlisis e interpretacin de los resultados
enmarcado en un proceso terico metodolgico, evitando as miradas
fragmentadas del proceso de investigacin (Aguilar, Alonso, Kleidermacher y
Vzquez, 2013: 23).
4. Reflexiones finales
El proceso de construccin del dato finaliza al elaborarse los cuadros, a partir de
las variables que se pongan en relacin y de la forma en que sean categorizadas.
Las distintas posibilidades de agrupar y reagrupar categoras en distintos sistemas
de categoras implican variaciones en las distribuciones de casos en los espacios
de propiedades generados y, por lo tanto, en la fortaleza de las hiptesis. Al
examinar qu ha ocurrido con cada hiptesis sustantiva y los resultados de un
18
cuadro, se est en la etapa del anlisis, en que la teora y los datos se vinculan y
confrontan mediante las hiptesis.
El anlisis de relaciones entre dos variables se sirve de la prueba de hiptesis de ji
cuadrado, de los coeficientes de asociacin y de la lectura analtica de los
cuadros, en tanto herramientas que en conjunto permiten analizar y comenzar a
dar respuesta a objetivos descriptivos. La prueba de ji cuadrado, permite
establecer si existe relacin estadsticamente significativa entre las variables y
complementada por los coeficientes de asociacin, permite examinar la fuerza de
la relacin y su sentido. La naturaleza de la relacin entre variables, es decir, si se
aproxima a una forma lineal, curvilineal o irregular, slo puede ser examinada
mediante la lectura porcentual analtica al interior del cuadro. Adems, todo tipo de
situaciones intermedias, variaciones sutiles y matices respecto al modo de relacin
entre las variables pueden ser descriptos pormenorizadamente mediante la lectura
porcentual, lo cual resulta una gran ventaja para analizar artesanalmente datos
sobre fenmenos sociales, los cuales si bien presentan regularidades, conservan
cierta inestabilidad, indeterminacin e irregularidad, que tambin deben ser
analizadas.
As, todas las herramientas estadsticas presentadas, se utilizan en estrecha
relacin con la teora. En primer lugar, porque sta condiciona las hiptesis
plateadas, las variables seleccionadas, las categorizaciones realizadas y las
comparaciones establecidas. En segundo lugar, porque el anlisis e interpretacin
de los resultados obtenidos, se realiza a la luz del marco terico seleccionado y
las preguntas y objetivos que guan la investigacin.
19
5. Anexo: Ejemplo de anlisis bivariado
El uso diferencial del tiempo libre. Una aproximacin desde gnero y clase
En el marco del proyecto de investigacin Heterogeneidad de clase social:
profundizando los comportamientos de clase de las parejas
1314
, se indag
respecto del uso diferencial del tiempo libre, concebido como un aspecto del estilo
de vida de las clases sociales. Se analizaron datos cuantitativos sobre la
frecuencia y el placer que producen diferentes actividades de tiempo libre segn
clase social y segn gnero. El objetivo del trabajo fue describir el uso del tiempo
libre de varones y mujeres que trabajan, contndose con informacin sobre la
clase social. Para trabajar el concepto de clase, se utiliz el esquema de
Goldthorpe. Enfocamos al tiempo libre como una de las expresiones de los
consumos y estilos de vida de las personas, cuyas caractersticas dependen en
gran medida de la clase y el gnero.
As, se indag sobre las diferencias en torno al uso de este tiempo libre, segn
gnero y clase social, teniendo como hiptesis de trabajo que cuanto ms alta es
la clase social es mayor y ms variado el tiempo libre, y que el tiempo libre de las
mujeres es contaminado o interrumpido por responsabilidades familiares o tareas
domsticas que pueden incluso ser realizadas simultneamente a la actividad de
ocio.
A continuacin se presenta como ejemplo, el anlisis realizado para una de las
variables de inters de la investigacin que fue la frecuencia de uso de Internet
como una actividad de tiempo libre. As, la primera hiptesis de trabajo,
planteaba: Se espera una mayor frecuencia de uso en cuanto ms alta sea la
clase social.
VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal
VI: Clase Social
Nivel de medicin: Ordinal
Tamao de la Tabla: 3x4
Grados de Libertad (gl): 6
13
Proyecto UBACyT de la programacin 2010-2012, dirigido por la Dra. Gabriela Gmez Rojas,
con sede en el Instituto de Investigaciones Gino Germani de la UBA.
20
Tipo de hiptesis: Diagonal o lineal
En primer lugar se realiz la prueba de J i Cuadrado para contrastar la hiptesis
nula que planteara que no existe relacin entre la frecuencia de uso de internet y
la clase social. Se eligi trabajar con un nivel de confianza del 95% (que es lo
mismo que decir un nivel de significacin de 0.05).
Al buscar en la tabla de J i Cuadrado, el valor terico correspondiente a 0.05 de
significacin para 6 grados de libertad es de 12.592. Dado que el valor emprico de
J i cuadrado que arroja la prueba -como se observa en la tabla a continuacin
producida con el SPSS- es mayor al valor terico (regla de decisin: Xe 121,839 >
Xt 12,592), puede entonces rechazarse con un 95% de confianza la hiptesis nula
que plantea que no hay asociacin entre las variables, y por lo tanto la hiptesis
de trabajo resulta significativa estadsticamente, lo que quiere decir que en el
universo de estudio, la relacin entre las variables tambin estara ocurriendo
15
.
Por otro lado, en la tabla a continuacin tambin puede observarse que bajo la
columna Sig. Asinttica se encuentra lo que conocemos como p-valor o
significancia exacta. Dado que en este caso es prcticamente cero, podra
tambin haberse rechazado la hiptesis nula a un nivel de confianza superior al
99% (regla de decisin: = 0.05 >p valor=0.00).
Ambos mtodos siempre conducen al mismo resultado del test. Slo que el
mtodo del p-valor permite conocer la significancia exacta. Esto no implica no
definir siempre a priori cul es el valor de significancia con el que se va a
trabajar.
Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson 121,839 6 ,000
Razn de verosimili tud 133,179 6 ,000
Asoci aci n li neal por
l i neal
107,252 1 ,000
N de casos vli dos 625
Ms all de la significancia estadstica hallada, se procedi luego a analizar el
coeficiente de asociacin correspondiente para conocer la fuerza y sentido de la
15
Cabe aclarar que la prueba de J i cuadrado no mide magnitudes. La relacin es o no es
significativa para el nivel de confianza dado. No es relevante por cuanto supera el valor de J i
emprico al terico.
21
relacin. Al ser dos variables ordinales en una tabla de ms de 2 x 2, para
hiptesis diagonal o lineal el coeficiente que correspondiente es el Tau-b.
Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co Aprox. S Aprox. Sig.
Nomi nal por Nomi nal Phi ,442
,000
V de Cramer ,312
,000
Ordi nal por ordi nal Tau-b de Kendall ,391 ,028 13,119 ,000
Gamma ,639 ,043 13,119 ,000
N de casos vli dos 625
En primer lugar el signo positivo del coeficiente indica que la relacin se da en el
sentido planteado en la hiptesis, ambas variables se comportan en la misma
direccin (cuando una aumenta, la otra tambin lo hace, y viceversa).
En cuanto a la magnitud, observamos que es de 0.391. Si bien se aleja del cero
que indica la no asociacin, para poder analizar la fuerza de esta magnitud,
debemos hacerlo de modo comparativo, luego de analizar el comportamiento del
fenmeno ante otras variables independientes.
Por ltimo, realizaremos la lectura porcentual, presentada en la siguiente tabla de
contingencia, en la cual, para poder realizar correctamente la lectura, los
porcentajes fueron calculados en el sentido de la variable independiente (clase
social).
Frecuenci a de ti empo l i bre en Internet por Cl ase Entrevi stado. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Clase Entrevistado
Cl ase Entrevistado
Total
I-III:
Trabajadores
de cuel l o
bl anco
IV: Pequea
burguesa
V+VI:
Trabajadores
cal ifi cados
VII:
Trabajadores
no cal ifi cados
Frecuenci a de
activi dades de
ti empo li bre:
Pasar ti empo en
Internet
Hasta Semanal 43% 17% 7% 5% 25%
Mensual o
i nferi or
17% 12% 13% 5% 13%
Nunca
40% 71% 80%
90%
62%
Total 100% 100% 100% 100% 100%
288 146 61 130 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.
22
A partir de la lectura porcentual, podemos observar la tendencia decreciente en la
frecuencia de uso a medida que se desciende en la clase social.
La diferencia porcentual observada entre la frecuencia hasta semanal entre los
Trabajadores de Cuello Blanco (43%) y entre los Trabajadores no calificados (5%)
es de un 38%. Tambin resulta interesante que al pasar de Trabajadores de
Cuello Blanco, al segmento inmediatamente inferior Pequea Burguesa (17%)-,
la diferencia porcentual es de 25 puntos porcentuales y sta slo es de a 10
puntos entre esta ltima y los Trabajadores Calificados (17% vs. 7%).
Es decir que la herramienta de las diferencias porcentuales no limita como muchas
veces aparece el anlisis a la comparacin entre categoras extremas, sino que
justamente su riqueza consiste en poder analizar pormenorizadamente lo que
ocurre en y entre los distintos espacios de propiedades generados en la tabla de
contingencia.
De igual modo, puede analizarse que en la categora intermedia de frecuencia
mensual o inferior, el descenso ms pronunciado se observa entre las dos clases
inferiores (8 puntos porcentuales entre 13% y 5%), mantenindose en un rango
similar los porcentajes para las clases intermedias.
Al analizar el comportamiento de las clases para la categora Nunca, casi en
espejo a lo observado para la mayor frecuencia de uso, se produce un quiebre
ms marcado entre los Trabajadores de Cuello Blanco y la Pequea Burguesa.
Entre los primeros slo representan al 40%, mientras que para los segundos este
porcentaje asciende a 71%, presentando una diferencia porcentual de 31 puntos
porcentuales. Se registra una tendencia ascendente de aproximadamente 10% en
cada pasaje hacia las siguientes categoras.
La segunda hiptesis de trabajo, plantea la relacin entre la misma variable
analizada en el caso anterior, pero en funcin del gnero, dado que se espera
como ya se mencion en el planteo general, que las mujeres presentan una
frecuencia de uso mensual o inferior, o nunca, mientras que los hombres utilizan
Internet en su tiempo libre de manera semanal o con mayor frecuencia.
VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal
VI: Gnero
Nivel de medicin: Nominal
Tamao de la Tabla: 3x2
Grados de Libertad (gl): 2
23
Tipo de hiptesis: Diagonal o lineal
Al igual que lo planteado para la relacin anterior, realizamos la prueba J i
Cuadrado, para conocer cul es el contexto en el que nos encontramos
(significacin estadstica o no). En este caso, al comparar el valor del Xe=0.937
contra el terico Xt=5.991 correspondiente a 95% de confianza y 2 grados de
libertad-, concluimos que no puede rechazarse la hiptesis nula que plantea que
no hay relacin entre el gnero y el uso de internet en el tiempo libre, por lo cual
no podemos descartar la independencia estadstica a nivel poblacional. Si
rechazramos la hiptesis nula correramos un riesgo del 62,6% de equivocarnos
al tomar esa decisin, como indica el p-valor, (nivel de confianza de 41,4%), por lo
cual al superar el nivel de riesgo o significancia establecido en este caso (5%).
Vemos nuevamente que por el mtodo del p-valor, tampoco podemos rechazar la
hiptesis nula y por tanto, aceptar la de trabajo-, para el nivel de confianza
establecido.
Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson ,937 2 ,626
Razn de verosimili tud ,942 2 ,625
Asoci aci n li neal por
l i neal
,181
1 ,670
N de casos vli dos 625
Igualmente, dado que la independencia estadstica no implica que la relacin no
pueda ser relevante tericamente, se procedi con el anlisis de fuerza y sentido a
travs del coeficiente de asociacin V de Cramer, correspondiente al cuadro e
hiptesis planteado (ordinal/nominal, ms de 2x2, hiptesis diagonal). En este
caso, al ser una de las variables de nivel de medicin nominal, el signo del
coeficiente no nos brinda informacin respecto del sentido de la relacin (dado que
no hay una necesariedad lgica en el orden de las categoras en la tabla). Esto lo
analizaremos a partir de la lectura porcentual.
Como se mencion, luego se compararn los coeficientes de las distintas
relaciones para poder dimensionar la fuerza. En este caso podemos adelantar que
por el valor del V de Cramer de 0.39, matemticamente muy prximo al valor cero
se encuentra muy cerca de la independencia estadstica.
24
Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co Aprox. S
Aprox. Sig.
Nomi nal por Nomi nal Phi ,039
,626
V de Cramer ,039
,626
Ordi nal por ordi nal Tau-b de Kendall -,012 ,039 -,316 ,752
Gamma -,024 ,076 -,316 ,752
N de casos vli dos 625
Por ltimo, el anlisis de porcentajes, nos muestra que un cuarto de la muestra
presenta una alta frecuencia de uso de internet, y esta proporcin prcticamente
se mantiene en el mismo nivel en ambos grupos (24% entre los hombres y 27%
entre las mujeres), con una diferencia slo de 3% entre ellos. Al analizar lo que
ocurre con la categora nunca, la diferencia entre hombres y mujeres, es an
menor, slo del 1%, siguiendo ambos grupos una distribucin prcticamente
idntica a la del total de la muestra. Estas diferencias porcentuales prximas a 0%,
nos indican tambin, en lnea a lo observado en la prueba de ji cuadrado y al valor
del coeficiente V de Cramer, que no habra relacin entre estas variables. El
comportamiento de la variable dependiente, no se modifica ante los distintos
gneros.
Frecuenci a de ti empo l i bre en Internet por Gnero. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Gnero
Gnero
Total Hombre Mujer
Frecuenci a de acti vi dades
de ti empo li bre: Pasar
ti empo en Internet
Hasta Semanal 24% 27% 25%
Mensual o i nferi or 14% 12% 13%
Nunca 62% 61% 62%
Total 100% 100% 100%
387 238 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.
Al avanzar en el anlisis, y al observar que en este caso el gnero no resultaba
una variable relevante para el caso del uso de Internet en el tiempo libre, se
plantea desde los distintos abordajes tericos sobre Tecnologas de Informacin y
Comunicacin (TICs), que para este tipo de consumo cultural/uso del tiempo libre,
la franja etaria resulta una variable relevante a considerar.
25
Es por esto que se plante una tercera hiptesis que plantea que la frecuencia
de uso de internet est influida por la edad de manera tal que entre los ms
jvenes la frecuencia es mayor que entre los mayores.
VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal
VI: Tramo de Edad
Nivel de medicin: Intervalar
Tamao de la Tabla: 3x4
Grados de Libertad (gl): 6
Tipo de hiptesis: Diagonal o lineal
Siguiendo la misma secuencia que para las relaciones anteriores, se realiz la
prueba de J i Cuadrado, definida a un 95% de confianza. Al igual que en el primer
caso, el tamao de la tabla define 6 grados de libertad, el valor de J i emprico
(17.654) supera al terico, 12.592. Haciendo el anlisis a partir del p-valor,
comprobamos que puede rechazarse la hiptesis nula con una confianza del
99.993%, por lo cual podemos descartar para ese nivel la independencia
estadstica.
Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson 17,654 6 ,007
Razn de verosimili tud 19,064 6 ,004
Asoci aci n li neal por
l i neal
10,074
1 ,002
N de casos vli dos 625
El coeficiente adecuado para el nivel de medicin de las variables, el tipo de
hiptesis y el tamao de la tabla es el Tau-b, que en este caso confirma el sentido
positivo planteado en la hiptesis y tiene un valor de 0.118.
Si bien como se mencion el anlisis de correlacin es la tcnica especfica para
variables de nivel de medicin intervalar, y tambin existen otras tcnicas como el
anlisis de varianza (ANOVA) para las relaciones entre variables categricas e
intervalares, las variables intervalares agrupadas, al utilizarse en tablas de
contingencia, tambin pueden ser analizadas con anlisis de asociacin.
26
Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co
a
Aprox. S
b
Aprox. Sig.
Nomi nal por Nomi nal Phi ,168
,007
V de Cramer ,119
,007
Ordi nal por ordi nal Tau-b de Kendall ,118 ,035 3,381 ,001
Gamma ,192 ,056 3,381 ,001
N de casos vli dos 625
Finalmente, al realizar la lectura porcentual, se destaca entre los del tramo de
edad superior una mayor proporcin de quienes nunca usan, alcanzando un 79%,
con una diferencia porcentual de 19% contra la categora inmediatamente inferior,
y alcanzando los 24 puntos porcentuales de diferencia al comprar con los ms
jvenes.
Al analizar la frecuencia de uso hasta semanal, y mensual o menos, se observan
comportamientos similares entre los tres primeros tramos, producindose el
descenso marcado tambin al pasar a la categora de 55 a 69 aos, entre quienes
solo un 16% presenta frecuencia semanal o mayor, con una diferencia de 9% en
comparacin con los de 40 a 54 aos, y de 14 puntos con respecto a los ms
jvenes.
Frecuenci a de ti empo l i bre en Internet por Tramos de Edad. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Tramos de Edad
Tramos de Edad
Total
20 a 29
aos
30 a 39
aos
40 a 54
aos
55 a 69
aos
Frecuenci a de
activi dades de
ti empo li bre: Pasar
ti empo en Internet
Hasta Semanal 30% 29% 25% 16% 25%
Mensual o
i nferi or
15% 14% 15% 5% 13%
Nunca 55% 57% 60% 79% 62%
Total 100% 100% 100% 100% 100%
82 185 246 112 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.
En conclusin, podemos decir que la variable que presenta mayor fuerza de
asociacin con la frecuencia de uso de internet en el tiempo libre, es la clase. Su
27
Tau-b era de 0.39 mientras que para edad este coeficiente es inferior (0.118). En
estos casos en particular, los coeficientes fueron directamente comparados dado
que coincidan por el tipo de hiptesis, el tamao de los cuadros y el tipo de
variables con el que se trabajo. Sin embargo, para la variable independiente sexo,
el coeficiente que habamos utilizado fue V de Cramer. Para comparar la fuerza de
sta variable independiente en relacin a las otras con las que hemos trabajado
(Edad y Clase Social) es necesario seleccionar un tipo de coeficiente que sea
aplicable a las tres hiptesis planteadas. En dicho caso deberamos realizar una
comparacin a partir de V de Cramer por tener un menor nivel de exigencia. Bajo
estas condiciones el coeficiente asume un valor de 0.312 para la variable
independiente clase social, 0.039 para la variable independiente sexo y un valor
de 0.119 para la variable independiente edad. Podemos afirmar que dentro de las
variables independientes seleccionadas, la variable clase social presenta mayor
fuerza de asociacin con la frecuencia de uso de internet en el tiempo libre.
28
6. Referencias bibliogrficas
Aguilar, M., Alonso, C., Kleidermacher, G. y Vzquez, N. (2013) Elaboracin y
anlisis de distintos tipos de cuadros. Cuaderno de Ctedra N 3 (mimeo).
Baranger, D. (1999) Construccin y Anlisis de Datos. Introduccin al uso de
Tcnicas Cuantitativas en la Investigacin Social. Posadas: Editorial Universitaria
de la Universidad Nacional de Misiones.
Barton, A. H. (1973) Concepto de Espacio de atributos en Sociologa. En
Boudon, R. y Lazarsfeld, P. Metodologa de las Ciencias Sociales. Tomo I.
Barcelona: Ed. Laia.
Blalock, H. (1986) Estadstica social. Mxico: Fondo de Cultura Econmica.
Cohen, N. (1997) La teora y el mtodo en la investigacin social: el discurso y la
prctica. En Luxemburg - Revista de sociologa, ao 1 N 2. Buenos Aires.
Cohen, N. y Gmez Rojas, G. (2003): Los objetivos, el marco conceptual y la
estrategia terico-metodolgica triangulando en torno al problema de
investigacin. En Lago Martnez, G. Gmez Rojas y M. Mauro (coord.) En torno
de las metodologas: abordajes cualitativos y cuantitativos. Buenos Aires: Proa
XXI.
Garca Ferrando, M. (1995) Socioestadstica. Introduccin a la estadstica en
Sociologa. Madrid: Alianza Universidad Textos.
Marradi, A.; Archenti, N. y Piovani, J . (2010) Metodologa de las Ciencias Sociales.
Buenos Aires: Cengage Learning.
Roales Riesgo, M. (comp.) (1999) Claves de la Estadstica Descriptiva e
Inferencial: Anlisis Bivariado y Multivariado. Buenos Aires: Centro de Estudiantes
de Ciencias Sociales UBA.
Sautu, R. (2003) Todo es Teora. Objetivos y Mtodos de Investigacin. Buenos
Aires: Editorial Lumiere.
Zeisel, H. (1974) Dgalo con nmeros. Buenos Aires: Fondo de Cultura
Econmica.
29