Sei sulla pagina 1di 29

25 UBA Sociales

ANIVERSARIO 1988 2013 FACULTAD DE CIENCIAS SOCIALES





CARRERA DE SOCIOLOGA UBA
METODOLOGA DE LA INVESTIGACIN
CTEDRA: COHEN





CUADERNO DE CTEDRA N 5


Anlisis Descriptivo de los Datos





Autores: Rebeca Cena, Marcela Grinszpun y
Gonzalo Seid





1

Cuaderno de ctedra N 5
Anlisis Descriptivo de los Datos
Autores: Rebeca Cena, Marcela Grinszpun y Gonzalo Seid


1. Introduccin

En este Cuaderno de Ctedra se presentarn algunas nociones elementales de
anlisis descriptivo de datos producidos con un enfoque cuantitativo. Si bien en
algunos manuales de metodologa de la investigacin y estadstica social la
denominacin estadstica descriptiva alude al anlisis univariado, el presente
documento se referir al anlisis que vincula variables entre s, advirtiendo que
para cumplir cabalmente objetivos descriptivos no es suficiente con conocer la
distribucin de cada variable por separado, sino que se requiere complejizar el
anlisis introducindose en las relaciones entre variables
1
. Este Cuaderno de
Ctedra se concentrar en la etapa de anlisis cuantitativo de datos organizados
en tablas, para objetivos descriptivos, de relaciones bivariadas de cualquier nivel
de medicin.

En primer lugar, se presentar un marco general del anlisis descriptivo en
investigaciones con abordajes cuantitativos, de modo tal de situar el tema de este
trabajo en el proceso general de investigacin social. En los siguientes apartados
se presentarn la prueba de hiptesis de ji cuadrado, los coeficientes de
asociacin y la lectura de porcentajes, en tanto herramientas cuyo uso conjunto
permite aprovechar su complementariedad.

El Cuaderno de Ctedra N 3 Elaboracin y anlisis de distintos tipos de cuadros
profundiza el proceso de elaboracin e interpretacin de cuadros, por lo cual se
recomienda su lectura previa. El Cuaderno N 1 La aplicacin de tcnicas
multivariadas en Ciencias Sociales avanza sobre el anlisis de ms de dos
variables simultneamente, desarrollando contenidos necesarios para comprender
cmo extender al anlisis multivariado las herramientas desarrolladas en el
presente cuaderno.

En el anexo del Cuaderno, se presenta el desarrollo de un ejemplo de aplicacin
de las herramientas desarrolladas a continuacin.

1
El anlisis descriptivo requiere del estudio de las relaciones entre variables, dado que el anlisis
de cada variable por separado no es suficiente a tal fin. Complementariamente con ello, el anlisis
de las relaciones entre dos variables no implica alcanzar una explicacin del fenmeno en estudio.
Para tal fin se requiere emprender un anlisis multivariado. Ver cuaderno de ctedra nmero 1.
2


2. Anlisis descriptivo de datos cuantitativos

Un proceso de produccin de conocimiento puede tener distintos tipos de
objetivos, de acuerdo con los cuales se elaborar un adecuado desarrollo
metodolgico de investigacin. Los objetivos, en tanto metas que orientan el
avance de una investigacin, permiten llevar a cabo la produccin de los datos
adecuados para intentar responder a los interrogantes que dieron origen al
proceso (Cohen y Gmez Rojas, 2003). Los objetivos de tipo descriptivo implican
que la meta consiste en llegar a representar el objeto de estudio, delineando sus
principales caractersticas, refiriendo sus componentes y dando cuenta del
comportamiento de algunos de sus atributos y relaciones ms relevantes. El
aspecto principal de la descripcin para la produccin de conocimiento cientfico
reside en poder establecer vnculos entre conceptos.

Los datos, a pesar de su origen etimolgico (del latn datum, lo dado), son
construidos siempre desde una perspectiva terica, para responder a una
determinada problemtica, mediante la aplicacin de tcnicas y procedimientos
que tambin implican supuestos tericos. Puede advertirse que expresiones tales
como recoleccin de datos poseen connotaciones que pueden contribuir al error
de pensar los datos slo en su contenido informativo, olvidando que el mismo
resulta inseparable de la elaboracin conceptual y operativa del investigador.

Una vez realizada la etapa de relevamiento, cuando se trabaja con un abordaje
cuantitativo, se elabora una matriz que clasifica cada caso segn el valor que
asume en cada variable, constituyndose una estructura tripartita de los datos
(Galtung, 1973). Esta matriz de datos contiene de manera desagregada toda la
informacin que ha sido registrada en la etapa de trabajo de campo y a partir de la
cual ser posible pasar a la etapa del anlisis de los datos. Las variables de una
matriz de datos, cabe destacar, no son sino aquellos conceptos que se ha
decidido que deban ser considerados en el relevamiento a partir de los
interrogantes, los objetivos, las hiptesis y el marco terico de la investigacin.

La matriz vuelve visible la estructura tripartita de los datos -unidades de anlisis,
variables y categoras-, lo que resulta ventajoso puesto que poniendo diferentes
referentes del mismo tipo en sus filas y la misma secuencia de propiedades en sus
columnas, permite relacionar rpida y sistemticamente un sinnmero de estados
de los mismos objetos/sujetos en distintas propiedades, controlando as si existe
una relacin cualquiera entre esas propiedades (Marradi, Archenti y Piovani,
2010: 5). Esta ventaja tiene como contracara un costo semntico, derivado del
supuesto atomista, que implica asumir que cada caso puede descomponerse en
propiedades, que los estados en una propiedad pueden separarse de su
3

detentador y que los datos con el mismo valor en la misma variable son
asimilables entre ellos (Op.cit., pp.5-6).

De cualquier manera, con la matriz por s sola no es posible avanzar en el anlisis.
Es necesario retomar los interrogantes, objetivos e hiptesis para determinar qu
es lo que ha de analizarse. Es necesario decidir cules son las variables de
estudio cuyo comportamiento merece ser observado individualmente por presentar
inters en s mismo y cules variables interesan para ser observadas en su
relacin con otras. En este ltimo caso, el hecho de que haya relaciones entre
variables que se consideren relevantes para analizar obedece a la existencia de
hiptesis, es decir, supuestos acerca de los posibles vnculos entre conceptos
susceptibles de ser confrontados con los datos.

Para comenzar a describir cuantitativamente una poblacin, pueden emplearse
anlisis univariados, es decir, del comportamiento de cada una de las variables de
inters por separado, mediante distribuciones de frecuencias absolutas, relativas y
acumuladas, grficos, medidas de tendencia central, de posicin y de dispersin,
como un primer modo de analizar y caracterizar los casos con los que contamos
en un proceso de investigacin. Por ejemplo, cuando las unidades de anlisis son
personas puede ser interesante describir la distribucin de los casos segn
variables sociodemogrficas como sexo, edad, lugar de residencia, estado civil,
mximo nivel educativo alcanzado, etc. Tambin puede ser relevante observar el
comportamiento de las variables de estudio, aquellas en las que se enfoquen las
preguntas y objetivos, y que en los anlisis bivariados frecuentemente pasarn a
ser las variables dependientes, cuya variacin se procurar comprender. El
anlisis univariado brinda, entonces, un panorama introductorio sobre cmo se
comportan los fenmenos, a partir de la descripcin de las distribuciones de cada
variable por separado. Es a partir del anlisis bivariado que se vuelve posible
describir las relaciones entre variables del fenmeno en estudio.

Cuando se decide qu es relevante observar de la relacin entre dos o ms
variables es porque se ha propuesto una hiptesis de trabajo. Si bien estas
hiptesis surgen de nuestro enfoque terico, a lo largo del proceso de
investigacin puede que surjan otras, producto del avance de nuestro
conocimiento en la problemtica. En el proceso de construccin de las tablas que
concentran nuestros datos es donde nuestras hiptesis comienzan a verse
reflejadas. Si bien su contrastacin permite avanzar en la produccin de
conocimiento, generalmente no agotan en s mismas los objetivos de
investigacin, sino que es el conjunto de estas hiptesis de trabajo, contrastadas
en las tablas que se producen, con la articulacin terica y la ilacin lgica que le
4

confieren quienes investigan, lo que puede dar respuesta a los interrogantes y
cumplir los objetivos.

Las hiptesis, constituidas por relaciones entre conceptos del marco terico,
permiten vincular este universo conceptual con los datos. Los datos son producto
de un proceso terico de construccin y slo desde la teora pueden ser
interpretados, siendo las hiptesis las mediaciones imprescindibles que expresan
lo que desde la teora se espera que ocurra con los datos producidos. En el
momento de planear el anlisis, el protagonismo lo tienen las hiptesis, que
permiten avanzar en el procesamiento para obtener las tabulaciones previstas a
fin de cumplir los objetivos y responder los interrogantes. Se deben determinar las
variables que deben ser relacionadas y, preferentemente, tener en claro de qu
modo se espera que se vinculen las categoras de las variables entre s. El tipo de
hiptesis, el nivel de medicin de las variables, los roles que cumplen las variables
en la hiptesis, la cantidad de casos con que se trabaje y la cantidad de categoras
de las variables -y su posible reagrupamiento en otros sistemas de categoras- son
todos aspectos que entran en juego en las posibilidades y restricciones de
tratamiento estadstico de los datos.

El plan de anlisis
2
implica una labor de previsin y reflexin sobre las estrategias
de anlisis y el detalle de procedimientos que deben llevarse a cabo para cumplir
los objetivos. El plan de anlisis cuantitativo contiene un plan de cuadros, esto es,
las decisiones relativas a todas las tablas que se confeccionarn, formalizando las
hiptesis que se tengan, en torno a las cuales se han de interpretar los datos
producidos. Cada tabla que se elaborar tiene su razn de ser en que hay un
supuesto terico acerca de lo que ocurrir con los datos. Si en lugar de darle
formato de procesamiento a las hiptesis se procediera observando todos los
cruces posibles de variables, esta sera una tarea no slo innecesaria y engorrosa,
sino ante todo carente de relevancia terica, que tendra como resultado datos
desconectados de la teora, que por s solos no pueden constituir un avance en la
produccin de conocimiento cientfico.

Una vez que se ha procesado y tabulado los datos segn el plan de anlisis, se
est en condiciones de avanzar en el anlisis para cumplir los objetivos. La
produccin de evidencia emprica es una condicin necesaria pero no suficiente
para llevar a cabo una investigacin; los datos construidos u obtenidos deben ser
2
El plan de anlisis expresa aquellos supuestos que nos hemos planteado respecto a las maneras
en que las variables van a comportarse en funcin de las vinculaciones que establezcamos a partir
de cmo esperamos que se conecten sus categoras. Esto es, en funcin de las hiptesis de
trabajo que nos hayamos propuesto tendremos como resultado un determinado plan de anlisis
que expresar luego la manera en que se presentarn en los cuadros nuestras variables.
5


analizados a la luz de la teora que gua y da sustento al estudio (Sautu, 2010:
128). Tanto la produccin de datos como las decisiones relativas al anlisis deben
entenderse en el marco de lo que constituye una estrategia terico-metodolgica
de contrastacin del universo de conceptos con el fenmeno de estudio, para la
resolucin de los problemas de investigacin que se plantean desde una
perspectiva terica con determinado estado de conocimiento acumulado (Cohen,
1997).

Cuando se trabaja con abordajes cuantitativos, se utilizan habitualmente
herramientas estadsticas para el anlisis, pero es necesario no asimilar por
completo anlisis cuantitativo y anlisis estadstico. No hay nada ms tcnico (en
el sentido de conocimiento objetivado, impersonal, basado en procedimientos
normados, recurrentemente aplicables y ampliamente aceptados) en la
investigacin estndar que sus herramientas de anlisis (estadstico) () Esto no
significa que las tcnicas estadsticas resuelvan por s solas los mltiples y
complejos aspectos que encierra la mediacin entre un conjunto de informaciones
empricamente construidas y algn tipo de interpretacin de stas (Marradi,
Archenti y Piovani, 2010: 264). En el mismo sentido, Blalock (1986) recuerda que
la estadstica no comprende problemas como los de medicin, sino que las
consideraciones estadsticas intervienen en decisiones relativas a la construccin
de la muestra y a la manipulacin de cifras, dando por supuesto el cumplimiento
de requisitos en la medicin. El hecho de que la estadstica slo intervenga en
algunas decisiones tcnicas del muestreo y anlisis no debe entenderse como si
el investigador pudiera llevar a cabo su trabajo sin conocimiento de estadstica y
delegar en un especialista el anlisis estadstico, sino que los problemas del
anlisis han de anticiparse, influyendo las consideraciones estadsticas a lo largo
de todo el proceso de investigacin. Teora, metodologa y tcnicas deben
articularse reflexivamente, atendiendo a la coherencia y ejerciendo vigilancia
epistemolgica.

El clsico concepto de espacio de propiedades, desarrollado por Barton (1973),
resulta elemental para aprehender los fundamentos de la metodologa cuantitativa
y el recurso a las tcnicas estadsticas. Pensar en trminos de un espacio de
propiedades significa que las celdas que devienen de la combinacin de dos o
ms atributos pueden comprenderse de manera anloga a los puntos establecidos
a partir de un sistema de coordenadas. Cada espacio de propiedades clasifica un
subconjunto de casos que presentan simultneamente las dos o ms propiedades
cuya combinacin genera el espacio. A partir de la distribucin de los casos en los
espacios de propiedades, con el auxilio del clculo de porcentajes, es posible
examinar las relaciones entre variables mediante una lectura comparativa de las
frecuencias.
6

3. Tres recursos para el anlisis de relaciones entre variables

Siguiendo a Garca Ferrando (1995: 218), se puede caracterizar la relacin entre
dos variables segn la existencia de asociacin, la fuerza, la direccin y la
naturaleza de la misma.

La existencia de asociacin implica que la distribucin de una variable difiere de
algn modo entre las categoras de la segunda variable, alejndose de la
independencia estadstica
3
, lo cual puede determinarse a partir del anlisis de
diferencias porcentuales y de la comparacin de las frecuencias esperadas con las
observadas, mediante la prueba de hiptesis de ji cuadrado, esta ltima para los
casos en que se trabaje con muestras probabilsticas.

El grado o fuerza de la asociacin vara segn cunto se aleje la relacin de la
independencia estadstica. Como las diferencias porcentuales y la comparacin
entre frecuencias observadas y esperadas no varan de una forma
predeterminada, se han establecido algunos coeficientes estandarizados, que
varan de forma fija entre un valor mnimo cero- y un mximo uno-, facilitando su
interpretacin. Estos coeficientes permiten conocer tambin, cuando las variables
son como mnimo de nivel de medicin ordinal, la direccin de la asociacin, que
puede ser positiva, cuando los valores altos de una variable se corresponden con
los valores altos de la otra -y los valores bajos con los valores bajos-, o negativa, -
cuando los valores altos de una variable se corresponden con los bajos de la
segunda -y viceversa-
4
.

Por ltimo, la naturaleza es la forma general en que se distribuyen los datos en un
cuadro, que puede ser lineal o diagonal, curvilineal o rinconal e irregular; esta
ltima forma slo puede ser examinada mediante la lectura analtica del cuadro, ya
que las medidas resumen de asociacin no permiten medirla sino que la
presuponen en las operaciones que realizan para calcular la fuerza.
Siguiendo esta lgica, un primer paso en el anlisis de los datos
5
en funcin de
una hiptesis puede darse mediante el test de significacin estadstica de ji
cuadrado (
2
) que permite establecer si existe relacin estadsticamente
significativa entre las variables o si hay independencia estadstica. El ji cuadrado
3
Entendida como la inexistencia de relacin entre las variables analizadas. Ello refiere a que
cualquiera sea el valor que asuma una variable en estudio A, la variable B se mantendr constante.
4
Es importante aclarar que en las asociaciones observadas para variables de nivel de medicin
nominal, stas tambin poseen un sentido en cuanto a su relacin, pero este no puede
interpretarse a partir de un signo positivo o negativo, sino que se hace observable a partir del modo
en que se distribuyen las frecuencias al interior de la tabla.
5
Si bien en este artculo hemos propuesto una secuencia de estas herramientas no implican en s
mismas un orden ni jerarqua preestablecida.
7


nos permite testear si las relaciones entre las variables e hiptesis observadas en
una muestra probabilstica puede ser extrapolada al universo con un determinado
nivel de confianza. Esta prueba de hiptesis define el escenario estadstico en que
se trabaja, por eso constituye un buen primer paso en el anlisis.

Queda definido as el contexto respecto a la existencia o no de una relacin
estadsticamente significativa, e independientemente del resultado del test
6
, es
posible contar con un panorama de la fuerza y el sentido de la relacin entre
variables mediante coeficientes de asociacin, los cuales son medidas resmenes
estandarizadas que permiten conocer grosso modo qu ocurre con una relacin
entre variables. En una nica medida se sintetiza la intensidad de la relacin y, en
algunas de ellas, permite conocer tambin el sentido. Este sentido o direccin de
la relacin puede ser positivo -cuando ambas variables crecen o decrecen
conjuntamente- o negativo -cuando una crece mientras la otra decrece- cuyo nivel
de medicin es ordinal o mayor.

Con la prueba de hiptesis y los coeficientes de asociacin ya se cuenta con una
primera aproximacin global y sinttica de la relacin estudiada. Con la lectura
analtica de porcentajes es posible conocer en detalle cmo se distribuyen las
unidades de anlisis en los espacios de propiedades generados por la tabulacin
cruzada de variables de cualquier nivel de medicin. Dado que en la mayora de
los casos las covariaciones no son perfectas ni lineales, la lectura de porcentajes
permite analizar las particularidades de cada cuadro con respecto a la forma de
distribucin de unidades de anlisis en los espacios de propiedad, visualizando,
por ejemplo, de qu modo una hiptesis puede tender a corroborarse
parcialmente, en distinta medida para algunas categoras de la variable
dependiente que para otras.
En lo que sigue, se presentar cada una de estas tres herramientas de anlisis
descriptivo de relaciones bivariadas: ji cuadrado, coeficientes de asociacin y
lectura de porcentajes. Este conjunto de recursos usados en combinacin
permiten realizar un anlisis exhaustivo de lo que ocurre en los datos para cada
hiptesis de trabajo, complementando la informacin global que proporcionan la
prueba de hiptesis y los coeficientes con la lectura desagregada de las
distribuciones porcentuales en los espacios.




6
Cabe destacar que si en una investigacin las relaciones entre variables observadas no pueden
ser extrapolables al universo no son estadsticamente significativas-, pueden igualmente ser
tericamente relevantes para la poblacin a partir de la cual se han construido los datos.
8


Ji cuadrado como prueba de significacin estadstica

Cuando dos variables estn relacionadas varan conjuntamente en algn grado,
existiendo covariacin o varianza en comn. Cuando la covariacin o varianza en
conjunto de ambas variables alcanza su nivel mximo -en que toda la varianza de
una variable coincide con la varianza de otra- existe una asociacin perfecta. Por
la complejidad y multicausalidad del mundo social, no es habitual en ciencias
sociales encontrar asociaciones perfectas entre variables. De hecho, cuando se
constata una asociacin perfecta, es necesario dilucidar por qu ocurre,
contemplando la posibilidad de que se trate, por ejemplo, de dos indicadores de un
mismo concepto.

No obstante, la asociacin perfecta es muy til en tanto situacin extrema con la
cual confrontar los datos con que se dispone en una tabla bivariada. Cuando hay
asociacin perfecta cada categora de una variable se encuentra asociada con una
sola categora de la otra. En una tabla, los casos se concentran en la diagonal y el
resto de los espacios de propiedades tendrn cero casos, con lo cual las
diferencias porcentuales sern del 100%. El caso opuesto a la asociacin perfecta
es el de independencia estadstica, en que no hay ninguna covariacin entre las
variables, de modo tal que los casos se distribuyen en la tabla bivariada al igual
que lo haran en una distribucin univariable, con lo cual las diferencias
porcentuales sern de 0%.

El test de ji cuadrado nos permite saber si la relacin observada entre
determinadas variables en nuestra muestra puede ser inferible, bajo determinados
niveles de confianza, al universo de estudio. Para ello pone en relacin la hiptesis
nula con la hiptesis de trabajo. Una hiptesis nula es una hiptesis que afirma la
independencia estadstica, es decir, la ausencia de asociacin entre variables, lo
contrario a lo que afirma la hiptesis de trabajo
7
. Cuando se trabaja con muestras
aleatorias el test de hiptesis de ji cuadrado
8
permite decidir si puede rechazarse
la hiptesis nula para un nivel de confianza dado. Si se rechaza la hiptesis nula,
se est descartando, asumiendo determinado riesgo, que se trate de una situacin
de independencia estadstica y se est aceptando que hay alguna asociacin
estadstica entre las variables de la hiptesis de trabajo, con determinado nivel de
confianza. No rechazar la hiptesis nula implica que la hiptesis de trabajo no es
7
Ambas hiptesis se excluyen mutuamente: el rechazo de la hiptesis nula implica que puede
aceptarse, con determinados niveles de confianza, la hiptesis de trabajo. En este caso, lo que
rechazamos es la hiptesis de independencia estadstica y por tanto, implica que la relacin entre
las variables observadas en la muestra es inferible al universo en estudio.
El no rechazo de la hiptesis nula a cierto nivel de confianza, implica que no puede afirmarse que
esa relacin ocurra tambin en el universo, lo que no significa que no tenga relevancia terica.
8
Existen otros tipos de test de hiptesis, aqu slo tomamos uno de ellos.
9


estadsticamente significativa para determinado nivel de confianza, mas no implica
necesariamente que se acepte la hiptesis nula ni que deba darse por finalizado el
anlisis de la relacin.

El ji cuadrado no permite analizar las categoras o valores de las variables, sino
cmo las unidades de anlisis se distribuyen en los espacios de propiedades, por
lo cual puede ser utilizado con variables de cualquier nivel de medicin. Se utiliza
para relaciones entre variables nominales u ordinales, puesto que existen otras
pruebas para variables intervalares.

El ji cuadrado compara frecuencias absolutas, no porcentajes. Opera a partir de la
comparacin entre las frecuencias observadas y las frecuencias esperadas. Las
frecuencias observadas son simplemente los casos relevados distribuidos en los
espacios de una tabla. Las frecuencias esperadas son aquellas que cabra esperar
si hubiese independencia estadstica. Para cada espacio de propiedad de un
cuadro, la frecuencia esperada se obtiene multiplicando las frecuencias
marginales entre s y dividiendo el producto por el total de casos. De este modo,
se obtiene una distribucin de los casos en el cuadro que mantiene las frecuencias
marginales observadas de cada variable pero distribuye los casos en los espacios
de propiedades, de modo tal que las frecuencias condicionales sean las que
cabra esperar por meras desviaciones en la muestra en ausencia de asociacin
en la poblacin.

Es posible elaborar una tabla de frecuencias esperadas o datos tericos y
compararla con la tabla de frecuencias observadas o datos reales. Si no se
observa diferencia entre las mismas se puede decir que hay una ausencia de
asociacin entre las dos variables o independencia estadstica. Si hay diferencia
entre las frecuencias observadas y esperadas, es necesario evaluar si los datos
reales se alejan lo suficiente de la independencia estadstica como para rechazar
la hiptesis nula con un nivel de confianza razonable. Para ello, se realiza el
clculo del ji cuadrado. Siendo Fo las frecuencias observadas y Fe las frecuencias
esperadas, la frmula de ji cuadrado es:

2
=
(FoFe)
2
Fe


El residual o diferencia entre frecuencias observadas y esperadas de cada espacio
se eleva al cuadrado, anulando los signos negativos. Para normalizar los residuos
elevados al cuadrado de cada espacios de propiedad, se divide por la frecuencia
esperada. Al sumar los resultados se obtiene el ji cuadrado emprico (X
e
2
), que
puede adoptar valores desde cero hasta infinito. Cuanto ms pequeo sea el valor
10

de ji cuadrado, ms fcil es no estar en condiciones de rechazar la hiptesis nula.
Como el valor de ji cuadrado aumenta con el tamao de la muestra, no habiendo
un lmite superior, para decidir el rechazo o no rechazo de la hiptesis nula, es
necesario compararlo con el ji cuadrado terico (X
t
2
). El ji cuadrado terico, crtico
o de tabla proviene de una distribucin estadstica que relaciona valores tericos
de ji cuadrado con sus posibilidades de ocurrencia por el slo efecto del error
muestral.

La distribucin terica de ji cuadrado permite conocer cul es el valor con el que
comparar el ji cuadrado emprico, segn los grados de libertad de la tabla y el nivel
de confianza con que se decida trabajar. Los grados de libertad de una tabla se
determinan segn la mnima cantidad de frecuencias condicionales que necesitan
conocerse para poder calcular las restantes, para frecuencias marginales dadas.
Se calcula multiplicando la cantidad de columnas menos uno por la cantidad de
filas menos uno [GL= (c-1) x (f-1)]. Por ejemplo, una tabla de dos columnas por
dos filas tiene un grado de libertad.

El nivel de confianza es el complemento del riesgo. Este ltimo es la probabilidad
de rechazar la hiptesis nula siendo esta verdadera, o lo que es lo mismo, la
probabilidad de cometer error de tipo I. El error de tipo I consiste en aceptar la
hiptesis de trabajo, cuando en realidad la relacin no existe en el universo bajo
estudio. La situacin inversa es el error de tipo II, o probabilidad de no rechazar la
hiptesis nula siendo esta falsa. En el error de tipo II se rechaza la hiptesis de
trabajo, cuando s es estadsticamente significativa. En ambas situaciones no se
trata de errores en tanto decisiones desacertadas por la impericia del investigador,
sino que son errores estadsticos, probabilidades que quienes investigan asumen
como riesgos propios de los instrumentos estadsticos que se utilizan. Por
convencin, suele trabajarse con un 95% de confianza en Ciencias Sociales, lo
cual equivale a decir que el riesgo o significacin ms habitual es de 0.05. El
clculo del error de tipo II es ms complejo porque requiere de la utilizacin de
supuestos adicionales.
Si al comparar los valores obtenidos, el ji cuadrado terico es mayor al ji cuadrado
emprico (X
t
2
> X
e
2
) la hiptesis nula no puede ser rechazada, por lo que la
hiptesis de trabajo no es aceptada. Por el contrario, si el ji cuadrado terico es
menor o igual al ji cuadrado emprico (X
t
2
X
e
2
) la hiptesis nula se rechaza y se
acepta la hiptesis de trabajo, considerando que existe una relacin
estadsticamente significativa entre las variables.

En la actualidad, los paquetes estadsticos informticos como el SPSS -Statistical
Package for the Social Sciences- adems de arrojar el valor de ji cuadrado
11

emprico para un cuadro determinado, calculan la significacin emprica o p-valor,
que indica la probabilidad de que sea cierta la hiptesis nula en la poblacin para
determinado ji cuadrado emprico. El nivel de significacin terico con el que se
compara habitualmente es 0.05 -eventualmente 0.01-, de modo tal que los niveles
de significacin emprica menores indicarn que se est en condiciones de
rechazar la hiptesis nula. La ventaja de utilizar este procedimiento operativo para
hacer la prueba de hiptesis es que se puede conocer con exactitud y sin
necesidad de consultar la tabla de la distribucin terica de ji cuadrado con qu
nivel de confianza se puede rechazar la hiptesis nula. Por ejemplo, si el p-valor
fuera de 0.007, se determina que la hiptesis nula puede rechazarse con 99.3%
de confianza.

Cuando se analiza el valor que asume ji cuadrado, ste est indicando
simplemente si la relacin supuesta entre las variables en la hiptesis de trabajo
es estadsticamente significativa o no. Con esto, se define estadsticamente el
contexto en que se trabaja con la hiptesis, de modo tal que si la asociacin entre
variables es estadsticamente significativa se puede realizar una inferencia
estadstica de la muestra al universo de estudio. Ello quiere decir que se puede
rechazar con determinado nivel de confianza que la hiptesis nula sea cierta en el
universo y que la asociacin en los casos analizados se deba solamente a errores
muestrales.

Cuando el ji cuadrado terico es mayor al ji cuadrado emprico y la hiptesis nula
no puede ser rechazada, la hiptesis de trabajo no puede ser aceptada como
estadsticamente significativa. La ausencia de significacin estadstica puede
deberse a diversos motivos, tales como el modo de construir las variables, una
insuficiente cantidad de casos, las caractersticas de la estrategia de medicin,
etc. El hecho de que no haya significacin estadstica en la relacin entre las
variables analizadas, no impide avanzar en la produccin de conocimiento y que
no pueda estarse frente a un caso de significacin terica y sociolgica. A los
fines sociolgicos, la situacin en que el ji cuadrado no asume significacin no
menoscaba la relevancia terica de una hiptesis y, en contrapartida, el hecho de
que una relacin entre variables sea estadsticamente significativa no es suficiente
por s mismo para producir conocimiento cientfico. Cabe destacar que este Test
de Hiptesis no es til para el anlisis si es tomado aisladamente de los otros
recursos con los que contamos como lo son los Coeficientes de Asociacin y la
Lectura Porcentual que veremos a continuacin.




12

Asociacin y medidas de asociacin

La asociacin es una forma de covariacin entre variables, medida a partir de
cmo se distribuyen las unidades de anlisis en los espacios de propiedades. Las
medidas de asociacin, a diferencia de las de correlacin, no operan con las
categoras o valores de las variables. Por este motivo, pueden ser utilizadas con
variables de cualquier nivel de medicin, a diferencia del coeficiente de correlacin
que requiere variables cuantitativas. Los coeficientes de asociacin (tambin
conocidos como coeficientes no paramtricos) no permiten realizar inferencias al
universo, sino que indican la fuerza de la relacin en la muestra que se analiza.
Los coeficientes de asociacin son medidas resumen de la fuerza de la asociacin
entre variables y, algunos de ellos, permiten tambin conocer la direccin. A
diferencia del ji cuadrado (que como veremos ms adelante no tiene lmite
superior de variacin, puesto que su valor depende de la cantidad de casos) los
coeficientes de asociacin son estandarizados, variando entre cero, que indica
independencia estadstica y uno, que indica asociacin perfecta
9
.

Phi () y V de Cramer (V) son coeficientes derivados de ji cuadrado, con lo cual
operan a partir de las diferencias entre frecuencias observadas y esperadas. El
primero es el resultante de dividir el valor de ji cuadrado por la cantidad de casos
[ = (
2
/ n)], de modo tal que quede un valor estandarizado entre 0 y 1.

Como en tablas de ms de dos por dos el valor de Phi puede superar la unidad, V
de Cramer incorpora un factor de correccin en su frmula para poder ser utilizado
en cuadros de cualquier cantidad de categoras. No obstante, por suponer una
definicin exigente de asociacin perfecta, V tiende a subestimar el grado de
relacin, lo cual debe ser tenido en cuenta en la interpretacin del valor de este
coeficiente, de la misma manera que, como se desarrollar, en la interpretacin de
los coeficientes rinconales debe tenerse presente que pueden asumir altos valores
por la definicin menos restrictiva de asociacin (Garca Ferrando, 1995).

Algunos coeficientes, como Tau-b (b), Q de Yule (Q) y Gamma () operan en
base a la reduccin proporcional del error. La relacin entre las variables puede
entonces tambin ser interpretada como la proporcin en que se reduce el error de
prediccin de las categoras de la variable dependiente cuando se conoce su
distribucin en las categoras de la independiente, contra el error de prediccin
9
Como veremos ms adelante en el documento, en los cuadros con un alto nmero de casos el ji
cuadrado tiende a ser significativo, una de las razones por las cuales es nodal examinar la fuerza
de la asociacin mediante los coeficientes.
13


cuando slo se conoce la distribucin univariada de la variable dependiente
(Garca Ferrando, 1995: 233; Roales Riesgo, 1999).

Algunos coeficientes pueden llevar signo positivo o negativo, de modo que varan
entre -1 y 1, pasando por 0, siendo -1 asociacin perfecta negativa y 1 asociacin
perfecta positiva. El signo indica el sentido de la relacin, el cual slo resulta
pertinente cuando se trabaja con ambas variables de nivel de medicin como
mnimo ordinal.

La eleccin del coeficiente adecuado depende del nivel de medicin de las
variables, del tipo de hiptesis y, en algunas situaciones, del tamao del cuadro.
Las variables que hemos seleccionado, las categoras de stas que hemos
definido y las relaciones que hemos establecido en nuestras hiptesis son
producto del enfoque terico a partir del cual hemos abordado el fenmeno de
estudio.

-Nivel de medicin de las variables. Si son nominales con cuadros de ms de dos
por dos se utiliza V de Cramer; si son nominales u ordinales en cuadros de dos
por dos se utiliza Phi y Q de Yule y si son ordinales en cuadros de ms de dos por
dos se utiliza Tau b y Gamma. La eleccin de Tau-b es recomendable cuando las
tablas son cuadradas, es decir, poseen el mismo nmero de filas que de
columnas.

-Tipo de hiptesis. Las hiptesis rinconales son aquellas que tienen una sola
condicin acerca del modo en que se vinculan las variables, es decir, relacionan
una categora de la variable dependiente con una categora de la variable
independiente. Son hiptesis menos exigentes, puesto que para que haya
asociacin perfecta en una tabla de dos por dos alcanza con que una sola
frecuencia sea cero. Si la hiptesis es rinconal se utiliza Q o Gamma, que son
coeficientes curvilineales. En la interpretacin de los valores de estos coeficientes,
debe tenerse presente que los mismos se basan en una definicin menos
restrictiva de asociacin perfecta, relativa a una hiptesis rinconal, que puede
cumplirse a la perfeccin poniendo una sola condicin.

Las hiptesis diagonales son ms exigentes puesto que para corroborarse, los
casos deben concentrarse en la diagonal de una tabla, y para que exista
asociacin perfecta no puede haber ningn caso en los espacios fuera de la
diagonal. Por ejemplo, si la hiptesis es diagonal se utiliza Phi, coeficiente lineal,
que pone dos condiciones para que haya asociacin perfecta en tablas de dos por
dos, por lo cual se necesitaran dos espacios de propiedad con cero casos. Para
14

hiptesis diagonales de cuadros de ms de 2x2, utilizaremos Tau b, coeficiente
lineal
10
.

-Tamao del cuadro. Q y Phi se utilizan para cuadros de dos por dos. Si los
cuadros tienen ms categoras, se utiliza Gamma en lugar de Q y Tau-b en lugar
de Phi.

COEFICIENTES DE ASOCIACIN
11


Hiptesis
Lineal Curvilineal
Tipo de
Variable
Nominal - Ms de
2x2
V de Cramer (V)
Nominal/Ordinal
- 2x2
Phi ()
Q de Yule
(Q)
Ordinal - Ms de
2x2
Tau b (b) Gamma ()

El valor que arroje un coeficiente de asociacin ha de ser interpretado segn
cunto se aproxime al 0 y al 1 (o menos 1), independencia estadstica y asociacin
perfecta positiva o negativa, respectivamente. A medida que los coeficientes
comienzan a alejarse de 0 estn expresando algn tipo de relacin entre las
variables.

Ahora bien, el valor de un coeficiente de asociacin en un anlisis determinado no
puede ser interpretado aisladamente, sino en funcin de las comparaciones que
establezca. Dichas comparaciones
12
intentarn mostrar las maneras en que
nuestra variable dependiente se encuentra afectada por diferentes variables
independientes. En este sentido, no existen valores altos, medios o bajos en los
anlisis de los coeficientes, sino que el valor que la covariacin entre las variables
adopte ser interpretado a la luz del valor que adquiera otra covariacin. Los
fenmenos que estamos analizando no se explican por la influencia de una sola
variable ni son estticos.
10
Los coeficientes de asociacin y su exigencia para los tipos de variables e hiptesis constituyen
modelos ideales. La eleccin del tipo de variable y la hiptesis propuesta depender de la teora
con la que hayamos abordado nuestro fenmeno en estudio.
11
Existen otros coeficientes de asociacin, pero estos cinco cubren las alternativas de uso
habitual.
12
Para que las comparaciones respecto a la fuerza de incidencia de distintas variables
independientes sean correctas, es necesario realizarlas con el mismo coeficiente, preferentemente
para variables nominales si hay por lo menos una de dicho nivel de medicin.
15


Tambin el conocimiento terico acumulado sobre el comportamiento del
fenmeno contribuir a determinar cun alto o bajo es el resultado, en relacin con
expectativas tericas o derivadas de la experiencia previa.
En consecuencia, el proceso de conocimiento que implica acercarnos a nuestro
fenmeno de estudio compromete el anlisis y la comparacin de un nmero
significativo de variables dadas por nuestro marco terico de anlisis. De esta
manera, la comparacin se vuelve una instancia nodal de nuestro proceso de
construccin del conocimiento y la seleccin de variables y su interpretacin
posibilita subordinar los recursos tcnicos a las decisiones terico-metodolgicas,
contribuyendo a la produccin de conocimiento tericamente relevante.


Lectura analtica de porcentajes

La lectura de tablas de contingencia permite un anlisis cuantitativo refinado,
analtico y artesanal. Los cuadros o tablas de contingencia surgen de la tabulacin
simultnea de dos o ms variables, en funcin de las hiptesis.
Una vez que se tiene una tabla con las frecuencias absolutas distribuidas en los
espacios de propiedades, es necesario calcular porcentajes para poder realizar
comparaciones vlidas con mayor facilidad. Porcentualizar es una manera de
estandarizar las frecuencias condicionales para liberarlas de los efectos de las
diferencias de los marginales y hacer comparable una parte respecto al todo
(Baranger, 1999). No obstante, es necesario saber sobre qu total de casos han
sido calculados los porcentajes, ya sea para poder reporcentualizar agrupando
categoras o, ms importante, para tener los debidos recaudos en la interpretacin
de porcentajes calculados sobre pocos casos.

Generalmente, los porcentajes pueden presentarse sin decimales o con un
decimal. La cantidad de decimales con la cual pueda trabajarse depende de la
cantidad de casos, lo cual debe tenerse en cuenta para evitar que los porcentajes
aparenten un nivel de exactitud que no pueden tener cuando se trabaja con una
muestra pequea.

Los porcentajes pueden ser calculados sobre el total (n) de una tabla, sobre los
subtotales de fila -asumiendo que se dispuso all variable dependiente- o sobre los
subtotales de columna -asumiendo que se trata de la variable independiente-.
Si se procura conocer qu porcentaje de la poblacin puede ser clasificado en dos
o ms atributos simultneamente -por ejemplo, varn y de nivel educativo alto- es
necesario calcular los porcentajes sobre el total de la tabla.
Si se busca describir perfiles de la poblacin y subpoblaciones, en ocasiones
puede ser til calcular los porcentajes de filas, es decir, aquellos calculados en el
16

sentido de la variable dependiente. Estos porcentajes slo pueden servir a los
fines descriptivos univariados de las caractersticas de distintos subgrupos. La
variable dependiente no opera como tal sino como si fuera una constante, por
ejemplo, qu porcentaje de los que tienen nivel educativo alto son varones,
brindando as una idea de la composicin interna o perfil de cierto subgrupo.

Para realizar una lectura en funcin de las hiptesis es necesario calcular los
porcentajes en el sentido de la variable independiente y leerlos comparando en el
sentido de la variable dependiente (Zeisel, 1974). De este modo, podemos
analizar la influencia de la variable independiente sobre la dependiente. Por
ejemplo, saber qu porcentaje de los varones tiene nivel educativo alto, al
comparar con el porcentaje que tienen las mujeres en dicho nivel educativo,
permite a partir de las diferencias porcentuales aproximarse a la incidencia de la
variable sexo en el nivel educativo alcanzado.

Esta distribucin porcentual bivariable pone en relacin las distribuciones
condicionales con una distribucin global de la variable dependiente. La
distribucin de la variable dependiente dentro de las categoras de la variable
independiente permite examinar las condiciones que se supone que influyen en
cmo se distribuye. La variable independiente puede ser entendida como
condicin que hace probable cierto resultado, por lo cual es necesario comparar
diferentes condiciones -categoras de la variable independiente- para resultados
equivalentes -de una misma categora de la variable dependiente-, examinando
qu le ocurre a la variable de estudio cuando se le aplica cada una de las
categoras de la variable independiente.

La lectura de un cuadro puede comenzarse por las frecuencias marginales de la
variable dependiente, que no son ms que la distribucin univariada de esa
variable, es decir, su distribucin sin tomar en cuenta las categoras de la variable
independiente. Luego, los marginales pueden ser tiles para comparar con cada
frecuencia condicional, examinando qu ocurre con la distribucin de la variable
dependiente cuando est presente la variable independiente. Si las distribuciones
de la variable dependiente en cada categora de la variable independiente son las
mismas que la distribucin univariada, en principio no habra asociacin entre las
variables.

Lo central de la lectura de cuadros bivariados es la lectura de las frecuencias
condicionales, comparando en el sentido de la variable dependiente. Segn lo que
establezca la hiptesis, se proceder a comparar el porcentaje de casos que
corresponde a una categora de la variable dependiente entre la subpoblacin de
una categora de la variable independiente, con el porcentaje de casos de otra
17

subpoblacin -delimitada por otra categora de la variable independiente- que
corresponde a la misma categora de la variable dependiente. Esta es la
comparacin bsica a partir de la cual se van introduciendo complejizaciones,
segn la cantidad de categoras que tenga el cuadro.

Cuando se trata de un cuadro de dos por dos, bastar con comparar dos
porcentajes para leer el cuadro por completo, puesto que habiendo ledo los dos
porcentajes de una categora de la variable dependiente, los de la otra categora
de la variable dependiente son complementarios. La diferencia entre los dos
porcentajes comparados ser la diferencia porcentual o psilon () que sintetiza
todo el cuadro, indicando la fuerza de la relacin. A medida que se trate de un
cuadro ms grande, se van abriendo las posibilidades de comparaciones.
Probablemente no sea necesario leer todos los porcentajes cuando haya muchas
categoras de las variables, siendo siempre la hiptesis lo que orientar la lectura,
indicando qu espacios de propiedad son los ms relevantes segn las
expectativas tericas. En los cuadros de ms de dos por dos, ya no habr una
nica diferencia porcentual sino varias y por ende ninguna de ellas sintetizar en
una nica medida la fuerza de toda la relacin.

Cabe poner de relieve que si bien la lectura porcentual permite analizar
minuciosamente un cuadro, no debe perderse de vista el panorama general del
plan de anlisis, de modo que los avances parciales en el conocimiento a partir de
la interpretacin de cada cuadro, puedan ser articulados de un modo coherente y
enfocado en dar cumplimiento a los objetivos, confrontando con los datos
producidos el conjunto de supuestos que se decidi someter a contrastacin en la
investigacin. La lectura de un cuadro no debe ser entendida como un fin en s
mismo sino como un medio para el anlisis e interpretacin de los resultados
enmarcado en un proceso terico metodolgico, evitando as miradas
fragmentadas del proceso de investigacin (Aguilar, Alonso, Kleidermacher y
Vzquez, 2013: 23).


4. Reflexiones finales

El proceso de construccin del dato finaliza al elaborarse los cuadros, a partir de
las variables que se pongan en relacin y de la forma en que sean categorizadas.
Las distintas posibilidades de agrupar y reagrupar categoras en distintos sistemas
de categoras implican variaciones en las distribuciones de casos en los espacios
de propiedades generados y, por lo tanto, en la fortaleza de las hiptesis. Al
examinar qu ha ocurrido con cada hiptesis sustantiva y los resultados de un
18

cuadro, se est en la etapa del anlisis, en que la teora y los datos se vinculan y
confrontan mediante las hiptesis.

El anlisis de relaciones entre dos variables se sirve de la prueba de hiptesis de ji
cuadrado, de los coeficientes de asociacin y de la lectura analtica de los
cuadros, en tanto herramientas que en conjunto permiten analizar y comenzar a
dar respuesta a objetivos descriptivos. La prueba de ji cuadrado, permite
establecer si existe relacin estadsticamente significativa entre las variables y
complementada por los coeficientes de asociacin, permite examinar la fuerza de
la relacin y su sentido. La naturaleza de la relacin entre variables, es decir, si se
aproxima a una forma lineal, curvilineal o irregular, slo puede ser examinada
mediante la lectura porcentual analtica al interior del cuadro. Adems, todo tipo de
situaciones intermedias, variaciones sutiles y matices respecto al modo de relacin
entre las variables pueden ser descriptos pormenorizadamente mediante la lectura
porcentual, lo cual resulta una gran ventaja para analizar artesanalmente datos
sobre fenmenos sociales, los cuales si bien presentan regularidades, conservan
cierta inestabilidad, indeterminacin e irregularidad, que tambin deben ser
analizadas.

As, todas las herramientas estadsticas presentadas, se utilizan en estrecha
relacin con la teora. En primer lugar, porque sta condiciona las hiptesis
plateadas, las variables seleccionadas, las categorizaciones realizadas y las
comparaciones establecidas. En segundo lugar, porque el anlisis e interpretacin
de los resultados obtenidos, se realiza a la luz del marco terico seleccionado y
las preguntas y objetivos que guan la investigacin.

19

5. Anexo: Ejemplo de anlisis bivariado


El uso diferencial del tiempo libre. Una aproximacin desde gnero y clase

En el marco del proyecto de investigacin Heterogeneidad de clase social:
profundizando los comportamientos de clase de las parejas
1314
, se indag
respecto del uso diferencial del tiempo libre, concebido como un aspecto del estilo
de vida de las clases sociales. Se analizaron datos cuantitativos sobre la
frecuencia y el placer que producen diferentes actividades de tiempo libre segn
clase social y segn gnero. El objetivo del trabajo fue describir el uso del tiempo
libre de varones y mujeres que trabajan, contndose con informacin sobre la
clase social. Para trabajar el concepto de clase, se utiliz el esquema de
Goldthorpe. Enfocamos al tiempo libre como una de las expresiones de los
consumos y estilos de vida de las personas, cuyas caractersticas dependen en
gran medida de la clase y el gnero.

As, se indag sobre las diferencias en torno al uso de este tiempo libre, segn
gnero y clase social, teniendo como hiptesis de trabajo que cuanto ms alta es
la clase social es mayor y ms variado el tiempo libre, y que el tiempo libre de las
mujeres es contaminado o interrumpido por responsabilidades familiares o tareas
domsticas que pueden incluso ser realizadas simultneamente a la actividad de
ocio.

A continuacin se presenta como ejemplo, el anlisis realizado para una de las
variables de inters de la investigacin que fue la frecuencia de uso de Internet
como una actividad de tiempo libre. As, la primera hiptesis de trabajo,
planteaba: Se espera una mayor frecuencia de uso en cuanto ms alta sea la
clase social.

VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal
VI: Clase Social
Nivel de medicin: Ordinal

Tamao de la Tabla: 3x4
Grados de Libertad (gl): 6
13
Proyecto UBACyT de la programacin 2010-2012, dirigido por la Dra. Gabriela Gmez Rojas,
con sede en el Instituto de Investigaciones Gino Germani de la UBA.


20


Tipo de hiptesis: Diagonal o lineal

En primer lugar se realiz la prueba de J i Cuadrado para contrastar la hiptesis
nula que planteara que no existe relacin entre la frecuencia de uso de internet y
la clase social. Se eligi trabajar con un nivel de confianza del 95% (que es lo
mismo que decir un nivel de significacin de 0.05).
Al buscar en la tabla de J i Cuadrado, el valor terico correspondiente a 0.05 de
significacin para 6 grados de libertad es de 12.592. Dado que el valor emprico de
J i cuadrado que arroja la prueba -como se observa en la tabla a continuacin
producida con el SPSS- es mayor al valor terico (regla de decisin: Xe 121,839 >
Xt 12,592), puede entonces rechazarse con un 95% de confianza la hiptesis nula
que plantea que no hay asociacin entre las variables, y por lo tanto la hiptesis
de trabajo resulta significativa estadsticamente, lo que quiere decir que en el
universo de estudio, la relacin entre las variables tambin estara ocurriendo
15
.

Por otro lado, en la tabla a continuacin tambin puede observarse que bajo la
columna Sig. Asinttica se encuentra lo que conocemos como p-valor o
significancia exacta. Dado que en este caso es prcticamente cero, podra
tambin haberse rechazado la hiptesis nula a un nivel de confianza superior al
99% (regla de decisin: = 0.05 >p valor=0.00).

Ambos mtodos siempre conducen al mismo resultado del test. Slo que el
mtodo del p-valor permite conocer la significancia exacta. Esto no implica no
definir siempre a priori cul es el valor de significancia con el que se va a
trabajar.

Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson 121,839 6 ,000
Razn de verosimili tud 133,179 6 ,000
Asoci aci n li neal por
l i neal
107,252 1 ,000
N de casos vli dos 625


Ms all de la significancia estadstica hallada, se procedi luego a analizar el
coeficiente de asociacin correspondiente para conocer la fuerza y sentido de la
15
Cabe aclarar que la prueba de J i cuadrado no mide magnitudes. La relacin es o no es
significativa para el nivel de confianza dado. No es relevante por cuanto supera el valor de J i
emprico al terico.
21


relacin. Al ser dos variables ordinales en una tabla de ms de 2 x 2, para
hiptesis diagonal o lineal el coeficiente que correspondiente es el Tau-b.
Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co Aprox. S Aprox. Sig.
Nomi nal por Nomi nal Phi ,442

,000
V de Cramer ,312


,000
Ordi nal por ordi nal Tau-b de Kendall ,391 ,028 13,119 ,000
Gamma ,639 ,043 13,119 ,000
N de casos vli dos 625


En primer lugar el signo positivo del coeficiente indica que la relacin se da en el
sentido planteado en la hiptesis, ambas variables se comportan en la misma
direccin (cuando una aumenta, la otra tambin lo hace, y viceversa).
En cuanto a la magnitud, observamos que es de 0.391. Si bien se aleja del cero
que indica la no asociacin, para poder analizar la fuerza de esta magnitud,
debemos hacerlo de modo comparativo, luego de analizar el comportamiento del
fenmeno ante otras variables independientes.

Por ltimo, realizaremos la lectura porcentual, presentada en la siguiente tabla de
contingencia, en la cual, para poder realizar correctamente la lectura, los
porcentajes fueron calculados en el sentido de la variable independiente (clase
social).

Frecuenci a de ti empo l i bre en Internet por Cl ase Entrevi stado. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Clase Entrevistado

Cl ase Entrevistado
Total
I-III:
Trabajadores
de cuel l o
bl anco
IV: Pequea
burguesa
V+VI:
Trabajadores
cal ifi cados
VII:
Trabajadores
no cal ifi cados
Frecuenci a de
activi dades de
ti empo li bre:
Pasar ti empo en
Internet
Hasta Semanal 43% 17% 7% 5% 25%
Mensual o
i nferi or
17% 12% 13% 5% 13%
Nunca
40% 71% 80%
90%
62%
Total 100% 100% 100% 100% 100%
288 146 61 130 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.
22

A partir de la lectura porcentual, podemos observar la tendencia decreciente en la
frecuencia de uso a medida que se desciende en la clase social.

La diferencia porcentual observada entre la frecuencia hasta semanal entre los
Trabajadores de Cuello Blanco (43%) y entre los Trabajadores no calificados (5%)
es de un 38%. Tambin resulta interesante que al pasar de Trabajadores de
Cuello Blanco, al segmento inmediatamente inferior Pequea Burguesa (17%)-,
la diferencia porcentual es de 25 puntos porcentuales y sta slo es de a 10
puntos entre esta ltima y los Trabajadores Calificados (17% vs. 7%).
Es decir que la herramienta de las diferencias porcentuales no limita como muchas
veces aparece el anlisis a la comparacin entre categoras extremas, sino que
justamente su riqueza consiste en poder analizar pormenorizadamente lo que
ocurre en y entre los distintos espacios de propiedades generados en la tabla de
contingencia.

De igual modo, puede analizarse que en la categora intermedia de frecuencia
mensual o inferior, el descenso ms pronunciado se observa entre las dos clases
inferiores (8 puntos porcentuales entre 13% y 5%), mantenindose en un rango
similar los porcentajes para las clases intermedias.

Al analizar el comportamiento de las clases para la categora Nunca, casi en
espejo a lo observado para la mayor frecuencia de uso, se produce un quiebre
ms marcado entre los Trabajadores de Cuello Blanco y la Pequea Burguesa.
Entre los primeros slo representan al 40%, mientras que para los segundos este
porcentaje asciende a 71%, presentando una diferencia porcentual de 31 puntos
porcentuales. Se registra una tendencia ascendente de aproximadamente 10% en
cada pasaje hacia las siguientes categoras.

La segunda hiptesis de trabajo, plantea la relacin entre la misma variable
analizada en el caso anterior, pero en funcin del gnero, dado que se espera
como ya se mencion en el planteo general, que las mujeres presentan una
frecuencia de uso mensual o inferior, o nunca, mientras que los hombres utilizan
Internet en su tiempo libre de manera semanal o con mayor frecuencia.

VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal
VI: Gnero
Nivel de medicin: Nominal

Tamao de la Tabla: 3x2
Grados de Libertad (gl): 2
23


Tipo de hiptesis: Diagonal o lineal

Al igual que lo planteado para la relacin anterior, realizamos la prueba J i
Cuadrado, para conocer cul es el contexto en el que nos encontramos
(significacin estadstica o no). En este caso, al comparar el valor del Xe=0.937
contra el terico Xt=5.991 correspondiente a 95% de confianza y 2 grados de
libertad-, concluimos que no puede rechazarse la hiptesis nula que plantea que
no hay relacin entre el gnero y el uso de internet en el tiempo libre, por lo cual
no podemos descartar la independencia estadstica a nivel poblacional. Si
rechazramos la hiptesis nula correramos un riesgo del 62,6% de equivocarnos
al tomar esa decisin, como indica el p-valor, (nivel de confianza de 41,4%), por lo
cual al superar el nivel de riesgo o significancia establecido en este caso (5%).
Vemos nuevamente que por el mtodo del p-valor, tampoco podemos rechazar la
hiptesis nula y por tanto, aceptar la de trabajo-, para el nivel de confianza
establecido.

Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson ,937 2 ,626
Razn de verosimili tud ,942 2 ,625
Asoci aci n li neal por
l i neal
,181
1 ,670
N de casos vli dos 625


Igualmente, dado que la independencia estadstica no implica que la relacin no
pueda ser relevante tericamente, se procedi con el anlisis de fuerza y sentido a
travs del coeficiente de asociacin V de Cramer, correspondiente al cuadro e
hiptesis planteado (ordinal/nominal, ms de 2x2, hiptesis diagonal). En este
caso, al ser una de las variables de nivel de medicin nominal, el signo del
coeficiente no nos brinda informacin respecto del sentido de la relacin (dado que
no hay una necesariedad lgica en el orden de las categoras en la tabla). Esto lo
analizaremos a partir de la lectura porcentual.

Como se mencion, luego se compararn los coeficientes de las distintas
relaciones para poder dimensionar la fuerza. En este caso podemos adelantar que
por el valor del V de Cramer de 0.39, matemticamente muy prximo al valor cero
se encuentra muy cerca de la independencia estadstica.

24

Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co Aprox. S

Aprox. Sig.
Nomi nal por Nomi nal Phi ,039

,626
V de Cramer ,039

,626
Ordi nal por ordi nal Tau-b de Kendall -,012 ,039 -,316 ,752
Gamma -,024 ,076 -,316 ,752
N de casos vli dos 625


Por ltimo, el anlisis de porcentajes, nos muestra que un cuarto de la muestra
presenta una alta frecuencia de uso de internet, y esta proporcin prcticamente
se mantiene en el mismo nivel en ambos grupos (24% entre los hombres y 27%
entre las mujeres), con una diferencia slo de 3% entre ellos. Al analizar lo que
ocurre con la categora nunca, la diferencia entre hombres y mujeres, es an
menor, slo del 1%, siguiendo ambos grupos una distribucin prcticamente
idntica a la del total de la muestra. Estas diferencias porcentuales prximas a 0%,
nos indican tambin, en lnea a lo observado en la prueba de ji cuadrado y al valor
del coeficiente V de Cramer, que no habra relacin entre estas variables. El
comportamiento de la variable dependiente, no se modifica ante los distintos
gneros.

Frecuenci a de ti empo l i bre en Internet por Gnero. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Gnero

Gnero
Total Hombre Mujer
Frecuenci a de acti vi dades
de ti empo li bre: Pasar
ti empo en Internet
Hasta Semanal 24% 27% 25%
Mensual o i nferi or 14% 12% 13%
Nunca 62% 61% 62%
Total 100% 100% 100%
387 238 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.

Al avanzar en el anlisis, y al observar que en este caso el gnero no resultaba
una variable relevante para el caso del uso de Internet en el tiempo libre, se
plantea desde los distintos abordajes tericos sobre Tecnologas de Informacin y
Comunicacin (TICs), que para este tipo de consumo cultural/uso del tiempo libre,
la franja etaria resulta una variable relevante a considerar.

25

Es por esto que se plante una tercera hiptesis que plantea que la frecuencia
de uso de internet est influida por la edad de manera tal que entre los ms
jvenes la frecuencia es mayor que entre los mayores.

VD: Frecuencia de uso de Internet en el tiempo libre
Nivel de medicin: Ordinal

VI: Tramo de Edad
Nivel de medicin: Intervalar

Tamao de la Tabla: 3x4
Grados de Libertad (gl): 6
Tipo de hiptesis: Diagonal o lineal

Siguiendo la misma secuencia que para las relaciones anteriores, se realiz la
prueba de J i Cuadrado, definida a un 95% de confianza. Al igual que en el primer
caso, el tamao de la tabla define 6 grados de libertad, el valor de J i emprico
(17.654) supera al terico, 12.592. Haciendo el anlisis a partir del p-valor,
comprobamos que puede rechazarse la hiptesis nula con una confianza del
99.993%, por lo cual podemos descartar para ese nivel la independencia
estadstica.
Pruebas de chi-cuadrado
Val or gl
Si g. asi ntti ca
(2 col as)
Chi -cuadrado de Pearson 17,654 6 ,007
Razn de verosimili tud 19,064 6 ,004
Asoci aci n li neal por
l i neal
10,074
1 ,002
N de casos vli dos 625


El coeficiente adecuado para el nivel de medicin de las variables, el tipo de
hiptesis y el tamao de la tabla es el Tau-b, que en este caso confirma el sentido
positivo planteado en la hiptesis y tiene un valor de 0.118.
Si bien como se mencion el anlisis de correlacin es la tcnica especfica para
variables de nivel de medicin intervalar, y tambin existen otras tcnicas como el
anlisis de varianza (ANOVA) para las relaciones entre variables categricas e
intervalares, las variables intervalares agrupadas, al utilizarse en tablas de
contingencia, tambin pueden ser analizadas con anlisis de asociacin.

26

Coefi ci entes de Asociaci n
Val or
Error estndar
asi ntti co
a
Aprox. S
b
Aprox. Sig.
Nomi nal por Nomi nal Phi ,168

,007
V de Cramer ,119

,007
Ordi nal por ordi nal Tau-b de Kendall ,118 ,035 3,381 ,001
Gamma ,192 ,056 3,381 ,001
N de casos vli dos 625


Finalmente, al realizar la lectura porcentual, se destaca entre los del tramo de
edad superior una mayor proporcin de quienes nunca usan, alcanzando un 79%,
con una diferencia porcentual de 19% contra la categora inmediatamente inferior,
y alcanzando los 24 puntos porcentuales de diferencia al comprar con los ms
jvenes.

Al analizar la frecuencia de uso hasta semanal, y mensual o menos, se observan
comportamientos similares entre los tres primeros tramos, producindose el
descenso marcado tambin al pasar a la categora de 55 a 69 aos, entre quienes
solo un 16% presenta frecuencia semanal o mayor, con una diferencia de 9% en
comparacin con los de 40 a 54 aos, y de 14 puntos con respecto a los ms
jvenes.

Frecuenci a de ti empo l i bre en Internet por Tramos de Edad. PEA, de 20 a 69 aos. Total Pas, 2007.
% dentro de Tramos de Edad

Tramos de Edad
Total
20 a 29
aos
30 a 39
aos
40 a 54
aos
55 a 69
aos
Frecuenci a de
activi dades de
ti empo li bre: Pasar
ti empo en Internet
Hasta Semanal 30% 29% 25% 16% 25%
Mensual o
i nferi or
15% 14% 15% 5% 13%
Nunca 55% 57% 60% 79% 62%
Total 100% 100% 100% 100% 100%
82 185 246 112 625
Fuente: International Social Survey Program, ISSP, relevada a nivel nacional en el ao 2007 por el CEDOP.


En conclusin, podemos decir que la variable que presenta mayor fuerza de
asociacin con la frecuencia de uso de internet en el tiempo libre, es la clase. Su
27

Tau-b era de 0.39 mientras que para edad este coeficiente es inferior (0.118). En
estos casos en particular, los coeficientes fueron directamente comparados dado
que coincidan por el tipo de hiptesis, el tamao de los cuadros y el tipo de
variables con el que se trabajo. Sin embargo, para la variable independiente sexo,
el coeficiente que habamos utilizado fue V de Cramer. Para comparar la fuerza de
sta variable independiente en relacin a las otras con las que hemos trabajado
(Edad y Clase Social) es necesario seleccionar un tipo de coeficiente que sea
aplicable a las tres hiptesis planteadas. En dicho caso deberamos realizar una
comparacin a partir de V de Cramer por tener un menor nivel de exigencia. Bajo
estas condiciones el coeficiente asume un valor de 0.312 para la variable
independiente clase social, 0.039 para la variable independiente sexo y un valor
de 0.119 para la variable independiente edad. Podemos afirmar que dentro de las
variables independientes seleccionadas, la variable clase social presenta mayor
fuerza de asociacin con la frecuencia de uso de internet en el tiempo libre.



28

6. Referencias bibliogrficas

Aguilar, M., Alonso, C., Kleidermacher, G. y Vzquez, N. (2013) Elaboracin y
anlisis de distintos tipos de cuadros. Cuaderno de Ctedra N 3 (mimeo).
Baranger, D. (1999) Construccin y Anlisis de Datos. Introduccin al uso de
Tcnicas Cuantitativas en la Investigacin Social. Posadas: Editorial Universitaria
de la Universidad Nacional de Misiones.
Barton, A. H. (1973) Concepto de Espacio de atributos en Sociologa. En
Boudon, R. y Lazarsfeld, P. Metodologa de las Ciencias Sociales. Tomo I.
Barcelona: Ed. Laia.
Blalock, H. (1986) Estadstica social. Mxico: Fondo de Cultura Econmica.
Cohen, N. (1997) La teora y el mtodo en la investigacin social: el discurso y la
prctica. En Luxemburg - Revista de sociologa, ao 1 N 2. Buenos Aires.
Cohen, N. y Gmez Rojas, G. (2003): Los objetivos, el marco conceptual y la
estrategia terico-metodolgica triangulando en torno al problema de
investigacin. En Lago Martnez, G. Gmez Rojas y M. Mauro (coord.) En torno
de las metodologas: abordajes cualitativos y cuantitativos. Buenos Aires: Proa
XXI.
Garca Ferrando, M. (1995) Socioestadstica. Introduccin a la estadstica en
Sociologa. Madrid: Alianza Universidad Textos.
Marradi, A.; Archenti, N. y Piovani, J . (2010) Metodologa de las Ciencias Sociales.
Buenos Aires: Cengage Learning.
Roales Riesgo, M. (comp.) (1999) Claves de la Estadstica Descriptiva e
Inferencial: Anlisis Bivariado y Multivariado. Buenos Aires: Centro de Estudiantes
de Ciencias Sociales UBA.
Sautu, R. (2003) Todo es Teora. Objetivos y Mtodos de Investigacin. Buenos
Aires: Editorial Lumiere.
Zeisel, H. (1974) Dgalo con nmeros. Buenos Aires: Fondo de Cultura
Econmica.

29

Potrebbero piacerti anche