Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cuando buscamos informacin acerca de una poblacin, pero slo disponemos de datos
de una muestra, se necesitan algunos medios para poder sacar conclusiones acerca de esa
poblacin. Los conceptos y tcnicas que satisfacen esta necesidad constituyen la Inferencia
Estadstica.
1. ESTIMACIN DE PARMETROS
Con Ia estimacin de parmetros deseamos estimar eI vaIor de ese parmetro, a
travs de un estadstico caIcuIado en Ia muestra. La inferencia en Ios distintos niveIes de
medicin se reaIizar a travs de P y .
Un estimador es un procedimiento expresado a manera de frmuIa por medio deI
cuI se obtiene un vaIor numrico denominado estimacin.
1.1. Estimacin intervaIar
Consta de dos puntos definidores de un intervalo (lmites de confiana!, que seg"n
nuestras estimaciones contienen el par#metro poblacional que nos interesa, e.d., podemos
estimar el par#metro $ dentro de un intervalo a y b, en el que a y b se obtienen de
observaciones de la muestra y podemos afirmarlo a un nivel de confiana determinado.
EI principaI objetivo de Ia estadstica inferenciaI consiste en precisar eI vaIor
desconocido de Ios parmetros pobIacionaIes a partir de Ios resuItados obtenidos en
muestras aIeatorias.
%racias a la teora del error muestral podemos resolver la discrepancia e&istente entre
valores muestrales y poblacionales. $ara ello construimos intervalos dentro de los cu#les para
un nivel de confiana prefi'ado podemos asegurar que se encontrar# el verdadero valor del
par#metro poblacional.
Estudiando eI estadstico obtenido en Ia muestra y su error tpico podemos
determinar por Ias propiedades de Ia curva normaI a qu distancia mxima se encontrar
eI verdadero vaIor; dicha distancia constituir eI intervaIo dentro deI cuaI podemos
asegurar que se encuentra eI vaIor pobIacionaI.
2. LA DISTRIBUCIN MUESTRAL
Una distribucin muestraI es una distribucin probabiIstica terica de estadsticos
pertenecientes a muestras, p.e. medias proporciones.
(e obtiene una distribucin muestral cuando se toman todas las muestras aleatorias
simples (cada una de ellas con al menos un elemento diferente! de tama)o * de una misma
poblacin, se calcula un estadstico por cada muestra (p.e. medias o proporciones! y se
distribuyen dic+os estadsticos alrededor del par#metro que estiman. E'., de una nacin se
coge una muestra de -... y se calcula la de edad, si repetimos con todas las muestras
posibles de -..., obtendremos una distribucin muestral de medias de edad.
2.1. EI teorema deI Imite centraI
Es muy importante en estadstica. La suma de gran cantidad de variables aleatorias
independientes siempre tiene una distribucin apro&imadamente normal. La distribucin de
dic+a suma ser# tanto m#s parecida a la normal cuanto mayor sea el n"mero de variables
aleatorias. El teorema central del lmite e&presa cuantitativamente la rapide de esta
convergencia.
Lo que nos dice el teorema es que las medias de las muestras aleatorias simples
e&tradas de una poblacin que se distribuye normalmente, dar#n lugar a una distribucin
muestral que tambin es normal, aunque * sea peque)o.
1.3. La Ley de Ios grandes nmeros
(eg"n esta ley la diferencia entre una poblacin dada y una muestra decrece conforme
aumenta el tama)o muestral.
/ partir de cierto tama)o muestral, el error muestral se +ace tan peque)o que un
aumento del tama)o muestral no compensara el incremento de los costos.
La importancia de esta ley es muy grande, ya que al ser la distribucin muestral la que se
utilia en las pruebas de significacin, ello quiere decir que cuando * es suficientemente
grande no tenemos ya que preocuparnos de los supuestos referentes a la normalidad de la
poblacin, pudiendo aplicar las propiedades de la curva normal, ya que la distribucin muestral
tiende a apro&imarse a la normalidad.
Gracias aI teorema deI Imite centraI y Ia Iey de Ios grandes nmeros podemos
afirmar que Ia distribucin de Ios estimadores en eI muestreo ser una distribucin
normaI.
3. TENDENCIA CENTRAL, VARIABILIDAD Y FORMA DE UNA DISTRIBUCIN
MUESTRAL
La tendencia central de una distribucin muestral se denomina valor esperado de un
estadstico y se representa por E(!.
(i el promedio o valor esperado de un estadstico es el par#metro que estima, entonces
se dice que el estadstico es un estimador no sesgado del par#metro. Cualquier diferencia que
se produca entre un estadstico concreto y su par#metro es atribuible por ello m#s bien a un
error aleatorio.
4. DISTRIBUCIONES MUESTRALES DE MEDIAS
La medida de error muestral que indica la magnitud de las desviaciones de los
estadsticos se denomina error tpico, para distinguirlo de otras desviaciones tpicas.
Segn Ia Iey de Ios grandes nmeros aI aumentar Ia muestra disminuye eI error
tpico, e.d, que aI aumentar N Ios estadsticos se agrupan con mayor proximidad
aIrededor de sus respectivos parmetros.
PROPIEDADES:
0. La distribucin muestral de medias se apro&ima a la curva normal (por el
teorema del lmite central y la ley de los grandes n"meros!. En la pr#ctica pensaremos que
n 1. para servirnos de las medidas de la curva normal.
-. /l ser una distribucin de frecuencias es posible calcular medidas de tendencia
central, variacin, etc.
1. La de una distribucin muestral de medias es igual a la verdadera de la
poblacin.
2. La es menor que la de la poblacin3 esto se debe a que tomamos valores
medios, eliminando los valores e&tremos.
$odemos decir que entre
0
45,-46
-
78,286
1
77,916
e.d., entre la m#s o menos una desviacin tpica de esa distribucin muestral de se
encontrar#n el 45,-46 de las medias muestrales de la distribucin muestral de medias.
$ara traba'ar ba'o la curva normal +ay que +ablar de unidades :, que se estandarian
para la distribucin muestral de medias,
& ; ;
: < ;;;;;; < : < ;;;;;;;;
(
P ( - Z
< < + Z
) = Nc Ns
:o
nos dar# la distancia m#&ima entre y . : depende del nivel de confiana
dado.
Conociendo el error tpico del estadstico en la distribucin muestral, el intervalo ser# el
producto del *c por dic+o error.
5. DISTRIBUCIN T DE STUDENT
Cuando las muestras son peque)as (n < 30) en la estimacin de medias deberemos
utiliar la distribucin t de (tudent, que depende del *s y de los grados de libertad. El intervalo
viene dado por,
t
t = Z
La distribucin t correspondiente se aseme'a muc+o a la distribucin normal, y veremos
que se aplica una distribucin t de la misma manera en la que se +ace con una distribucin
normal.
Caractersticas:
0. >ay una familia de distribucin t (una distinta para cada valor de n!.
-. Cada curva t es simtrica a los dos lados de ..
1. < .3
-
es algo superior a 0
2. el punto m#s alto de la curva viene dado por t < ..
8. ?ebe calcularse la puntuacin t para traba'ar con la distribucin t,
;
t < ;;;;;;;;
< ;;;;;;;
n
4. El #rea ba'o la curva es igual a 0.
9. $ara la estimacin intervalar la frmula ser#,
t
P ( - t
< < + t
) = Nc Ns
t
x
2
= ----------- = ------
fe fe
* variabIes nominaIes u ordinaIes
* siempre positivo
* no tiene un Imite superior
* 0 => independencia estadstica
Test deI chi-cuadrado
Se trata de Ia prueba de independencia bsica para podernos asegurar Ia
existencia o inexistencia de asociacin entre Ias variabIes de Ia tabIa.
Rue &
-
tenga un valor distinto a . indica que e&iste asociacin, pero podemos
cuantificarla me'or si recurrimos a un coeficiente de asociacin estandariado.
0. >. , no +ay relacin entre las variables I >0 , s +ay relacin entre las variables
-. La prueba de &
-
es unilateral
1. *s < .,.8
2. Encontrar &
-
; posteriormente, para ver si este grado de asociacin es e&trapolable al
con'unto de la poblacin de la que e&tra'imos la muestra, realiamos el test del c+i;cuadrado.
5. Sera extrapoIabIe Ia asociacin observada para toda Ia pobIacin?
Se compara eI x
2
obtenido con eI de Ia tabIa, teniendo en cuenta que gI = (f-1) (c-1).
Si x
2
e > x
2
c => aceptamos H1; s es extrapoIabIe a Ia pobIacin.
Si x
2
e < x
2
c => aceptamos H0; eI grado de asociacin que habamos cuantificado es
apIicabIe sIo a Ia muestra utiIizada.
2. Coeficiente phi
&
-
&
-
-
< ;;;;;; < ;;;;
* *
* tabIas mismos tamao; 2 x 2, 4 x 4
* 1 => asociacin perfecta
* 0 => independencia estadstica
3. Coeficiente de contingencia C
&
-
C < ;;;;;;;;;;
&
-
L *
* tabIas mismos tamao; 2 x 2, 4 x 4
* vaIor mximo 1 => asociacin perfecta
* 0 => independencia estadstica
Tna ve +allado para una interpretacin correcta +a de compararse con el valor m#&imo
de C.
P ; -
Cma& < ;;;;;;; P < n@ de filas o columnas (el L ba'o!
P
Luego se divide CICma& y este es el valor que conviene e&plicar sobre su grado de
asociacin.
4. Coeficiente V de Cramer
&
-
K < ;;;;;;;;
* (P;0!
* Ia tabIa consta de distintos nmeros de fiIas y coIumnas
* 1 => asociacin perfecta
* 0 => independencia estadstica
6. PRUEBAS DE HIPTESIS O TEST DE ASOCIACIN PARA LAS DISTINTAS
MEDIDAS DE ASOCIACIN NOMINAL
/dem#s de comprobar la e&istencia de una asociacin y de medir su fuera, se puede
estar interesado en contrastar la e&istencia de una asociacin en la poblacin de la que se +a
e&trado la muestra.
El coeficiente de asociacin representa tan slo el grado de la asociacin, mientras
que la prueba de significacin de dic+o coeficiente determina para un nivel de probabilidad
previamente establecido, si la asociacin e&iste igualmente en la poblacin de la que se +a
e&trado la muestra.
Tema 6: MEDIDAS ASIMTRICAS DE ASOCIACIN NOMINAL
>ay una asociacin positiva entre las variables nivel de ingresos y educacin cuando
p.e. el individuo / tiene m#s educacin que Q por lo que se puede predecir que el nivel de
ingresos tendr# el mismo orden.
1. MEDIDAS DE ASOCIACIN BASADAS EN EL CRITERIO DE "REDUCCIN
PROPORCIONAL DE ERROR" (RPE)
Las medidas del tipo J$E consisten en simples cocientes de la cantidad de error
cometido al predecir la variable dependiente en dos situaciones,
0. la prediccin se realia cuando slo se conoce la distribucin de la propia
variable dependiente3
-. la prediccin se realia cuando se dispone del conocimiento adicional de una
variable independiente y la forma en que la variable dependiente se distribuye dentro de la
variable independiente.
Las medidas de tipo J$E formulan la proporcin en que se puede reducir el error
cometido en la primera de las situaciones descritas, al utiliar la informacin que suministra la
segunda de las situaciones.
2. EI coeficiente Lambda ( coeficiente gamma)
Como tiene carcter asimtrico Io primero es decidir qu variabIe vamos a tomar
como dependiente o independiente. Mide Ia capacidad de una variabIe independiente en
Ia prediccin de Ios vaIores de Ia variabIe dependiente.
La frmula para Lambda se puede e&presar en trminos de la reduccin proporcional en
el error cometido al predecir la moda,
my - My Moy/x - Moy
x,y = -------------- = -------------------
N - My N - Moy
Coy < frecuencia modal entre los totales de las filas (los m#s altos!
CoyI& < la suma de los valores m#s altos de cada columna
* variabIes nominaIes u ordinaIes
* tabIas de todo tipo
* 1 - asociacin perfecta < todos los casos en cada categora de la variable
independiente se concentran en una "nica categora (la categora modal! de la variable
dependiente.
A 0 = cuando la informacin suministrada por la variable independiente no a)ade ning"n
valor predictivo adicional a la prediccin de la moda de la variable dependiente.
(i < .,.1 indica que el conocimiento de la distribucin de la actividad laboral (variable
independiente! slo puede reducirnos en un 16 el error de prediccin sobre la categora modal
del GacuerdoIdesacuerdoG frente a la gravedad de las drogas. *os vuelve a confirmar el ba'o
nivel de asociacin entre las dos variables.
(e puede calcular luego al revs, cambiando la variable independiente por la
dependiente.
2. MEDIDAS DE ASOCIACIN PARA VARIABLES ORDINALES
Si se trata de dos variabIes ordinaIes, Io que se pretende conocer es si eI
ordenamiento de Ios casos en una variabIe resuIta tiI para Ia prediccin deI orden de
Ios casos en Ia otra variabIe. (i no es "til la medicin de asociacin ser# ..
2.1. Coeficiente rho de Spearman
* variabIes ordinaIes
* rs = 0 => no existe una ordenacin sistemtica entre dos variabIes; aunque pueda
existir asociacin
* rs = -1 => ordenacin opuesta de Ios casos en Ias variabIes; reIacin inversa
* rs = +1 => acopIamiento perfecto de Ias dos ordenaciones; no tiene porqu ser
causaI
6d
2
rs = 1 - ------------
n (n2 - 1)
Si rsc rse => se rechaza H0 de Ia no asociacin en Ia pobIacin de Ias dos
variabIes.
Si rsc rse => se acepta H1.
Tema 7: MEDIDAS DE ASOCIACIN PARA VARIABLES DE
INTERVALO
/l estudiar el tipo de relacin e&istente entre dos variables de intervalo aparecen dos
conceptos que conviene diferenciar,
se trata de analiar el grado de correIacin (o grado de asociacin! entre las
dos variables, lo cual remite al estudio de la variacin con'unta de dos variables, su
intensidad y direccin3
aparece el problema de la regresin o prediccin de los resultados en una de
las dos variables, conocidos los resultados de la otra.
/l tratarse de variables de intervalo, la media aritmtica cobra gran valor, pues como
recordamos, la media puede utiliarse como valor predictivo, ya que una de sus propiedades es
que la suma de las desviaciones de cada puntuacin en relacin a la media es ..
1. ECUACIONES DE REGRESIN LINEAL
(iempre que se disponga de dos variables medidas al nivel de intervalo se debe tratar de
definir la funcin que relaciona a ambas variables, tratando de especificar la forma y el
significado de dic+a funcin.
La reIacin IineaI entre dos variabIes de intervaIo se da cuando a cada aumento
unitario de Ios vaIores de una variabIe se produce un incremento constante de Ios
vaIores de Ia otra. *o siempre el tipo de relacin e&istente entre dos variables es tan sencillo
como en este caso, y aparecen las relaciones curvilneas.
La ventaja principaI deI anIisis de regresin estriba en que resume en una
expresin simpIe gran cantidad de informacin y permite a Ia vez conocer o predecir Ios
vaIores que tomar Ia variabIe dependiente supuestos Ios vaIores de Ia independiente.
1.1. ReIacin entre dos variabIes estadsticas: ecuacin de una recta
En sociologa la mayor parte de las relaciones empricas conocidas son simples y de tipo
lineal. La ecuacin de una recta es,
y = a + bx
a < ordenada en eI origen3 indica el punto donde la recta de regresin corta el e'e de las
ordenadas o el valor de MyM cuando M&M vale .
b < coeficiente anguIar o pendiente de Ia recta3 representa la cuanta en que vara MyM
cuando M&M vara en una unidad.
Si b = positivo => Ia recta es creciente; 'x' crece 'y' crece
Si b = negativo => Ia recta es decreciente; 'x' decrece 'y' crece
Si b = 0 => no existe reIacin entre 'x' e 'y'.
Tna ve +allada la ecuacin de regresin se pueden predecir los distintos valores MyM
sustituyendo M&M por alg"n n"mero.
1.2. La ecuacin de regresin y eI ajuste por mnimos cuadrados.
Error tpico de Ia estimacin
Con los valores de M&M y las medias MyM en unos e'es, se obtendr# una representacin que
puede ser lineal o curvilnea, de las medias de MyM para cada valor de M&M en forma de una
ecuacin de regresin de MyM en M&M.
Estas ecuaciones de regresin son las GleyesG de la ciencia, ya que una ve conocida la
e&presin matem#tica que describe la forma y direccin de la lnea o curva de las medias, se
pueden realiar predicciones e&actas.
Aunque en reaIidad muchos datos se encuentran dispersos, eI conjunto de todos
eIIos se sueIe adaptar bastante bien aIrededor de Ia Inea de regresin. EI probIema
consiste en ajustar Ia Inea de regresin de taI forma que se ajuste Io mejor posibIe a Ios
datos.
$ara comprobar qu ecuacin predice con mayor e&actitud los valores de MyM en M&M se
sigue el criterio de estimacin de Ia varianza,
(S ; SM!
-
< (
-
y& < ;;;;;;;;;;;;;;
* ; -
SM < valor calculado de MyM aplicando la ecuacin de prediccin.
La ecuacin que realia la me'or prediccin es la Inea de regresin de mnimos
cuadrados de MyM en M&M, que se caracteria por +acer mnimo el error tpico de Ia estimacin
que es (e
-
. (e basa en que la suma de las desviaciones al cuadrado de las puntuaciones
alrededor de la recta es la m#s peque)a de todas las rectas consideradas.
$ara obtener la lnea de los mnimos cuadrados +ay que calcular a y b,
(&;&! (y ; y! (&y
b < ;;;;;;;;;;;;;;;;;;; < ;;;;;
(&;&!
-
(&
-
2. TEST DEL COEFICIENTE DE REGRESIN
(e utilia para comprobar la >. de si el coeficiente de regresin MbM de la ecuacin
obtenida con los datos de una muestra sacada al aar de una poblacin determinada, difiere
significativamente de los valores prefi'ados del coeficiente correspondiente en la poblacin.
Los pasos a seguir son los mismos que en cualquier prueba de +iptesis.
(e pueden usar indistintamente las dos siguientes frmulas,
b ;
0. t < ;;;;;;; *;- r
-
< coeficiente de determinacin
0 ; r
-
b ;
-. t < ;;;;;;; *;- (yI& < error tpico de estimacin
(yI&I(y
(e utilia la distribucin t de (tudent3 para gl < * ; - de manera unilateral si aparecen los
signos H o = y bilateral si aparece < o .
3. COEFICIENTE R DE CORRELACIN DE PEARSON
Los socilogos est#n muy interesados en encontrar variables que estn fuertemente
asociadas con otra variable dependiente. El an#lisis de regresin pasa a un segundo plano,
cediendo la prioridad al estudio del grado de asociacin o correlacin entre las variables.
* variabIes de intervaIo (simpIificar tabIas para cada fiIa con medias Xcmc x n : N)
* mide Ia cantidad de dispersin en reIacin a Ia ecuacin IineaI de mnimos
cuadrados
* r = -1 => asociacin perfecta negativa; 'x' crece 'y' decrece - b = negativo
* r = +1 => asociacin perfecta positiva; 'x' crece 'y' crece - b = positivo
* r = 0 => no es sIo ausencia totaI de reIacin, ya que 'x' e 'y' pueden estar
fuertemente asociadas de forma curviInea - b = 0
/ntes de calcular r es aconse'able representar en un sistema cartesiano los valores de M&M
e MyM, para ver si su distribucin se apro&ima a lo lineal o a lo curvilneo, y realiar un primer
e&#men visual del tipo de asociacin.
VER FOTOCOPIA ANEXA
3.1. Diversas frmuIas para eI cIcuIo de r
?e lo que se trata es de e&plicar el m#&imo posible de variacin (< suma de los
cuadrados de las desviaciones en relacin a la media!, siendo el cuadrado del coeficiente de
correlacin de $earson, r
2
, llamado coeficiente de determinacin, una e&presin del grado en
que la ecuacin de regresin lineal e&plica la variacin en la variable dependiente. r
2
e&presa la
rpe cometida al predecir los valores para la variable dependiente a partir de la ecuacin de
regresin.
/ partir de r se puede conocer tanto la direccin como el grado o fuera de la asociacin,
aunque es sensible a la presencia de unos pocos valores e&tremos en una o en la dos
variables. $or ello +ay que considerar la variabilidad total de M&M e MyM antes de realiar una
afirmacin acerca del grado de correlacin.
3.2. Interpretacin deI coeficiente de correIacin
r
2
es Ia proporcin de Ia variacin totaI en una variabIe que queda expIicada por Ia
otra. *o e&iste una interpretacin sencilla y directa para el propio coeficiente r3 p.e. si r < .,4
puede parecer que representa una buena correlacin, cuando en realidad slo se est#
e&plicando (.,4!
-
< .,14, e.d., el 14 6 de la variana. La correlacin con r .,1 slo e&plica una
peque)a proporcin de la variacin.
EI coeficiente r de Pearson es Ia mejor medida de Ia fuerza y direccin de Ia
asociacin, siendo una medida estandarizada de Ia covarianza por eI producto de Ias
varianzas.
0. >allar las medias de M&M e MyM
-. >ay varias frmulas para +allar b.
1. ?espus se puede +allar la recta de regresin de 'x' sobre 'y'
y = a + bx / a = y - bx
Bambin e&iste la recta de regresin de 'y' sobre 'x': x = a + b' y
2. Sa puede calcularse, r = b b'
(i r < .,2- esto indica que la relacin es moderadamente ba'a entre M&M e MyM.
8. r
-
< .,0942 ; slo el 09,426 de la variana con'unta es e&plicada por la variable
independiente.
La representacin gr#fica de & < a L bMy as como y < a L b& nos indica la correlacin,
no e&iste correlacin3 M&M e MyM no son variables independientes.
La correlacin perfecta se produce cuando ambas rectas se superponen y el #ngulo <
..
Correlacin dbil Correlacin fuerte
4. TEST PARA EL COEFICIENTE DE CORRELACIN R. IntervaIo R en Ia pobIacin
Cuando los pares de valores de las variables M&M e MyM pertenecen a una muestra aleatoria
e&trada de una poblacin determinada, el inters se puede centrar en la comprobacin de si
e&iste o no correlacin en la poblacin.
(e estudiar# la >. de no e&istencia de relacin lineal en la poblacin, lo que conduce a
la utiliacin de un an#lisis de variana para contrastar la +iptesis de r < ..
FrmuIa: r
t < ;;;;;;;;;; * ; -
0 ; r-
$ara * ; - grados de libertad (ver tablas de valores MrM a *s .,.8 y .,.0!
Estimacin deI intervaIo para eI coeficente R de Pearson
Ormula, : 0,74 ..............................*c < 78 6
: -,85 ..............................*c < 77 6
0
Error tpico del coeficiente : de Ois+er, < ;;;;;;;;
n ; 1
0. $asar valores de r a unidades : seg"n tablas.
-. (e traba'ar# con la unidad : para la creacin del intervalo seg"n frmulas indicadas.
1. (e volver# a transformar : en r seg"n tablas del punto0.
Tema 8: ELABORACIN DE LA RELACIN ENTRE DOS VARIABLES
/l comparar el tipo de relacin que aparece entre las dos variables originales en cada
una de las subpoblaciones definidas al introducir una o mas variables, se pueden e&traer
consecuencias interesantes acerca del efecto de tales variables en la relacin b#sica original.
Esta forma de an#lisis se denomina eIaboracin de la relacin entre dos variables, cuyo gran
metodlogo fue Laarsfeld.
La necesidad de introducir terceras variables en el estudio de la relacin entre dos
variables, se fundamenta en el car#cter multidimensional de muc+os fenmenos sociales.
Las variables sociolgicas se suelen presentar Gen bloqueG3 cada individuo o grupo social
puede describirse en trminos de un n"mero determinado de dimensiones. /s, al describir a
un individuo sobre el tipo de ocupacin en relacin a situacin familiar, conviene introducir otras
variables como nivel de educacin, religiosidad, etc.
1. LA INTERPRETACIN DE LAS RELACIONES ESTADSTICAS: UN EJEMPLO DE
ELABORACIN
Los resultados que aparecen al establecer relaciones significativas entre dos variables,
tienen un car#cter e&clusivamente descriptivo. $ero estos resultados no indican porqu ocurren
algunas cosas, p.e. porqu los m#s religiosos suelen ser m#s conservadores.
En lugar de especular introduciremos una tercera variable llamada variabIe de controI o
factor de prueba en la relacin bivariable original. Esto es en esencia la eIaboracin.
/s tratamos de saber si la relacin entre una variable independiente M&M y una
dependiente MyM se debe a la variable de control MBM. (i el valor de las nuevas relaciones
bivariables disminuyera sensiblemente sera una prueba de que MBM es en realidad la
GresponsableG de la relacin original entre M&M e MyM.
/s, p.e., si analiamos la intencin de voto de mu'eres y +ombres podemos decir que los
+ombres votan m#s a la iquierda. /l introducir el factor de prueba Mtraba'oIno traba'oM, se
producen unas nuevas tabIas condicionaIes o asociacin de contingencia.
HabIamos aI considerar una soIa variabIe de controI de tabIas condicionaIes de
primer orden; cuando son dos variabIes de controI, tabIas condicionaIes de segundo
orden, etc.
1.1. FrmuIa de recuento de LazarsfeId
AI introducirse T entre Ia reIacin XY se producen nuevas reIaciones y aparecen
dos tabIas condicionaIes que se simboIizan como (XY;T) y (XY;T') - reIaciones parciaIes.
Las reIaciones marginaIes son las relaciones entre B y la variable independiente M&M y la
dependiente MyM.
(eg"n Laarsfeld las nuevas relaciones resultantes al introducir B, pueden igualarse en
la relacin original del siguiente modo,
(XY) = (XY;T) (XY;T') (XT) (YT)
no es una suma aritmtica sino una ecuacin que GformaliaG las cone&iones mutuas
que se producen entre diversas relaciones.
Tna situacin interesante se da cuando el factor de prueba no est# relacionado con las
variables originales y las relaciones marginales valen .3 se trata de una ecuacin tipo P o
parciaI, porque la relacin original depende de las relaciones parciales,
a) (XY) = (XY;T) (XY;T') + (0) (YT)
b) (XY) = (XY;T) (XY;T') + (XT) (0)
La ecuacin tipo M o marginaI es cuando desaparecen las relaciones parciales y la
relacin original es igual a los trminos marginales3 depende de las relaciones marginales que
se establecen entre las tres variables3
(XY) = 0 + 0 + (XT) (YT)
2. EL PAPEL DE LA TEORA EN LA ELABORACIN DE RELACIONES ENTRE
VARIABLES
En la pr#ctica apenas encontramos casos puros de los tipos $ y C. Las diferencias entre
los tipos $ y C ponen de relieve que no todas las variables de control tienen el mismo
significado e interpretacin terica.
La teora es importante para seleccionar las relaciones originales y variables de control
m#s relevantes3 slo con 8 variables se puede +acer infinidad de tablas, por lo que es
fundamental definir las relaciones importantes.
Es importante el lugar que ocupa la variable de control,
variabIe antecedente, antecede a las variables independientes y
dependientes.
variabIe consecuente, sus efectos se producen despus de las variables
dependiente e independiente.
variabIe interviniente, act"a antes de la variable dependiente, pero despus
de la independiente.
La interpretacin terica de Ios resuItados ser diferente segn eI orden en eI que
acte Ia variabIe de controI aI incidir en Ia reIacin originaI.
3. MODELOS DE ELABORACIN
Los tres modelos de elaboracin m#s frecuentes en la investigacin social son,
1. La especificacin de una reIacin entre dos variabIes
Jesponde al tipo $ parcial de elaboracin. Biene lugar cuando se trata de conocer el
tama)o relativo de las relaciones parciales, con el fin de especificar las circunstancias ba'o las
cuales la relacin original es m#s o menos pronunciada.
En el caso tpico, la especificacin tiene lugar cuando al introducir la variable de control,
las relaciones condicionales que aparecen, aun sin alterar b#sicamente el sentido de la relacin
original, presentan unos resultados que varan de unas tablas a otras, revelando diversos
matices de la relacin original3 p.e. edad ; deporte ; B, nivel educativo.
2. La expIicacin de una reIacin entre dos variabIes
>ay casos en que Ia reIacin entre dos variabIes es faIsa, ya que no es significativa
sino que m#s bien se debe a una relacin accidental con una variable asociada3 aparece una
relacin asimtrica, que en realidad es simtrica. El socilogo cuando ve una relacin entre dos
variables se pregunta si realmente es significativa.
La e&plicacin es un tipo de elaboracin que pretende controlar los factores que invalidan
la relacin que sospec+amos es falsa. (er#n siempre raones tericas las que impulsen a
buscar terceras variables que al introducirse en la relacin original que creemos falsa crear#n
tablas condicionales en las que desaparecer# la relacin original. Ello se debe a que la variable
de control se encuentra asociada a las dos variables originales. /l mantener constante los
valores de la variable de control desaparece la relacin original. *o e&isten relaciones falsas,
sino interpretaciones falsas. $.e., inmigracin de las cigue)as L ni)os. (i introducimos la
variable ona ruralIurbana la relacin original desaparece. La variabIe interviniente es ajena.
3. La interpretacin de una reIacin entre dos variabIes
La introduccin de variables de control puede ofrecer otra venta'a terica, que es la de
contribuir a estabIecer secuencias causaIes. $or ello, cuando se encuentra una relacin
original significativa que no satisface tericamente, se producir# una interpretacin de dic+o
resultado, si se logra encontrar una tercera variable de car#cter interviniente, e.d., que sea
consecuencia de la variable independiente y determinante de la variable dependiente, que
altere el primer resultado, reduciendo sensiblemente la asimetra de la relacin original. En este
caso la variable interviniente no es a'ena, p.e. clase social ; intencin de voto ; B, inters por la
poltica.
4. VARIABLES SUPRESORAS Y VARIABLES TRANSFORMADORAS
Bambin resulta de inters comprobar si la falta de relacin entre dos variables es real o
se debe, por el contrario, a la e&istencia de una tercera variable que suprime la manifestacin
de una asociacin entre las dos variables originales <= variabIe supresora. p.e., control de
natalidad ; status socioeconmico B, ir o no a misa.
En el caso de la variabIe transformadora la introduccin del factor de prueba crea unas
tablas condicionales en la que el sentido de la relacin es de signo contrario al que tena la
relacin original. p.e. status socioeconmico ; centralismo B, poblacin inmigranteIoriunda.
Tema 9: EL ANLISIS MULTIVARIABLE EN LA INVESTIGACIN
SOCIOLGICA
El mtodo de elaboracin de la relacin entre dos variables que trata de solucionar los
problemas cuando se introduce una variable de control es pr#cticamente inviable cuando se
consideran los efectos de 1 o 2 variables de control.
%racias a los ordenadores se +a facilitado los comple'os c#lculos y en la actualidad se
efect"an tratamientos analticos con 8 o m#s variables. E&istan amplias encuestas sociales
que posteriormente eran tratadas a nivel bi y trivariable.
La ausencia de leyes sociales invariables es notoria y buena parte de la investigacin
social contin"a siendo de naturalea emprica, e&ploratoria o inductiva. El ordenador se utilia
para analiar, seleccionar, almacenar, clasificar y procesar datos sobre actitudes, opiniones,
valores y comportamientos que provienen de encuestas.
1. DEFINICIN DEL ANLISIS MULTIVARIABLE
(eg"n Nendall el rasgo m#s caracterstico es Gla consideracin de una serie MuM de
ob'etos en cada uno de los cuales se observan los valores de MpM variables. Es Ia rama de Ia
estadstica interesada en eI estudio de Ias reIaciones entre series de variabIes
dependientes y de Ios individuos que Ias sustentan".
Los ob'etos que se persiguen m#s importantes son,
0. (implificacin estructural
-. Clasificacin en grupos
1. /grupamiento de variables
2. /n#lisis de la interdependencia
8. /n#lisis de la dependencia
4. Construccin y contraste de +iptesis
Cualquier an#lisis simult#neo de m#s de dos variables forma parte del an#lisis
multivariable.
Biene varias venta'as sobre el an#lisis bivariable,
A economa en el almacenamiento de los datos3
A mayor consistencia en la inferencia estadstica3
A desarrollo de conceptos tericos m#s adecuados3
A mayor precisin y perspectiva conceptual.
Las tcnicas de an#lisis multivariable no son m#s que instrumentos que facilitan el
an#lisis de datos, pero poco pueden +acer por me'orar la calidad de los propios datos
sociolgicos.
2. NOCIONES ALGEBRAICAS ELEMENTALES EN LAS TCNICAS
MULTIVARIABLES
%eneralmente los datos suelen provenir de las encuestas, pero tambin pueden provenir
de cualquier otro tipo de fuentes primarias o secundarias, p.e. arc+ivos, censos.
La matriz generaI de datos es un cuadro con columnas y filas donde cada celdilla
contiene las respuestas. (e obtiene al distribuir la informacin en MnM filas y MmM columnas. La
regla convencional es incluir las variables en las columnas y las unidades individuales en filas.
El Igebra matriciaI se +a desarrollado con el ob'eto de representar en un lengua'e
sencillo y universal las operaciones que se realian con las matrices, dado que a veces
contienen un enorme n"mero de filas y columnas.
Las medidas resumen que se utilian en las matrices no son las medias de las variables,
sino las varianas y covarianas. / partir de la matri original se constituyen matrices de
varianzas y covarianzas, en las que los valores son covarianas.
Bambin se utilian matrices de correIacin, que no son otra cosa que matrices de
variana ; covariana estandariadas, e.d., en las que los valores de filas y columnas se +an
dividido por la desviacin tpica correspondiente.
3. CLASIFICACIN DE LAS TCNICAS DEL ANLISIS MULTIVARIABLE
%eneralmente se intenta expIicar variabIes, e.d., porqu una variable vara de la forma
en que lo +ace. La e&plicacin consiste en el +allago de un determinante o fuente, la variable
observada.
/ menudo +ay que referirse a variabIes no observadas, que en su forma m#s sencilla
se utilian cuando se supone que una variable observada est# sometida a error, y no es
perfectamente fiable. (e supone que +ay dos fuentes de error,
lo que se mide <= componente sistemtico
un componente aleatorio que se a)ade a lo que se mide <= componente de
error.
Ambos componentes son variabIes no observadas, pues no se conocen Ios
vaIores que toman. *tese que son construcciones tericas, pues surgen de una teora o de
una interpretacin de la variable observada.
El an#lisis multivariable se divide en dos grandes ramas,
tcnicas basadas en reIaciones de dependencia: establecen una distincin
entre las variables a e&plicar (< dependientes, endgenas! y las variables e&plicativas (<
independientes, e&genas!. Bienen por ob'eto establecer la relacin entre las variables
como base para realiar una prediccin.
tcnicas basadas en reIaciones de interdependencia: no establecen
diferenciacin. El ob'eto principal es el de organiar los datos de forma que sean m#s
mane'ables para el investigador y ofrecan una mayor comprensin global.
La denominacin de tcnicas R se basa en la correlacin entre variables y la tcnica Q
en la correlacin entre unidades u ob'etos. /s, una misma tcnica multivariable puede
emplearse en su versin J o R a una matri, cuyos valores son unidades o variables.