Sei sulla pagina 1di 7

Escuela Profesional de Sociologa

Estadstica Social
Ms. Marcos Obando Aguirre

1

Prueba de diferencia de medias aritmticas
La prueba de diferencia de medias aritmticas, constituye una prueba estadstica muy fuerte,
diseada para establecer diferencias significativas entre dos grupos. La formulacin lgica de esta
prueba se encuentra en la relacin de causalidad, a travs de la cual las diferencias entre dos
grupos se explican por la accin de una segunda variable, independiente, que es la causa que
origina la diferencia. Para mejor comprender, observemos la siguiente situacin:
1. Una variable, nivel de instruccin, da origen a dos clases de individuos: (con alta
instruccin / con baja instruccin)
2. Una segunda variable, ingreso, se considera diferente segn el nivel de instruccin. Se
formula la siguiente proposicin: el ingreso que obtiene una persona, ser mayor o
menor segn su nivel de instruccin sea alto o bajo.
Sociolgicamente formulamos la proposicin de que las personas que han tenido acceso a mejores
condiciones educativas, tendrn mayores oportunidades de alcanzar niveles de ingreso elevados.
Por tanto el nivel educativo es la variable que determina que las personas logren mejores ingresos.
Desde el punto de vista del diseo metodolgico, tenemos una variable cuantitativa (ingreso)
medida en escala de razn, que se mide por separado en dos grupos poblacionales distintos
(individuos con alta instruccin e individuos con baja instruccin); si efectivamente verificamos la
diferencia en el sentido propuesto por nosotros, entonces estamos validando nuestra proposicin
que indica que el nivel de instruccin es un elementos determinante del nivel de ingreso.
Para comprender mejor esta prueba, desarrollaremos un ejemplo prctico a partir de la encuesta
realizada por los estudiantes en cabinas de internet:
Formulamos una hiptesis en investigacin
1
, en los siguientes trminos:
Los jvenes refuerzan sus interacciones sociales en la etapa en que adquieren mayores niveles
de auto reconocimiento y de relacin con los dems (alteridad). Esto ocurre en mayor medida
entre los 15 y 19 aos de edad, momento en el cual los jvenes amplan sus posibilidades de
consolidar su identidad personal, a la vez que se sienten impulsados a incrementar sus contactos
con otros jvenes. En esta tarea los varones se muestran ms activos que las mujeres y por
tanto ms dispuestos para permanecer y actuar en espacios pblicos
Una manera de constatar si esta proposicin (hiptesis de trabajo) es verdadera, es mediante una
prueba estadstica. Para ello, es necesario tener claro qu variables se van a medir y qu tipo de
indicadores se deben utilizar. En la proposicin anterior, interesan las variables: sexo de los
jvenes y presencia en espacios pblicos. En el primer caso la medicin es a travs de conformar
dos grupos segn el joven sea mujer o varn, por tanto el indicador ser simplemente el nmero
de jvenes en ambos sexos. En el segundo caso, se escoge como indicador el tiempo semanal de

1
Las hiptesis de investigacin constituyen proposiciones, que los investigadores formulan con relacin a la
manera como se relacionan las variables que conforman una determinada situacin problemtica.
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

2

consumo de internet en cabinas
2
. Para ello utilizaremos la encuesta a jvenes que acceden a
internet en cabinas y que fue levantada por los estudiantes en el mes de octubre de 2009.
Para probar la veracidad de la hiptesis de trabajo consideramos lo siguiente: Si realmente existe
una diferencia en la permanencia en el espacio pblico de internet entre jvenes mujeres y
varones, cuyas edades fluctan entre 15 y 19 aos, esta diferencia se visualizar en el tiempo de
uso de internet. As, se espera que los jvenes varones consuman, en promedio, ms tiempo de
internet que las mujeres. En trminos estadsticos, se trata de comparar el promedio de horas de
uso de internet de mujeres y de varones. Si nuestra proposicin es correcta el promedio de horas
de los varones debe ser mayor que el de las mujeres. Si ocurre que no hay diferencia entre estos
promedios, nuestra proposicin no se podr validar. En este momento estamos en condiciones de
iniciar el proceso de una prueba de hiptesis estadstica.
Primer paso del protocolo de las hiptesis estadsticas. Los supuestos. En el caso especfico de la
prueba de diferencia de medias aritmticas, los supuestos son:
1. Muestras aleatorias. Estamos en condiciones de asegurar que los datos que se analizan
provienen de muestras aleatoriamente seleccionadas e independientes, en este caso
estamos considerando la existencia de dos muestras, puesto que son dos grupos los que
se comparan: varones y mujeres con independencia entre ellos.
2. Se debe asumir tambin igualdad entre varianzas. Este supuesto consiste en asumir que
las varianzas de los grupos que se comparan son aproximadamente iguales. No obstante,
no siempre ocurre que se pueda sostener esta igualdad, sobre todo cuando se realiza la
prueba en forma manual; en esta situacin, resulta complicado tener evidencia estadstica
para determinar la igualdad o diferencia de las varianzas, tendremos que basarnos en una
apreciacin visual de las varianzas entre ambos grupos, verificando que no existan
diferencias pronunciadas entre ellas. Cmo veremos luego, si el clculo de la prueba se
realiza mediante el SPSS, tendremos la facilidad de contar con una prueba que permite
decidir sobre la igualdad o diferencia de varianzas.
3. La hiptesis de nulidad (H
0
) se expresa como nulidad de diferencia de medias aritmticas.
En trminos formales,

, que se lee como: media aritmtica del primer grupo igual


a la media aritmtica del segundo grupo. Se entiende por tanto que la hiptesis alterna
(H
1
), expresa que las medias aritmticas no son iguales:

.
Segundo paso del protocolo, eleccin de la prueba estadstica. Como estamos comparando
medias aritmticas de dos grupos (varones y mujeres), la prueba estadstica apropiada es la
Prueba de Diferencia de Medias Aritmticas. La distribucin de muestreo asociada a esta
prueba es la distribucin t de Student.

2
Este indicador se fundamenta en el hecho de que los jvenes, actualmente, tienen en el espacio virtual de
internet, un medio muy utilizado y con bajas barreras de acceso, para establecer vinculaciones entre ellos;
siendo adems relativamente fcil obtener datos sobre el nmero de horas de consumo de este servicio.
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

3

Tercer paso del protocolo, eleccin del nivel de significacin. El nivel de significacin es el error ,
es decir, el error que se comete cuando se rechaza una hiptesis que es verdadera, deseamos que
este error sea pequeo para lograr mayor nivel de confianza en la decisin final; por lo general, la
H
1
se plantea simplemente como

, es decir, sin asumir de antemano si una de las dos


medias es mayor o menor que la otra, en estas circunstancias se estn usando ambas colas de la
curva, es decir, nuestra prueba ser bilateral. Los grados de libertad para esta prueba se calculan
sumando los tamaos de muestra de ambos grupos y restando 2. En trminos formales:
(gl = n
1
+ n
2
2).
Elegimos un nivel de significacin (n.s.) de 0.05, para una prueba de dos colas. Esto supone un
nivel de confianza del 95%.
Para calcular los grados de libertad consideramos el tamao de la muestra en ambos grupos, as:
Mujeres: n
1
= 105
Varones: n
2
= 129
gl = (105 + 129 2) = 232
Vemos en la tabla t, que para 0.05 de n.s. y 232 gl., el valor t es igual a: 1.96.
Cuarto paso del protocolo, clculo de la prueba. Para ello los datos requeridos son:
Grupo 1: Mujeres 15
a 19 aos
Grupo 2: Varones 15 a
19 aos
n
1
= 105 n
2
= 129
X
1
= 7.0 X
2
= 8.13
S
1
= 3.351 S
2
= 3.811
S
1
2

= 11.229 S
2
2
= 14.524

El procedimiento de clculo es complejo y probablemente el socilogo(a) no lo realice
manualmente y prefiera utilizar procesadores estadsticos; sin embargo, con propsito
demostrativo, vamos a exponer el procedimiento manual. Un primer paso es reconocer los
valores del cuadro anterior; tenemos all para ambos grupos, el tamao de la muestra (n), la media
aritmtica (

) y la desviacin estndar (S), para ambos grupos.


Las frmulas de la prueba de diferencias de medias aritmticas son:
=



Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

4

En donde:

= media aritmtica del tiempo consumido en internet por mujeres de 15 a 24 aos.

= media aritmtica del tiempo consumido en internet por varones de 15 a 24 aos.

= Error tpico combinado de ambos grupos


Para calcular

, bajo el supuesto de varianzas iguales, se consideran las siguientes frmulas


adicionales:


Aclaracin importante:
Esta frmula tiene plena aplicacin en el caso de haber calculado las desviaciones estndar en
cada grupo considerando en el denominador el factor n. En el caso que las desviaciones estndar
se calculen considerando en el denominador la expresin n 1, la frmula de

se convierte
en:


Como en este caso estamos utilizando valores de Desviacin estndar calculados con n 1 en el
denominador, nuestro clculo del error tpico combinado es:

=

105 11.229 + 129 14.524
105 + 129

105 + 129
105 129

= 0.475





Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

5













Reemplazamos estos valores en:
=
7 8.13
0.475
= 2.39
Quinto paso del protocolo, decisin. La decisin que se debe tomar es la aceptacin o rechazo de
la H
0
. Recordemos que esta hiptesis plantea que las medias aritmticas del tiempo consumido en
cabinas de internet por mujeres y varones, son iguales. Los datos obtenidos muestran que la
media aritmtica en mujeres (7 horas a la semana), es ligeramente menor a la media aritmtica en
varones (8.13 horas a la semana). El investigador desea descartar que esta diferencia sea slo
producto del azar y por el contrario desea estar razonablemente seguro de que es resultado de las
diferencias en intensidad de uso de internet determinadas por el sexo del joven.
Para ello, el investigador ha fijado ciertos criterios: nivel de significacin 0.05 para una prueba de
dos colas; para los grados de libertad que esta prueba tiene (232), el valor t = 1.96. Vemos que el
resultado se expresa en valores negativos t = -2.39, que est en la zona de rechazo de la H
0
; en
consecuencia tenemos que aceptar que el promedio de horas que el grupo de mujeres emplea es
menor que el empleado por los varones.

1
+

=
11.229
105
+
14.524
129
= 0.469
Para calcular

, bajo el supuesto de varianzas no iguales, se consideran las siguientes


frmulas:
Tambin aqu debe tenerse en cuenta la manera cmo se ha calculado S. Si en este clculo se ha
utilizado n 1 en el denominador la frmula del error tpico combinado queda:
Por tanto, nuestro error tpico combinado en el supuesto de varianzas no iguales es:
Este ltimo procedimiento, se emplear nicamente en el caso de tener la certeza de que las
varianzas no cumplen el supuesto de igualdad.
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

6


En los trminos de la hiptesis de trabajo inicial, el investigador expresa su decisin de la siguiente
manera: Con 95% de confianza, podemos afirmar que el promedio de horas de consumo de
internet en cabinas de mujeres entre 15 y 19 aos, ser inferior al promedio de consumo de
varones de la misma edad. Por tanto podemos sostener que los varones en las edades
sealadas, tienen mayor presencia en el espacio pblico que facilita internet.
Para que el estudiante reconozca un reporte SPSS de esta prueba, lo incluimos a continuacin:
Group Statistics

SEXO DEL ENTREVISTADO N Mean Std. Deviation Std. Error Mean
TIEMPO A LA SEMANA DE USO DE INTERNET MUJER 105 7,00 3,351 ,327
VARN 129 8,13 3,811 ,336

Independent Samples Test

Levene's Test
for Equality of
Variances t-test for Equality of Means

95% Confidence Interval of the Difference
F Sig. t df
Sig.
(2-
tailed)
Mean
Difference
Std. Error
Difference Lower Upper
TIEMPO A
LA
SEMANA
DE USO
DE
INTERNET
Equal
variances
assumed
1,165 ,281 -2,384 232 ,018 -1,132 ,475 -2,067 -,196
Equal
variances
not
assumed

-2,416 230,586 ,016 -1,132 ,469 -2,055 -,209

En el primer panel, SPSS entrega los valores de tamao de muestra (N); media aritmtica (Mean);
Desviacin Estndar (Std. Deviation); error estndar de la media (Std. Error Mean). Adems el
cuadro muestra estos valores para ambos grupos, mujeres y varones.
En el segundo panel, se aprecia en primer lugar el test de igualdad de varianzas. Para decidir si
estamos ante varianzas iguales o diferentes, se mira la columna Sig.; en este caso vemos que en la
primera lnea (varianzas iguales), el valor Sig. es 0.281. Por ser este un valor de significacin muy
elevado (mayor a 0.05), no podemos rechazar la situacin de varianzas iguales, en consecuencia
Zona de aceptacin de H0
-1.96 -2.39
Zona de rechazo
de H0
1.96
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre

7

aceptamos que las varianzas son iguales y nos interesa slo la fila correspondiente, pintada en
color naranja.
Luego observamos los valores de la prueba t (t-test for Equality of Means), all vemos que el valor t
es -2.384 (nuestro clculo manual obtuvo -2.39); el segundo elemento a observar es el casillero
Sig., en este caso el valor reportado es 0.018. Todo valor igual o inferior a 0.05, permite rechazar la
H
0
, por tanto, rechazamos que las medias aritmticas sean iguales y aceptamos que son
diferentes, adems como el valor t es de signo negativo (-2.384), concluimos que el tiempo
promedio empleado por mujeres es inferior al tiempo promedio empleado por varones, con lo que
se valida nuestra hiptesis de investigacin. Adems el valor Sig. reportado de 0.018, permite
mayor precisin en el nivel de confianza, ya que estamos en posibilidad de rechazar H
0
, con un
nivel de confianza mayor al 95%, en realidad el 98.2%.

Potrebbero piacerti anche