Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica Social
Ms. Marcos Obando Aguirre
1
Prueba de diferencia de medias aritmticas
La prueba de diferencia de medias aritmticas, constituye una prueba estadstica muy fuerte,
diseada para establecer diferencias significativas entre dos grupos. La formulacin lgica de esta
prueba se encuentra en la relacin de causalidad, a travs de la cual las diferencias entre dos
grupos se explican por la accin de una segunda variable, independiente, que es la causa que
origina la diferencia. Para mejor comprender, observemos la siguiente situacin:
1. Una variable, nivel de instruccin, da origen a dos clases de individuos: (con alta
instruccin / con baja instruccin)
2. Una segunda variable, ingreso, se considera diferente segn el nivel de instruccin. Se
formula la siguiente proposicin: el ingreso que obtiene una persona, ser mayor o
menor segn su nivel de instruccin sea alto o bajo.
Sociolgicamente formulamos la proposicin de que las personas que han tenido acceso a mejores
condiciones educativas, tendrn mayores oportunidades de alcanzar niveles de ingreso elevados.
Por tanto el nivel educativo es la variable que determina que las personas logren mejores ingresos.
Desde el punto de vista del diseo metodolgico, tenemos una variable cuantitativa (ingreso)
medida en escala de razn, que se mide por separado en dos grupos poblacionales distintos
(individuos con alta instruccin e individuos con baja instruccin); si efectivamente verificamos la
diferencia en el sentido propuesto por nosotros, entonces estamos validando nuestra proposicin
que indica que el nivel de instruccin es un elementos determinante del nivel de ingreso.
Para comprender mejor esta prueba, desarrollaremos un ejemplo prctico a partir de la encuesta
realizada por los estudiantes en cabinas de internet:
Formulamos una hiptesis en investigacin
1
, en los siguientes trminos:
Los jvenes refuerzan sus interacciones sociales en la etapa en que adquieren mayores niveles
de auto reconocimiento y de relacin con los dems (alteridad). Esto ocurre en mayor medida
entre los 15 y 19 aos de edad, momento en el cual los jvenes amplan sus posibilidades de
consolidar su identidad personal, a la vez que se sienten impulsados a incrementar sus contactos
con otros jvenes. En esta tarea los varones se muestran ms activos que las mujeres y por
tanto ms dispuestos para permanecer y actuar en espacios pblicos
Una manera de constatar si esta proposicin (hiptesis de trabajo) es verdadera, es mediante una
prueba estadstica. Para ello, es necesario tener claro qu variables se van a medir y qu tipo de
indicadores se deben utilizar. En la proposicin anterior, interesan las variables: sexo de los
jvenes y presencia en espacios pblicos. En el primer caso la medicin es a travs de conformar
dos grupos segn el joven sea mujer o varn, por tanto el indicador ser simplemente el nmero
de jvenes en ambos sexos. En el segundo caso, se escoge como indicador el tiempo semanal de
1
Las hiptesis de investigacin constituyen proposiciones, que los investigadores formulan con relacin a la
manera como se relacionan las variables que conforman una determinada situacin problemtica.
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre
2
consumo de internet en cabinas
2
. Para ello utilizaremos la encuesta a jvenes que acceden a
internet en cabinas y que fue levantada por los estudiantes en el mes de octubre de 2009.
Para probar la veracidad de la hiptesis de trabajo consideramos lo siguiente: Si realmente existe
una diferencia en la permanencia en el espacio pblico de internet entre jvenes mujeres y
varones, cuyas edades fluctan entre 15 y 19 aos, esta diferencia se visualizar en el tiempo de
uso de internet. As, se espera que los jvenes varones consuman, en promedio, ms tiempo de
internet que las mujeres. En trminos estadsticos, se trata de comparar el promedio de horas de
uso de internet de mujeres y de varones. Si nuestra proposicin es correcta el promedio de horas
de los varones debe ser mayor que el de las mujeres. Si ocurre que no hay diferencia entre estos
promedios, nuestra proposicin no se podr validar. En este momento estamos en condiciones de
iniciar el proceso de una prueba de hiptesis estadstica.
Primer paso del protocolo de las hiptesis estadsticas. Los supuestos. En el caso especfico de la
prueba de diferencia de medias aritmticas, los supuestos son:
1. Muestras aleatorias. Estamos en condiciones de asegurar que los datos que se analizan
provienen de muestras aleatoriamente seleccionadas e independientes, en este caso
estamos considerando la existencia de dos muestras, puesto que son dos grupos los que
se comparan: varones y mujeres con independencia entre ellos.
2. Se debe asumir tambin igualdad entre varianzas. Este supuesto consiste en asumir que
las varianzas de los grupos que se comparan son aproximadamente iguales. No obstante,
no siempre ocurre que se pueda sostener esta igualdad, sobre todo cuando se realiza la
prueba en forma manual; en esta situacin, resulta complicado tener evidencia estadstica
para determinar la igualdad o diferencia de las varianzas, tendremos que basarnos en una
apreciacin visual de las varianzas entre ambos grupos, verificando que no existan
diferencias pronunciadas entre ellas. Cmo veremos luego, si el clculo de la prueba se
realiza mediante el SPSS, tendremos la facilidad de contar con una prueba que permite
decidir sobre la igualdad o diferencia de varianzas.
3. La hiptesis de nulidad (H
0
) se expresa como nulidad de diferencia de medias aritmticas.
En trminos formales,
.
Segundo paso del protocolo, eleccin de la prueba estadstica. Como estamos comparando
medias aritmticas de dos grupos (varones y mujeres), la prueba estadstica apropiada es la
Prueba de Diferencia de Medias Aritmticas. La distribucin de muestreo asociada a esta
prueba es la distribucin t de Student.
2
Este indicador se fundamenta en el hecho de que los jvenes, actualmente, tienen en el espacio virtual de
internet, un medio muy utilizado y con bajas barreras de acceso, para establecer vinculaciones entre ellos;
siendo adems relativamente fcil obtener datos sobre el nmero de horas de consumo de este servicio.
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre
3
Tercer paso del protocolo, eleccin del nivel de significacin. El nivel de significacin es el error ,
es decir, el error que se comete cuando se rechaza una hiptesis que es verdadera, deseamos que
este error sea pequeo para lograr mayor nivel de confianza en la decisin final; por lo general, la
H
1
se plantea simplemente como
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre
4
En donde:
Aclaracin importante:
Esta frmula tiene plena aplicacin en el caso de haber calculado las desviaciones estndar en
cada grupo considerando en el denominador el factor n. En el caso que las desviaciones estndar
se calculen considerando en el denominador la expresin n 1, la frmula de
se convierte
en:
Como en este caso estamos utilizando valores de Desviacin estndar calculados con n 1 en el
denominador, nuestro clculo del error tpico combinado es:
=
105 11.229 + 129 14.524
105 + 129
105 + 129
105 129
= 0.475
Escuela Profesional de Sociologa
Estadstica Social
Ms. Marcos Obando Aguirre
5
Reemplazamos estos valores en:
=
7 8.13
0.475
= 2.39
Quinto paso del protocolo, decisin. La decisin que se debe tomar es la aceptacin o rechazo de
la H
0
. Recordemos que esta hiptesis plantea que las medias aritmticas del tiempo consumido en
cabinas de internet por mujeres y varones, son iguales. Los datos obtenidos muestran que la
media aritmtica en mujeres (7 horas a la semana), es ligeramente menor a la media aritmtica en
varones (8.13 horas a la semana). El investigador desea descartar que esta diferencia sea slo
producto del azar y por el contrario desea estar razonablemente seguro de que es resultado de las
diferencias en intensidad de uso de internet determinadas por el sexo del joven.
Para ello, el investigador ha fijado ciertos criterios: nivel de significacin 0.05 para una prueba de
dos colas; para los grados de libertad que esta prueba tiene (232), el valor t = 1.96. Vemos que el
resultado se expresa en valores negativos t = -2.39, que est en la zona de rechazo de la H
0
; en
consecuencia tenemos que aceptar que el promedio de horas que el grupo de mujeres emplea es
menor que el empleado por los varones.
1
+
=
11.229
105
+
14.524
129
= 0.469
Para calcular