Sei sulla pagina 1di 9

Socioestadstica III - 2013

Sociologa - Vespertino
Profesor: Patricio Alcano Martnez
Gua de trabajo personal N1
Introduccin al contraste de hiptesis


Fundamentos de contraste de hiptesi s la prueba de Chi-cuadrado test de asociacin



Pruebas de hiptesis de independencia entre
variables categricas

Y se le ha dado al hombre el ms peligroso de los bienes, el lenguaje
para que muestre lo que es
(M. Heidegger)


I: Conceptos bsicos de contraste de hiptesis

1.1. Concepto de hiptesis estadstica
Una hiptesis es una suposicin, o un supuesto, con miras a explicar algo. Referida a la ciencia, es una generalizacin o
enunciado general que, en principio, supone una interpretacin de determinados hechos, y que adoptamos transitoriamente
como verdadera mientras la sometemos a confirmacin o refutacin.
1
Una hiptesis estadstica es aquella que cuenta con una distribucin de frecuencias (datos empricos) para proceder a su
contestacin que levar a su confirmacin o refutacin.


Ejemplo: el siguiente texto fue extrado de un informe de investigacin:
Existen evidencias que la mujer embarazada tiene un riesgo de maltrato ms alto que la mujer no embarazada,
afectando su capacidad reproductiva. Adems, se ha comprobado una baja deteccin de la violencia domstica en
los centros de salud en los que consulta la mujer.

De este prrafo es posible derivar las siguientes afirmaciones:

(1) La mujer embarazada tiene un riesgo de maltrato ms alto que la mujer no embarazada.
(2) El maltrato en la mujer embarazada afecta su capacidad reproductiva.
(3)Existe una baja deteccin de la violencia domstica en los centros de salud en los que consulta la mujer.

Mientras que las afirmaciones (1) y (2) constituyen genuinas hiptesis, la (3) no, ya que constituye ms bien un juicio. El
concepto de baja deteccin no permite su confirmacin o refutacin.




1
Corts Morat, J ordi - Martnez Riu, Antoni. Diccionario de filosofa. Empresa Editorial Herder S.A. 1996. ISBN 84-254-1991-3.
Gua N1-Socioestadstica III-2013
2
1.2. Contaste de hiptesis
Docimar, probar, testear o contrastar una hiptesis, consiste en someterla a un mecanismo estadstico para decidir, sobre la
base de las observaciones empricas, si se rechaza o no se rechaza.

El contraste de hiptesis tiene por fin, entonces:
Rechazar la hiptesis que se plantea; o bien:
NO rechazar la hiptesis planteada, ya que los datos presentados no son suficientes para rechazarla.

1.3. Riesgo de error
Cada vez que se decide acerca del rechazo o no de una hiptesis, existe riesgo de error:

1.3.1. Error tipo I: es aquel que se comete al rechazar una hiptesis (como si fuese falsa) siendo que es
verdadera.

1.3.2. Error tipo II: es el error que se comete cuando no se rechaza una hiptesis (como si fuese verdadera)
siendo que en realidad es falsa.

Estos errores estn SIEMPRE presentes en todo contraste de hiptesis.

1.4. Error y decisin estadstica


Decisin
La hiptesis es:
V F
Rechazar error I decisin correcta
No-rechazar decisin correcta error II

Los errores I y II estn relacionados inversamente. Al disminuir uno, aumenta el otro.
La nica manera de disminuirlos es aumentando el tamao de la muestra.


1.5. Nivel de significacin( )
Es el riesgo de cometer error del tipo I que el investigador asume para tomar una decisin acerca de una hiptesis. La
significacin se entiende como probabilidad, y frecuentemente se expresa como %.

Los ms usuales son: = 0,1 (10%); = 0,05 (5%) y = 0,01 (1%)

1.6. Hiptesis nula y alternativa:
Para realizar una dcima de hiptesis se plantean dos tipos de hiptesis:

1.6.1. Hiptesis Nula (H0)
Esta es una hiptesis instrumental, que se plantea como oposicin o complemento a la hiptesis que interesa.

1.6.2. Hiptesis alternativa (H1):
Es la hiptesis que se desea someter a contraste.

1.7. Estrategia del contraste de hiptesis
La estrategia del contraste de una hiptesis estadstica se puede resumir en los siguientes puntos:

1: Se adopta como hiptesis nula un modelo de probabilidad. Se asume que esta hiptesis es verdadera, hasta que
se pruebe lo contrario.
2: Con los datos empricos se calcula un estadstico de prueba.
3: Se compara el estadstico de prueba con el modelo terico.
4: Si el estadstico de prueba coincide con el modelo, significa que la hiptesis nula es verdadera.
5: Si el estadstico de prueba NO coincide con el modelo, significa que la hiptesis nula puede ser rechazada, a
favor de la hiptesis alternativa, con una probabilidad de error .
Gua N1-Socioestadstica III-2013
3

II: Contraste de hiptesis de independencia de variables categricas dicotmicas
con el estadstico Chi-cuadrado de Pearson

2.1. Introduccin:
En general, el test con la Chi-cuadrado se usa para contrastar la hiptesis de que dos variables categricas son
independientes, versus la alternativa de que estn asociadas, es decir, que no son independientes.
Uno de los casos ms frecuentes se da en el contraste con dos variables dicotmicas organizadas en tablas de contingencia
de 2x2.


2.2. Tabla:

Variable Y
Variable X
Total fila
+ -
+ a b n1
- c d n2
Total columna n3 n4 n

En donde:
X e Y: variables aleatorias con dos valores nominales dicotmicos.
a, b, c, d: frecuencias absolutas. N de casos observados.
n1, n2: suma de filas.
n3, n4: suma de columnas.
n = tamao de la muestra


2.3. Hiptesis

H0: X e Y son independientes.
H1: X e Y estn asociadas, no son independientes.

Para la hiptesis nula, se asume que las diferencias observadas empricamente (datos) son aleatorias y no constituyen
signos de asociacin entre las variables. La hiptesis alternativa, en tanto, asume la postura de que las diferencias
observadas son significativas y suficientes como para afirmar que las variables no son independientes entre s.
En este tipo de contraste, la hiptesis nula adopta como modelo la distribucin de probabilidad Chi-cuadrado (
2
).


2.4. Estadstico Chi-cuadrado de Pearson
Para los efectos de contrastar las hiptesis, se calcula el siguiente estadstico de prueba.


4 3 2 1
2
2
n n n n
n ) c b d a (
OBS


=


Cuando la hiptesis nula es verdadera, este estadstico sigue una distribucin Chi-cuadrado con 1 grado de libertad. En
tablas de contingencia de 2 x 2, siempre 1 = grado de libertad.






Gua N1-Socioestadstica III-2013
4

2.5. Valor p de la prueba ( * , p-value)
Para el caso del contraste de independencia con
2
, el valor p es la probabilidad de que el Chi-cuadrado tenga un valor
mayor al observado (figura 1).












Por ejemplo, si se trabaja con una significacin del 5%y con 1 gl, el valor de
2
es 3,84 (ver tabla).
Si la prueba da como resultado un estadstico observado 5,4, la probabilidad a la derecha de 5,4 es, 0,0201. Entonces, el
valor p de la prueba es 0,0201. Ver figura 2. Sin embargo, si el valor del chi-cuadrado de prueba es 2,2, el valor p es 0,1380.
Ver figura 3.



2.6. Regla de decisin:
A un nivel de significacin :
Rechazar H0 si < *
No rechazar en caso contrario

En la figura 2 se aprecia claramente, que si < * , el estadstico observado queda en la regin de rechazo de H0. En la
figura 3, > * , y el estadstico observado queda en la regin de NO rechazo de H0.



2.7. Especificaciones de la prueba:
Muestras independientes.
a, b, c y d 5 (se acepta, a lo ms, una sola celda con n = 4. (En general se acepta hasta un 20%de las celdas
con n < 5)
n 40
Si n 20 < 40, usar correccin de continuidad de Yates.
Si n < 20, usar Test exacto de Fischer.



2.8. Aplicaciones de la prueba
El contraste de independencia o asociacin con chi-cuadrado, solo puede concluir respecto de la asociacin o no entre las
dos variables, pero no puede establecer la direccin de dicha asociacin. Para establecer ese tipo de relaciones, se debe
complementar este anlisis con otros, como por ejemplo, el anlisis de correlacin.
Este contraste es muy utilizado en ciencias sociales para contrastar independencia, pues tiene la ventaja de poder aplicarse
en situaciones con variables cualitativas del tipo nominal. Toda vez que esta prueba trabaja con frecuencias observadas, es
posible inscribirlo en los mtodos cualitativos, llamados, ms propiamente, no paramtricos.





0

2
obs

2

*

Fig. 1
gl 1
4 5,
84 3, 0
2

05 0, =
0201 0, * =
Fig. 2
gl 1
2 2, 84 3, 0
2

05 0, =
1380 0, * =
Fig. 3
Gua N1-Socioestadstica III-2013
5

2.9. Ejemplos:
2.9.1. Satisfaccin con la vida y zona de residencia
Se encuesta a una muestra aleatoria de 33 personas que viven en zonas rurales y 47 en zonas urbanas, acerca de su grado
de satisfaccin con la vida, variable que fue dicotomizada en Alto Bajo.

Distribucin de personas segn grado de satisfaccin con la vida y zona de residencia.
satisfaccin
zona
Total
urbana rural
Alta 21 23 44
Baja 26 10 36
Total 47 33 80

Al 5%, est el grado de satisfaccin con la vida asociado a la zona de residencia?

Solucin:
H0: el grado de satisfaccin es independiente de la zona de residencia
H1: el grado de satisfaccin est asociado a la zona de residencia

Calculando el estadstico de prueba:
=


=
33 47 36 44
80 26 23 10 21
2
2
) (
obs
4,90

Calculando el p-value (fig. 4):

* = P(
2
1 ; p
> 4,90) 0,027 (segn tabla)

Decisin:
Como * < 0,05, se rechaza
0
H al 5%.


Conclusin: El grado de satisfaccin con la vida est significativamente asociado a la zona de residencia urbana o rural.

Nota: estas afirmaciones suelen ser acompaadas por el valor p de la prueba. En este caso sera as:
El grado de satisfaccin con la vida est significativamente asociado a la zona de residencia
urbana o rural (p =0,027).


2.9.2. Desercin escolar y zona de residencia
Un estudio ha llegado a la siguiente conclusin:
En la poblacin escolar de 7 y 8 ao, la desercin escolar est significativamente asociada a la zona (rural-urbana) de
residencia de los estudiantes (p = 0,0326).

1.- Cul es la hiptesis nula en este estudio?
2.- Cul fue la decisin estadstica en el contraste que llev a esta conclusin?
3.- De los niveles de significacin usuales, cul se us en este estudio?
4.- En qu consiste el error de tipo II en este estudio?

Solucin:
1.- La desercin escolar es independiente de la zona (rural-urbana) de residencia de los estudiantes.
2.- Se rechaz la hiptesis nula.
3.- Puede haber sido el 5%o el 10%.
4.- Aceptar que la desercin escolar es independiente de la zona de residencia de los estudiantes, siendo que es
falso.
0
9 4,
2

027 0, *
gl 1
Fig. 4
Gua N1-Socioestadstica III-2013
6
III: Test Chi-cuadrado para tablas de 2x2 con correccin de Yates

3.1. Correccin de continuidad de Yates
En el clculo de Chi cuadrado en tablas de 2x2 se usa la correccin de Yates cuando n 20 < 40, ya que el contraste de
hiptesis asume el tratamiento de un fenmeno discreto con un modelo de probabilidad continuo. En muestras mayores a 40
el efecto de esta aproximacin, aunque existe, se minimiza, pero en muestra ms pequeas la diferencia puede llegar a ser
clave en la decisin.

3.2. Clculo de Chi-cuadrado con correccin de continuidad de Yates
El clculo abreviado de
2
con correccin de Yates en tablas de 2x2 es el siguiente:

( )
4 3 2 1
2
2
5 0
n n n n
n n , c b d a


= ; siendo: x valor absoluto de x.

El procedimiento de contraste sigue los mismos pasos ya sealados para la prueba con
2
sin correccin de Yates.


3.3. Ejemplo
Se ha sugerido que en las personas que trabajan, el nivel de ingresos estara asociado a la estatura. Una breve investigacin
con una muestra aleatoria arroj los siguientes datos, en nmero de casos:

Estatura
Ingreso mensual
Total
Sobre la media Bajo la media
Alta 11 7 18
Baja 6 9 15
Total 17 16 33

Se pide realizar un test de la hiptesis del texto, con un nivel de significacin del 10%.

Solucin:

H0: Estatura e Ingreso son independientes.
H1: El Ingreso est asociado a la Estatura.

Calculando Chi-cuadrado con correccin de Yates:

[ ]
16 17 15 18
33 5 0 33 6 7 9 11
2
2


=
,
OBS
= 0,737


Segn tabla, promediando los dos valores cercanos, el valor p es: = * P(
2
1 ; p
> 0,737) 0,404. Ver figura 5.
Como * > 0,10 No rechazar H0, a un nivel del 10%.



Conclusin: Con los datos dados no se puede rechazar la independencia entre Ingreso y Estatura. Por lo tanto, con un 10%
de significacin, se concluye que en las personas que trabajan, el nivel de ingresos no est asociado a su estatura.
0
737 0,
2

027 0, *
gl 1
Fig. 5
Gua N1-Socioestadstica III-2013
7
Casos y ejercicios propuestos
Caso 1: Estado civil y sntomas depresivos
Sobre la base de los resultados de un estudio, se ha afirmado que las madres casadas presentan menos sntomas de
depresin que las solteras. En una muestra de mujeres de 18-19 aos con 1 hijo, se recab la siguiente informacin, en
nmero de casos, desagregadas por estado civil:

Estado civil
Sntomas depresivos
Total
S NO
CASADAS 45 131 176
SOLTERAS 83 127 210
Total 128 258 386

1.1. Docime, con = 5%, la hiptesis de que el sntoma depresivo est asociado al estado civil. Construya sus
conclusiones respecto del caso.
1.2. Qu significa, en este contexto, cometer error de tipo II?



Caso 2: Relacin padres-hijos y convivencia matrimonial
Segn un estudio, de 140 hijos de padres separados, el 30%declara tener malas relaciones con sus padres, mientras que
de una muestra de 170 hijos de padres que permanecen casados, 36 tienen malas relaciones con sus padres. Considere las
muestras, independientes.
Realice, al 10%, un contraste de la hiptesis relacionada con el supuesto efecto de la convivencia matrimonial en la relacin
padre-hijos.



Caso 3: Salud y sobrepeso
El grfico de la figura presenta, en N de casos, la evaluacin del estado
general de salud de una muestra de personas, segn si presentan peso
normal o sobrepeso.

Con los datos del grfico, analice, al 10%, la existencia de una relacin
significativa entre peso y estado general de salud.








Caso 4: Consumo de cocana y terapia
En la universidad de Yale (USA) se realiz un estudio con 187 consumidores compulsivos de cocana, que fueron
aleatoriamente asignados a acupuntura auricular o a terapia de relajacin sin acupuntura. Durante el estudio, los sujetos
fueron sometidos a exmenes de orina para detectar la presencia de cocana en el organismo. De 103 sujetos asignados a
tratamiento de acupuntura, 35 presentaron evidencia de cocana en la orina, mientras que entre los sometidos a relajacin,
51 de un total de 84.

4.1. A un nivel de significacin del 5%, contraste la hiptesis de que el consumo de cocana durante el estudio result
asociado al tipo de tratamiento.
4.2. Qu significa, en este contexto, cometer error de tipo I?




12
10
08
06
04
02
00
Bueno Malo




ESTADO


N de
casos
Peso normal
Sobrepeso
Estado general de salud, segn peso
Gua N1-Socioestadstica III-2013
8
Caso 5: Situacin civil y relacin de pareja
Una investigacin estudi las relaciones de pareja en una muestra aleatoria de tamao 125, evaluando las siguientes
variables: X = Relacin de la pareja (Buena-Deficiente); Y = Situacin civil de la pareja (Casados-Unin libre)
El estudio lleg a la siguiente conclusin:
La relacin de pareja es independiente de la situacin civil de la pareja (p = 0,0763)

5.1. Cul es la hiptesis alternativa en este estudio?
5.2. Cul fue la decisin estadstica en el contraste que llev a esta conclusin?
5.3. De los niveles de significacin usuales, cul se us en este estudio?
5.4. En qu consiste el error de tipo I en este estudio?



Caso 6: Satisfaccin en el lugar de trabajo
Una empresa est recabando informacin del ambiente laboral al interior de la empresa. Para los efectos aplica un
cuestionario a una muestra aleatoria de hombres y mujeres. Entre los aspectos incluidos en el estudio est el nivel de
satisfaccin de los trabajadores en el trabajo. La siguiente tabla muestra los resultados de esta parte del estudio.
Trabajadores segn nivel de satisfaccin con su lugar de trabajo y sexo.
Sexo
Nivel de satisfaccin
Muy satisfecho Satisfecho Insatisfecho Muy insatisfecho
Hombre 3 16 3 2
Mujer 2 7 2 2

6.1. Est la satisfaccin en el trabajo asociada al sexo del trabajador?
Analice el caso y construya las conclusiones, con un nivel de significacin del 10%.
(Sugerencia: los datos de la tabla se pueden reorganizar).




Caso 7: Evaluacin de la educacin
Un estudio realizado con apoderados de colegios municipalizados se plante como objetivo conocer la evaluacin que stos
hacen de la calidad de la educacin que reciben sus hijos.

Nivel educacional del
hijo(a)
Cmo evaluara usted la educacin que
recibe su hijo(a)?
Total
Buena Mala
Educacin Bsica 67 81 148
Educacin Media 23 67 90
Total 90 148 238

Con un 10%de significacin pruebe si la evaluacin que realizan los padres acerca de la educacin que reciben sus hijos es
independiente o no del nivel educacional que cursan sus hijos.


Gua N1-Socioestadstica III-2013
9
Caso 8: Prdida de piezas dentales en adulto mayor
Algunos cientficos estudiaron 145 voluntarios saludables con ms de 65 aos de edad. Estos voluntarios participaron en un
estudio aleatorio de tres aos en que un grupo de personas seleccionadas al azar recibieron placebos en vez de los
suplementos nutritivos que recibi el otro grupo. Todos los voluntarios tambin participaron en encuestas dos aos despus
de discontinuar los suplementos del estudio.

Tratamiento
Perdieron dientes
TOTAL
S NO
Suplementos nutritivos 10 70 80
Placebos 18 47 65
TOTAL 28 117 145

8.1. Est la prdida de dientes asociada a la alimentacin? Use un nivel de significacin del 5%.
8.2. Existe evidencia para firmar que la prdida de dientes est asociada a la falta de suplementos nutritivos?



Soluciones numricas

Caso 1: Caso 2: Caso 3:
Estadstico valor p

Estadstico valor p Estadstico valor p
Chi2-Pearson= 8,4137256 0,0037

Chi2-Pearson= 4,7834942 0,0287 Chi2-Pearson= 3,2650794 0,0708
Chi2-Yates= 7,7958625 0,0052

Chi2-Yates= 4,2322102 0,0397 Chi2-Yates= 2,1254216 0,1449
Test-G= 8,5164103 0,0035

Test-G= 4,7687003 0,0290 Test-G= 3,3442781 0,0674

Caso 4: Caso 6: Caso 7:
Estadstico valor p Estadstico valor p

Estadstico valor p
Chi2-Pearson= 13,312405 0,0003 Chi2-Pearson= 0,452241 0,5013

Chi2-Pearson= 9,2503454 0,0024
Chi2-Yates= 12,257886 0,0005 Chi2-Yates= 0,0735303 0,7863

Chi2-Yates= 8,4309628 0,0037
Test-G= 13,444275 0,0002 Test-G= 0,442621 0,5059

Test-G= 9,5108123 0,0020

Caso 8:
Estadstico valor p
Chi2-Pearson= 13,312405 0,0003
Chi2-Yates= 12,257886 0,0005
Correlacin fi= -0,191405
Q de Yule= -0,456647




RECURSOS ANEXOS:
-Biblioteca ARCIS:
Alcano, Patricio. Estadstica para Ciencias Sociales N7. Problemas resueltos.

-Sitio Scribd:
http://es.scribd.com/doc/60293392/Inferencia-No-Parametrica-Problemas-Resueltos-con-pruebas-de-Chi-cuadrado

-Bioestadstica Universidad de Mlaga:
http://www.bioestadistica.uma.es/libro/node128.htm

Potrebbero piacerti anche