Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
( 250
)
2
sionales en la metodologa de la investigacin cientfica y en el uso 822 60 2
1 082
SCinter 5 1 1 2
de los instrumentos estads 7 7 7 21
( 6724 36
SCinter 5
7 7 7
00 11664 62500
1 1 2 21
)
5 960.6 1 514.3 1 1666.3 2 2976.2
0.00.1 0.20.30.4
34.1% 34.1%
259593
2.1% 2.1%
0.1% 0.1%
13.6% 13.6%
3 2 1 1 2 3
786070
165
CMinter 5 5 82.5
Coordinacin de la 2
9
Investigacin Cientfica
292.8
CM 5 5 16.3 (4.4)
18
intra
i i
i i
i i
apuntes
para la investigacion
en salud
i i
i i
i i
Apuntes para la investigacin en salud / Francisco Jurez Garca (editor) ; Joaqun Lpez
Brcena (editor) ; Vernica Salinas Mendoza (editora). Primera edicin
408 pginas
ISBN 978-607-02-5959-3
R850.AP655 2014
ISBN 978-607-02-5959-3
i i
i i
i i
Indice
Introduccion
Francisco Juarez Garca 15
Prefacio
Mara Elena Medina-Mora 17
Agradecimientos
Francisco Juarez Garca 21
i i
i i
i i
8 ndice
i i
i i
i i
ndice 9
Medicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
La cantidad de valores . . . . . . . . . . . . . . . . . . . . . . . 93
El tipo de valores . . . . . . . . . . . . . . . . . . . . . . . . . . 94
Niveles de medicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Nominal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
Ordinal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Intervalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Razon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
La estadstica y la computadora . . . . . . . . . . . . . . . . . . . . . . 98
Codificacion de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
Codificar las respuestas . . . . . . . . . . . . . . . . . . . . . . . 100
Procedimiento para codificar . . . . . . . . . . . . . . . . . . . . 101
Gua de codificacion . . . . . . . . . . . . . . . . . . . . . . . . 102
Ramas de la estadstica . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Estadstica parametrica . . . . . . . . . . . . . . . . . . . . . . . 105
Estadstica no parametrica . . . . . . . . . . . . . . . . . . . . . 106
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3. Estadstica descriptiva
Elsa Karina Lopez Lugo, Francisco Juarez Garca y Marsela Alejandra
Alvarez Izazaga 109
Frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Tabla de frecuencias . . . . . . . . . . . . . . . . . . . . . . . . . 111
Tabla de frecuencia de datos no agrupados . . . . . . . . . . . . . 112
Tabla de frecuencia de datos agrupados . . . . . . . . . . . . . . 113
Frecuencias relativas o porcentajes ( %) . . . . . . . . . . . . . . . . . 115
Tablas de frecuencias cruzadas . . . . . . . . . . . . . . . . . . . 117
Frecuencias relativas acumuladas o porcentajes acumulados ( % a) 117
Requerimientos para la elaboracion de tablas . . . . . . . . . . . 118
Representacion grafica de datos . . . . . . . . . . . . . . . . . . . . . . 118
Datos nominales u ordinales . . . . . . . . . . . . . . . . . . . . 119
Datos numericos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Requerimientos para la elaboracion de graficas . . . . . . . . . . 122
Graficas enganosas . . . . . . . . . . . . . . . . . . . . . . . . . 123
Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . 124
Media aritmetica p xq . . . . . . . . . . . . . . . . . . . . . . . . 124
i i
i i
i i
10 ndice
i i
i i
i i
ndice 11
5. Investigacion clnica
Lilia Castillo Martnez, Dulce Gabriela Gonzalez Islas, Laura Patricia
Montano Hernandez, Wendy Daniella Rodrguez Garca, Cira Santillan
Daz, Arely Vergara Castaneda y Edgar Vergara Castaneda 283
Busqueda sistematica de informacion . . . . . . . . . . . . . . . . . . . 284
Pruebas diagnosticas . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
Utilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
Caractersticas de la prueba diagnostica . . . . . . . . . . . . . . 292
Validez de idoneidad de las pruebas . . . . . . . . . . . . . . . . 292
Procedimiento para la realizacion de una prueba diagnostica . . . 293
Sensibilidad y especificidad . . . . . . . . . . . . . . . . . . . . . 294
Curva ROC (Receiver Operating Characteristic) . . . . . . . . . . 296
Disenos epidemiologicos y clnicos . . . . . . . . . . . . . . . . . . . . 299
Clasificacion tradicional de los disenos de estudio epidemiologicos 300
Muestreo y tamano de muestra . . . . . . . . . . . . . . . . . . . . . . 307
Poblacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
Muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
i i
i i
i i
12 ndice
i i
i i
i i
ndice 13
i i
i i
i i
14 ndice
i i
i i
i i
i i
i i
i i
COMPARACION ASOCIACION
Muestras independientes: Muestras relacionadas: Aqu se puede o no tener una
Cuando la variable Cuando la variable variable dependiente, pero
dependiente de interes dependiente es medida eso no es relevante pues solo
es medida solo una mas de una ocasion se busca saber la relacion
vez en la unidad en la unidad de analisis existente entre dos variables
de analisis
2
Para mayor informacion vease la seccion de dos grupos apareados en el paso 6 Disenos de
investigacion, del captulo 1. Los pasos de un proyecto de investigacion.
i i
i i
i i
a) Asociacion.- En este tipo de problemas solo hay dos eventos que se relacio-
nan o asocian (correlacion).
b) Comparacion.- Tambien llamada prueba de hipotesis. Se comparan grupos
o mediciones e intervienen dos tipos de variables:
Variable dependiente (V. D.) o de medicion, es el fenomeno o proceso que
se va a medir, sus variaciones dependen de la variable independiente.
Variable independiente (V. I.) o de agrupacion, es la variable que identifica
los tratamientos empleados para influir sobre la variable dependiente o gru-
pos a los que se les va a comparar un atributo medido. Esta variable define
los grupos que van a ser comparados.
Como saber si el problema es de asociacion o comparacion?
1) Se tienen grupos?
Si la respuesta es: NO, entonces es poco probable que sea de comparacion,
pero no imposible.
Si la respuesta es: SI, se esta comparando.
i i
i i
i i
INFERENCIA ESTADISTICA
Realizar inferencias estadsticas se refiere a tomar una serie de decisiones que de-
ben tomar para probar una hipotesis, para lo que se acostumbra adoptar un modelo
de decision. Este modelo consta de diferentes pasos (Ritchey, 2008) de los cuales
se presentan a continuacion los cinco elementos principales:
Establecer la hipotesis nula (H0 ) y en contraparte la hipotesis alterna (H1 )
Elegir la prueba estadstica, de acuerdo con las caractersticas del problema
Seleccionar el nivel de significancia que va a utilizarse en la prueba estadsti-
ca usualmente 0.05
Establecer la regla de decision con base en el nivel de significancia elegido
Concluir el procedimiento decidiendo, de acuerdo con el resultado de la
prueba y la regla de decision, si se rechaza o se conserva la H0
A continuacion se explican cada uno de los elementos del modelo de decision:
Planteamiento de la hipotesis
Una hipotesis es la respuesta tentativa para la solucion de la pregunta de investi-
gacion (Ritchey, 2008). La hipotesis estadstica es la que sera sometida a prueba
i i
i i
i i
i i
i i
i i
el empleo de hipotesis de una cola, sin embargo advierte tambien sobre el hecho
de facilitar que la hipotesis estadstica se rechace al incrementar la probabilidad
para hacerlo. Por otro lado, en general no se cuenta con evidencia suficiente para
establecer una direccion, en cuyo caso se debe establecer una H0 de dos colas.
La posicion tomada en estos apuntes corresponde a la de plantear H0 bidi-
reccionales ante el objeto de estudio que se aborda en el mismo; la investigacion
social, en psicologa; en salud, en general, y en salud mental. As, despues de esta
seccion los ejemplos y ejercicios estan basados en hipotesis de dos colas.
A continuacion se exponen los diferentes tipos de hipotesis cuando se tienen
problemas de comparacion con diferentes niveles de medicion de la variable de-
pendiente y cuando se plantean problemas de asociacioncorrelacion:
H0 : x1 x2
H1 : x1 , x2
H0 : Md1 Md2
H1 : Md1 , Md2
i i
i i
i i
H0 : P1 P2
H1 : P1 , P2
H0 : r 0
La hipotesis alterna afirma que hay correlacion entre las variables que se estan
relacionando:
H1 : r , 0
i i
i i
i i
bajo estres, estres regular y alto estres, con 7 profesionistas cada uno, a quienes
se les evaluo su nivel de irritabilidad preguntandoles en una escala de 0 a 10 que
indicaran: Cotidianamente, que tan irritable se muestra con sus companeros de
trabajo?
H0 : No existen diferencias en el nivel de irritabilidad hacia los companeros de
trabajo entre los grupos de nivel bajo, regular y alto, de estres.
H1 : Existen diferencias en el nivel de irritabilidad hacia los companeros de
trabajo entre los grupos de nivel bajo, regular y alto, de estres.
Para el caso de los problemas de asociacion se identifica la relacion entre las
variables, y el concepto de asociacion o correlacion se debe incluir en las hipotesis.
Que relacion hay entre la edad en anos de los sujetos y su inteligencia?
H0 : No hay asociacion entre la edad y la inteligencia.
H1 : Existe asociacion entre la edad y la inteligencia.
En todos los casos, la hipotesis nula es la que se somete a prueba mediante
el analisis estadstico elegido de acuerdo con las caractersticas de cada problema.
Cuando no se puede rechazar se afirma lo expresado en esta, en caso contrario
lo que se dice en la hipotesis alterna. Sin embargo, es necesario advertir que la
decision de conservarla o rechazarla, despues de obtener los resultados del analisis
estadstico, es probabilstica mas que determinista, como se analiza mas adelante.
Los planteamientos anteriores se refieren a pruebas de dos colas, en los que
no es posible anticipar la direccion de las diferencias, es decir, no se sabe cual
grupo es el que tendra el nivel o la proporcion de casos mayor, o cual es el sentido
de la relacion entre variables. Las hipotesis de una direccion se plantearan de la
siguiente manera.
Si se tiene un nivel intervalar o de razon de la V. D., tomando como ejemplo
que el promedio mayor es esperado para el primer grupo, en la hipotesis nula se
planteara que:
H0 : x1 x2
Contrario a lo que es lo que se espera encontrar, planteado a traves de la hipotesis
alterna:
H1 : x1 x2
Cuando el segundo grupo se espera con un promedio mayor en la variable medida:
H0 : x1 x2
H1 : x1 x2
i i
i i
i i
H0 : Md1 Md2
H1 : Md1 Md2
H0 : Md1 Md2
H1 : Md1 Md2
H0 : P1 P2
H1 : P1 P2
H0 : P1 P2
H1 : P1 P2
El nivel de significancia
La probabilidad ppq de que un evento ocurra oscila entre 0 y 1, donde 0 significa
la imposibilidad de ocurrencia y 1 la certeza de que ocurra el fenomeno. Al lanzar
al aire una moneda no cargada, la probabilidad de que salga aguila es de 0.5 y
la probabilidad de que la moneda caiga en sol tambien es de 0.5. Con un dado,
la probabilidad de obtener cualquiera de sus lados al lanzarlo es de 1{6 0.1667.
La suma de probabilidades siempre es de 1.
Aplicando el concepto de la probabilidad a la distribucion muestral, el area
de esta corresponde a la probabilidad total (p 1) y consecuentemente cualquier
area (porcentaje bajo la curva) comprendida entre dos puntos de la distribucion
correspondera a la probabilidad de la distribucion al convertirla a proporciones
(por ejemplo 25% = 0.25).
Para probar hipotesis inferenciales utilizando la media, el investigador debe
evaluar si es alta o baja la probabilidad de que la media de la muestra este cerca
de la media de la distribucion poblacional. Si es baja, el investigador dudara sobre
poder generalizar a la poblacion. Si es alta, el investigador podra hacer generali-
zaciones. Es aqu donde entra el nivel de significancia o nivel , el cual se refiere
a la probabilidad mas alta asumida de equivocarse al rechazar la H0 situacion
conocida como error tipo I.
i i
i i
i i
Decision estadstica
La decision e interpretacion del resultado obtenido en un analisis estadstico se
basa en mantener o rechazar la hipotesis nula. Una vez elegida la prueba estadstica
adecuada al problema y haber redactado la hipotesis nula, se debe establecer un
nivel de significancia o de certeza para rechazarla sin cometer el error llamado
del tipo I o , que se refiere a rechazar la hipotesis nula siendo verdadera. En
las areas social, psicologa y otras de la salud, usualmente se establece el nivel
de significancia en 0.05 que representa 95% de certeza de que se esta evitando
el error tipo I y de poder generalizar los resultados con una menor probabilidad
de equivocarse. Es por esto que, como se menciono anteriormente, la decision
estadstica es una decision probabilstica, basada en disminuir la probabilidad de
ocurrencia del error tipo I. Si se desea mayor certeza se debe utilizar otro nivel
de significancia como puede ser 0.01 que proporciona una certeza de 99% para
generalizar los resultados sin error, o 0.001 que equivale 99.9%. Existe otro error
nombrado como tipo II o que, contrario del error I, se refiere a aceptar la hipotesis
nula siendo falsa.
En terminos de decision estadstica, es mas grave cometer el error tipo I, por
ejemplo al afirmar que hay diferencias entre grupos cuando esto no es verdad, una
situacion a la que es facil llegar porque los investigadores esperan que una inter-
vencion (V. I.), en la que invirtieron tiempo y esfuerzo, sea la causa mas probable
de las cambios en la V. D., o porque se cree que la investigacion en que no se re-
portan diferencias estadsticas disminuye sus posibilidades para ser aceptada por
los editores de las revistas cientficas cuando deberan considerar que eso poten-
cialmente es un hallazgo con el que se llegara incluso a refutar teoras existentes
o generar nuevas.
Las zonas de rechazo y de aceptacion de la hipotesis nula estan relacionadas
con la curva normal y las desviaciones z. La zona de rechazo, o la probabilidad de
cometer el error tipo I, se representa en los extremos o colas de la curva normal.
Para una hipotesis bidireccional se reparte entre las dos colas de la curva y para la
i i
i i
i i
Zona de Aceptacin al
95% para una prueba
de dos colas
2.5 % 2.5 %
-1.96 DE 0 1.96 DE
Zona de rechazo (5%)
En una prueba de dos colas, en terminos de puntajes z, se tiene que entre 1.96
y 1.96 desviaciones (DE) hay 95% del area bajo la curva en la region de aceptacion
de la hipotesis nula y 5% en la de rechazo, al traducir las areas a probabilidad este
porcentaje equivale a una significancia () de 0.05, entre 2.58 y 2.58 DE equivale
al 99% del area bajo la curva ( 0.01) y entre 3.90 y 3.90 DE el 99.9% de area
bajo la curva ( 0.001).
Para una prueba de una cola, a 1.64 DE ya sea en el extremo negativo o posi-
tivo, se tiene 95% del area bajo la curva en la region de aceptacion de la hipotesis
i i
i i
i i
Grados de libertad
Significa la libertad de variaciones que puede tener una variable. Por ejemplo, se
tienen 4 puntuaciones cuya media es igual a 10, si se separan las tres primeras (7,
12 y 15) la ultima estara determinada por las otras, entonces la ultima puntuacion
necesariamente es 6. La cantidad de comparaciones independientes se determina a
partir de los grados de libertad, que normalmente se calculan teniendo el tamano
de la muestra menos uno (gl n 1). Sin embargo los grados de libertad se
obtienen de manera diferente para cada prueba, por lo que se debe estar atento a
cada uno de los procedimientos.
Reglas de decision
Al igual que la z 1.96 representa el inicio de la zona de rechazo con 0.05
para una prueba de dos colas, el inicio de la zona de rechazo valor crtico debe
ser establecido para cada prueba estadstica, normalmente se encuentra en tablas
de valores crticos en las que debe ser localizado, separandolo de un conjunto de
otros valores organizados en columnas o sub-tablas para los niveles de significan-
cia usuales (0.05, 0.01) y para una o dos colas. Dependiendo del numero de sujetos
(n) o los grados de libertad (gl) se escoge el renglon del valor n o gl para los datos
que se estan analizando. El valor crtico se encuentra en el cruce de la columna y
renglon seleccionados. Este valor cambia aun para una misma prueba estadstica
debido al numero de sujetos y gl que se tienen para ser analizados. La regla de
decision establece la comparacion del valor obtenido del analisis con un valor
crtico como sigue: si el valor de la prueba calculado es mayor o igual al valor
crtico seleccionado de la tabla se rechazara la hipotesis nula. Esta regla y la
forma de encontrar los valores crticos pueden cambiar, por lo que es necesario
revisar los procedimientos especficos para cada prueba estadstica.
i i
i i
i i
Por otro lado, los paquetes estadsticos presentan los valores asociados a cada
prueba junto con algunos datos necesarios para su calculo (medias o porcentajes,
el numero de casos, los grados de libertad, etcetera) y el nivel de significancia o
probabilidad, este representa la posicion del valor del estadstico en relacion con
el area de rechazo nivel de significancia de la hipotesis nula. Por lo que, la
regla de decision, observando los resultados del paquete estadstico, manteniendo
el ejemplo de un nivel de significancia establecido en 0.05 es: si la probabilidad o
nivel de significancia obtenido en el analisis es menor o igual a 0.05 se rechaza
la hipotesis nula. En otras palabras, verificar si la significancia que resulto del
analisis esta dentro de la zona de rechazo establecido por el nivel de significancia
seleccionado si 0.05, la zona de rechazo esta en el rango de 0 a 0.05 o sale
de esa zona, con este mismo ejemplo desde 0.05000001 hasta 1.
El nivel de significancia mas usado en ciencias sociales, del comportamiento
y otras areas de la salud es 0.05, este puede variar en la regla de decision a 0.01 y
0.001 si se requiere mayor certeza en la prueba de hipotesis. Debe recordarse que
el nivel de significancia sera elegido a priori, es decir, se debe decidir con que nivel
se realizara la prueba de hipotesis, mismo que se establecera en la regla de decision
y como referencia para el reporte de los resultados.
El aceptar la H0 supone que no existe evidencia suficiente para rechazarla por-
que los resultados no son significativos (Pagano, 2008), es decir, que la probabi-
lidad de rechazar la H0 cuando es verdadera (error tipo I) es mayor al nivel de
significancia elegido. El conservar o rechazar la H0 no implica en ese sentido una
decision determinista, sino en cambio es una decision estadstica basada en que la
probabilidad para cometer el error tipo I () sea lo mas baja posible para poder
rechazarla.
i i
i i
i i
Los graficos se pueden utilizar para una mejor explicacion de los datos que hemos
encontrado. Una grafica de barras, por ejemplo, se usa para ver cual es el grupo
que tiene un promedio mayor y cual el menor, o si no existen diferencias entre
ellos. Tambien se pueden comparar porcentajes con este tipo de graficas.
Al hacer un analisis estadstico se tienen, ademas de los valores resultantes de
cada prueba, elementos que se utilizan para hacer una grafica, por ejemplo: me-
dias en las pruebas de hipotesis de nivel intervalar, o porcentajes en las hipotesis
de nivel nominal. Las graficas o tablas que se realicen para reportar resultados
de pruebas de hipotesis deben estar acompanadas, de los valores de la prueba es-
tadstica que se utilizo, en algunos casos los grados de libertad y comparar con el
nivel de significancia con que se rechaza o acepta la hipotesis nula.
En la descripcion de la grafica se resaltaran las diferencias entre los grupos,
o ausencia de estas, y se aclarara si son estadsticamente significativas de acuer-
do con la prueba utilizada (la conclusion de si la hipotesis nula fue rechazada o
aceptada).
A continuacion se muestran, a manera de ejemplo, diferentes tipos de presen-
tacion de resultados:
Tablas: Caractersticas de la muestra (frecuencias y porcentajes)
i i
i i
i i
80
60
40
20
0
1er trim. 2do trim. 3er trim. 4to trim.
i i
i i
i
i
i
i
176
de comparacin: se comparan grupos o mediciones, se tiene de asociacin: aqu, se puede o no tener una variable
una variable independiente y una variable dependiente dependiente, pero eso no es relevante pues slo se busca
saber la relacin existente entre dos variables
EN UN ESTUDIO
Variable 1
Cuntos grupos hay? (V. I.) Cuntas mediciones hay? (V. I.) Escalar
Pearson (rp)
Variable 2
Escalar
Spearman
Dos grupos Ms de dos (rs)
Dos Ms de dos Variable 1
grupos mediciones mediciones Ordinal
Spearman
(rs)
Variable 2
Cul es el nivel de Cul es el nivel de Ordinal
Cul es el nivel de Cul es el nivel de
medicin de la variable medicin de la variable medicin de la variable medicin de la variable
dependiente? dependiente? dependiente? dependiente? Variable 1
Dicotmica CoeficienteP
hi
Correlacin
Variable 2 (r)
Biserial
Puntual (rbp) Dicotmica
Escalar
Escalar
Escalar
Escalar
Ordinal
Ordinal
Ordinal
Ordinal
Variable 2 Escalar
Nominal
Nominal
Nominal
Nominal
u ordinal
U de Mann- Anlisis de
Wilcoxon Friedman
Whitney varianza de X2
un factor
t de Student Anlisis de
t de McNemar Q de Cochran
X2 para muestras varianza para
Student Kruskal- (dicotmica) (dicotmica)
relacionadas medidas
Wallis
repetidas
CRITERIOS IMPORTANTES PARA SELECCIONAR EL TIPO DE PRUEBA
francisco juarez, elsa lopez, jorge villatoro
Apuntes para la Investigacion en Salud 2014/12/8 15:24 page 176 #176
i
i
i
i
i i
En esta seccion se presentan las pruebas que se deben usar cuando el problema
que se analizara es de comparacion de grupos independientes. En todos los casos
se explica paso a paso el algoritmo para calcular cada una de las pruebas, pos-
teriormente el analisis utilizando el paquete estadstico IBM SPSS Statistics
version 21 [SPSS] (2012) y se termina cada una explicando la forma de reportar
los resultados siguiendo el manual de la APA (2010).
Nominal
Ordinal
Ordinal
Escalar
Escalar
i i
i i
i i
Xq2
2
2 p
x X
n
Para calcular los grados de libertad:
gl n1 ` n2 2
i i
i i
i i
1412 19881
x12 2913 2913 2913 2840.14 72.86
7 7
1642 26896
x22 4656 4556 4656 4482.67 173.33
6 6
x12 73 x22 173
3
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
gl 7 ` 6 2 11
X1 X2 X12 X22
26 38 676 1444
24 26 576 676
18 24 324 576
17 24 289 576
18 30 324 900
20 22 400 484
18 324
2
X22 4656
X1 141 X2 164 X1 2913
n1 7 n2 6
x1 20.14 x2 27.33
Tabla 4.1
i i
i i
i i
gl 0.05 0.01 0.001
1 12.706 63.657 636.619
2 4.303 9.925 31.598
3 3.182 5.841 12.941
4 2.776 4.604 8.610
5 2.571 4.032 6.859
6 2.447 3.707 5.959
7 2.365 3.499 5.405
8 2.306 3.355 5.041
9 2.262 3.250 4.781
10 2.228 3.169 4.587
11 2.201 3.106 4.437
12 2.179 3.055 4.318
13 2.160 3.012
14 2.145 2.977
15 2.131 2.947
16 2.120 2.921
17 2.110 2.898
18 2.101 2.878
Se desea probar dos metodos de ensenanza del idioma ingles, los grupos fueron
asignados al azar, en el primero se utilizo un metodo tradicional y el segundo
siguio un metodo multimedia, al final de cada uno de los cursos se aplico una
prueba de conocimientos.
Se debe determinar el tipo de problema, los grupos a comparar, si son inde-
pendientes o relacionados, el nivel de medicion, la prueba estadstica que debe
utilizarse y plantear la hipotesis nula que se va a probar de acuerdo con el nivel de
medicion y tipo de problema correspondiente.
Es un problema de comparacion:
Dos grupos independientes
Nivel de medicion intervalar
H0 : No hay diferencias entre el grupo del curso tradicional y el grupo del curso
Multimedia en el nivel de conocimientos del idioma ingles.
i i
i i
i i
En la base de datos se debe tener una variable para los grupos (V. I. que es el
metodo de ensenanza, aqu llamada grupo) y una que contiene las calificaciones de
la prueba de conocimientos (V. D.), en la ventana de dialogo se debe incluir la V. D.
en Variables para contrastar y la V. I. en Variable de agrupacion, adicionalmente
deben especificarse los grupos por comparar con el boton Definir grupos, en el
dialogo correspondiente se capturan los codigos asignados a los grupos en este
caso el metodo tradicional es el 1 y el Multimedia es el 2.
4
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Una vez superado este punto, se tienen dos renglones de valores, el superior en
el que se asumen varianzas iguales (ver datos encerrados en el rectangulo) y el infe-
rior en que no se asumen varianzas iguales (ver datos encerrados en el hexagono).
Siguiendo el ejemplo: se probo que hay varianzas iguales, se debe seguir la pri-
mera lnea donde se observa un valor de t de 2.732 con 11 grados de libertad y
un nivel de significancia de 0.02 (ver datos encerrados en el rectangulo), siguien-
do la regla de decision: si el nivel de significancia calculado es menor o igual
pq a 0.05 se debe rechazar la H0 , este valor es menor a 0.05 por lo que se debe
i i
i i
i i
30 27.33
25
20.14
20
Media
15
10
0
Curso Tradicional Curso Multimedia
Esta descripcion sera la base para llevar a cabo la discusion posterior de los
resultados encontrados en el estudio.
i i
i i
i i
Prueba U de Mann-Whitney
La prueba U de Mann-Whitney pertenece a las pruebas no parametricas de com-
paracion de dos muestras independientes (Siegel & Castellan, 1995), es decir:
Es libre de curva, no necesita una distribucion especfica
Nivel ordinal de la variable dependiente
Se utiliza para comparar dos grupos de rangos (medianas) y determinar que la
diferencia no se deba al azar (que la diferencia sea estadsticamente significativa).
Se calcula mediante la siguiente formula:
n x pn x ` 1q
U n1 n2 ` Rx
2
donde:
n1 , n2 = numero de casos de cada grupo
R x = suma de rangos de cada grupo
n x = numero de casos de cada grupo
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres entre enfermeras de
terapia intensiva (X1 ) y las de urgencias (X2 ), el nivel de estres se midio en una
escala de 0 = nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto, las calificaciones
se muestran a continuacion:
X1 X2 R1 R2
3 4 11.5 13
2 3 8 11.5
1 2 3.5 8
1 2 3.5 8
0 1 1 3.5
2 2 8 8
1 3.5
R1 39 R2 52
n1 7 n2 6
i i
i i
i i
Es un problema de comparacion:
Dos grupos independientes
Nivel de medicion ordinal
H0 : No hay diferencias en el nivel de estres entre enfermeras de terapia
intensiva y enfermeras de urgencias.
Prueba estadstica: Prueba U de Mann-Whitney
Regla de decision: Si el valor de U calculado es menor o igual al de tabla
seleccionado, considerando el nivel de significancia elegido a priori5 se
rechaza la H0
2. En primer lugar se debe asignar un rango a cada calificacion ordenandolas
como si se tratara de un solo conjunto de datos (se juntan los grupos).
Valor Rango
al valor mas pequeno es el rango 1, el valor mas pequeno
0 1
, posible es el 0
$
1 2// el rango para los 1 es igual a:
En el caso de que existan valores
1 3 repetidos (llamados tambien empates),
.
2`3`4`5
3.5 4 3.5
1 4/ & el rango que les corresponde es igual
/
-
1 5, al promedio de los rangos, es decir:
2 6// para el 2 debe considerarse
la suma de los lugares asignados de
2 7/ que en el orden que sigue manera secuencial entre el numero
/
.
%
2 8 8 es el 6: de veces que se repite cada numero.
/
2 9// 6`7`8`9`10
/
- 5 8
2 10*
3 11 para el 3, empezando en 11:
11.5 11`12
3 12 2 11.5
el ultimo rango respetando la secuencia es el 13,
4 13
que le corresponde al valor 4
5
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
13p14q
39 ` 52
2
91 91
7p7 ` 1q p7qp8q
U1 p7qp6q ` 39 42 ` 39
2 2
56
42 ` 39 42 ` 28 39 31
2
6p6 ` 1q p6qp7q
U2 p7qp6q ` 52 42 ` 52
2 2
42
42 ` 52 42 ` 21 52 11
2
5. Se debe encontrar el valor crtico de U en la tabla que se presenta en la
pagina siguiente, con un nivel de significancia establecido a 0.05 para una
prueba de 2 colas, utilizando el numero de casos de cada grupo (n1 y n2 ).
Una vez hecho esto, se debe elegir el valor de U mas bajo y compararlo con
el valor de U en tabla. La regla de decision es: si el valor de U calculado
es menor o igual al de tabla, se rechaza la hipotesis nula.
En este caso con n1 7 y n2 6, se tiene un valor de U en tabla = 6, el
valor obtenido (11) es mayor a este valor por lo que no se puede rechazar la
hipotesis nula, se concluye que: no hay diferencias en el nivel de estres entre
enfermeras de terapia intensiva y enfermeras de emergencia.
1a. Si alguno de los grupos en la muestra tiene mas de 20 sujetos, no es posi-
ble utilizar esta tabla, para estas situaciones se asume que muestras grandes
tienden a distribuirse normalmente y se convierte el valor de U a puntua-
cion z. Esto se hace mediante la siguiente formula, en la que se puede usar
cualquiera de las dos U que se calcularon, esto no afecta el valor de z, solo
cambia su signo dependiendo de la que se utilice:
i i
i i
i i
n1 n2
U 2
z b
n1 n2 pn1 `n2 `1q
12
n2
n1 1 2 3 4 5 6 7 8 9 10 11
1
2 0 0 0 0
3 0 1 1 2 2 3
4 0 1 2 3 4 4
5 0 1 2 3 5 6 7
6 1 2 3 5 6 8
7 1 3 5 6 8 10
8 0 2 4 6 8 10 13
9 0 2 4 7 10 12
10 0 3
U de Mann-Whitney en SPSS
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres entre enfermeras de
terapia intensiva y las de urgencias. El nivel de estres se midio en una escala de 0
= nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto.
i i
i i
i i
En la base de datos se debe tener una variable para los grupos (V. I. que es el
area en la que trabajan las enfermeras) y una que contiene el nivel de estres (V.
D.), en la ventana de dialogo se debe incluir la V. D. en Lista Contrastar varia-
bles y la V. I. en Variable de agrupacion, adicionalmente deben especificarse los
grupos por comparar con el boton Definir grupos, en el dialogo correspondiente se
capturan los codigos asignados a los grupos 1 y 2 en este caso terapia intensiva
es el 1 y urgencias es el 2.
6
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Rangos
Rango Suma de
Grupo N promedio rangos
Nivel de estres Enfermeras de
terapia intensiva 7 5.57 39.00
Enfermeras de
urgencias 6 8.67 52.00
Total 13
i i
i i
i i
Estadsticos de contrastea
Nivel de estrs
U de Mann-Whitney 11.000
W de Wilcoxon 39.000
Z -1.494
Sig. asintt. (bilateral) .135
Sig. exacta [2*(Sig.
unilateral)] .181b
a. Variable de agrupacin: Grupo
b. No corregidos para los empates.
i i
i i
i i
2
2
1.5
Mediana
1
1
0.5
0
Terapia Urgencias
intensiva
i i
i i
i i
1. En primer lugar debe generarse una tabla cruzada en la que por regla general
los grupos son representados en las columnas y las categoras de la variable
dependiente estaran representadas en los renglones. La tabla siguiente, re-
presenta los datos cruzados del tipo de orientacion poltica (Variable Inde-
pendiente en las columnas) por el tipo de practica de crianza que llevan a
cabo (Variable Dependiente en los renglones). En cada celdilla se capturan
las frecuencias observadas ( fo ), obtenidas de las respuestas de los padres
segun su orientacion poltica (ver las frecuencias en cursivas).
2. A continuacion se deben sumar los totales marginales por cada renglon, por
cada columna y obtener el numero total de casos (N).
3. Se debe obtener la frecuencia esperada ( fe ) multiplicando los totales mar-
ginales del renglon y de la columna que corresponden a cada celdilla, y
dividirlos entre el total de casos. Por ejemplo: el total marginal del renglon
para la primera celda (con frecuencia observada = 6) es igual a 30 y el total
marginal de las columnas es igual a 40, el total de sujetos es 87, entonces la
p30qp40q
frecuencia esperada para la primera celda es: fe 87 13.8
Las frecuencias restantes seran: para la segunda celda (con frecuencia ob-
p30qp47q
servada = 24): fe 87 16.2, para la tercera celda (con frecuencia
p28qp40q
observada = 13): fe 87 12.9, la cuarta celda (con frecuencia obser-
p28qp47q
vada = 15): fe 87 15.1, la quinta (con frecuencia observada = 21):
p29qp40q
fe 87 13.3 y finalmente para la sexta (con frecuencia observada
p29qp47q
= 8): fe 87 15.7 (las frecuencias esperadas son los numeros en
negritas en la tabla).
4. Calcular el valor de X 2 :
i i
i i
i i
gl pr 1qpc 1q
gl p3 1qp2 1q p2qp1q 2
A B
C D
i i
i i
i i
gl 0.05 0.01
1 3.841 6.635
2 5.991 9.210
3 7.815 11.345
4 9.488 13.277
5 11.070 15.086
6 12.592
7 14.067
Tabla 4.4: Valores crticos de chi cuadrada a los niveles de significancia de 0.05 y 0.01.
8
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
258075956.25
7.33
35221824
Se debe buscar el valor en tabla (vease tabla 4.4) con un grado de libertad
al nivel de significancia elegido para probar H0 . La regla de decision es: para
rechazar la hipotesis nula el valor obtenido debe ser mayor o igual a la chi
cuadrada en la tabla.
Con 1 grado de libertad al nivel de significancia de 0.05 se tiene un valor de
2
X en tabla de 3.841 (vease la tabla 4.4 de valores crticos de chi cuadrada), en
este caso, al tener una chi cuadrada (7.33) mayor a la de la tabla, se rechaza la
hipotesis nula, entonces: la proporcion de fumadores que recayeron en el consumo
de tabaco es diferente entre bebedores y no bebedores.
i i
i i
i i
En la base de datos se debe tener una variable para los grupos (V. I. consumo de
alcohol aqu llamada Bebedores) y una que contiene la informacion de recadas
en el consumo de tabaco (V. D.), la V. I. o de agrupacion se coloca siempre en
Columnas y la V. D. en Filas.
9
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
i i
i i
i i
i i
i i
i i
i i
i i
i i
es igual 0.000 menor a 0.05, por lo que se rechaza la hipotesis nula. Entonces,
la proporcion de padres que emplean practicas de crianza no rgida, moderada y
autoritaria es diferente entre los que tienen una orientacion conservadora y los que
tienen una orientacion liberal.
i i
i i
i i
70 60.6
60
50
40 33.3
%
30
20
10
0
No bebedores Bebedores
Figura 4.3. Porcentaje de personas que volvieron a fumar entre bebedores y no bebedores
pX2p1q 7.327, p 0.05q.
Esta descripcion sera la base para llevar a cabo la discusion posterior de los
resultados encontrados en el estudio.
i i
i i
i i
p Xq2
2
S CT X
N
2. La suma de cuadrados intergrupal (S Cinter ):
p Xq2 p Xq2
S Cinter
n N
3. La suma de cuadrados intragrupal (S Cintra ):
S Cintra S CT S Cinter
i i
i i
i i
10
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es de
0.05, este puede variar la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
2502 62500
S CT 3434 3434 3434 2976.2 457.8 (4.1)
21 21
165 292.8
CMinter 82.5 CMintra 16.3 (4.4)
2 18
i i
i i
i i
glinter 3 1 2 (4.5)
glintra p7 1q ` p7 1q ` p7 1q 6 ` 6 ` 6 18 (4.6)
glT 21 1 20 (4.7)
Para finalmente calcular el valor de F:
82.5
F 5.06
16.3
Los datos calculados deben ser organizados en una tabla como la siguiente:
4. Se debe encontrar el valor crtico de F en la tabla, para ello se tiene que iden-
tificar, entre el cuadrado medio intergrupos y el cuadrado medio intragrupos,
cual es el mayor; en las columnas se debe buscar con los grados de libertad
correspondientes al cuadrado medio mayor y en los renglones los grados de
libertad del cuadrado medio menor. Se debe elegir un valor de acuerdo con
el nivel de significancia elegido para la prueba de la H0 . La regla de deci-
sion para analisis de varianza es: si el valor calculado es mayor o igual
al valor de tabla, se rechaza la hipotesis nula.
El cuadrado medio mayor en este caso es el de intergrupos (CMinter 82.5)
con glinter 2, y para el cuadrado medio menor es el de intragrupos
(CMintra 16.3) con glintra 18, buscando en la tabla se tiene, para 2
grados en las columnas y 18 grados de libertad en los renglones, a un ni-
vel de significancia de 0.05, un valor de F 3.55. El valor de F es mayor
al de tabla por lo que se rechaza la hipotesis nula, entonces: el nivel de
conocimientos adquiridos en biologa es diferente entre el grupo del curso
multimedia, el grupo del curso tradicional y el grupo del curso que emplea
ambos metodos.
i i
i i
i i
Comparaciones posteriores a F
Cuando se ha determinado que existen diferencias significativas entre los grupos,
se debe especificar donde se encuentran las diferencias, para ello se analizan los
grupos por pares, para hacerlo existen varios metodos, mas o menos estrictos, di-
senados para evitar el error Tipo I debido al efecto Bonferroni.
El efecto Bonferroni se refiere al hecho de que al hacer las diferentes compa-
raciones entre los grupos organizados por parejas, por ejemplo, con la prueba t, el
efecto acumulativo sobre el nivel de significancia derivado de utilizar cada grupo
mas de una vez para hacer todas las comparaciones (0.05 para la primera, aproxi-
madamente 0.1 para la segunda, aproximadamente 0.15 para la tercera, etcetera),
nos hace rechazar la hipotesis nula cuando esta no debera ser rechazada.
Uno de los metodos es el disenado por Scheffe, en que se utiliza la siguiente
formula:
p x1 x2 q2
F pn `n q
CMintra n11 n22
Para nuestro ejemplo, al comparar el grupo 1 y el grupo 2, la F es igual a:
i i
i i
i
i
i
i
Apuntes para la Investigacion en Salud 2014/12/8 15:24 page 208 #208
i
i
i
i i
11
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
En la base de datos se debe tener una variable para los grupos (V. I. que es
el Metodo de ensenanza) y una que contiene las calificaciones en el examen de
conocimientos (V. D.), en la ventana de dialogo se debe incluir la V. D. en Lista de
dependientes y la V. I. en Factor.
i i
i i
i i
i i
i i
i i
i i
i i
i i
Comparaciones mltiples
Variable dependiente: Calificacin en el Examen de Conocimientos
Bonferroni
Diferencia de Intervalo de confianza al 95%
(I) Mtodo de Enseanza medias (I-J) Error tpico Sig. Lmite inferior Lmite superior
Multimedia Tradicional 3.143 2.156 .486 -2.55 8.83
Ambos -3.714 2.156 .306 -9.40 1.98
Tradicional Multimedia -3.143 2.156 .486 -8.83 2.55
Ambos -6.857* 2.156 .016 -12.55 -1.17
Ambos Multimedia 3.714 2.156 .306 -1.98 9.40
Tradicional 6.857* 2.156 .016 1.17 12.55
*. La diferencia de medias es significativa al nivel .05.
i i
i i
i i
i i
i i
i i
15.43
16
14
11.71
12
10 8.57
Media
8
6
4
2
0
Curso Curso Ambos
Multimedia Tradicional
donde:
N = numero total de casos
n = numero de casos de cada grupo
R = promedio de rangos de cada grupo
Sin embargo, si cuando se hace la asignacion de rangos hay observaciones
empatadas, se debe hacer una correccion a la formula anterior como sigue:
2
12
NpN`1q
nR 3pN ` 1q
KW
T
(4.9)
1 N 3 N
donde:
T t3 t
donde:
t = numero de empates en cada conjunto de rangos repetidos
Problema para explicar el procedimiento:
i i
i i
i i
X1 X2 X3 R1 R2 R3
3 3 4 13 13 18
2 3 3 8 13 13
1 4 2 3.5 18 8
1 4 4 3.5 18 18
0 2 3 1 8 13
2 2 4 8 8 18
1 1 3.5 3.5
n1 7 n2 7 n3 6 R1 40.5 R2 81.5 R3 88
N 20 R1 5.79 R2 11.64 R3 14.67
12
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Valor Rango
al valor mas pequeno el rango 1, el valor mas bajo
0 1
, posible es el 0
1 2// el rango para los 1 es igual a:
1 3
.
2`3`4`5
3.5 4 3.5
1 4/ /
-
1 5,
2 6/ / para el 2 debe considerarse
$
2 7/ que en el orden que sigue En el caso de que existan valores
/
.
2 8 8 es el 6:
repetidos (llamados tambien empates),
/
2 9/ el rango que les corresponde es igual
/ 6`7`8`9`10
8
/ &
5
-
2 10 , al promedio de los rangos, es decir:
3 11 /
/ para el 3, empezando con
la suma de los lugares asignados de
3 12 / el rango 11: manera secuencial entre el numero
/
.
%
3 13 13 de veces que se repite cada respuesta.
/ 11`12`13`14`15
3 14 /
/
/ 5 13
-
3 15,
4 16// para 4, empezando con
4 17/ el lugar 16:
/
.
4 18 18
/ 16`17`18`19`20
4 19//
/ 5 18
-
4 20
i i
i i
i i
y en R3 a los deltercero,se deben sumar los rangos para cada grupo por
separado p R1 , R2 y R3 q y obtener el promedio de rangos para cada
grupo, dividiendo la suma de rangos entre el numero de sujetos en el grupo
pR1 , R2 y R3 q.
Tabla 4.6
12
20p21q
rp7qp33.52q ` p7qp135.49q ` p6qp215.21qs p3qp21q
KW 420
1 800020
12
420 p234.64 ` 948.43 ` 1291.26q63 p0.0286qp2474.33q 63
KW 420
1 7980
1 0.053
70.77 63 7.77
8.18
0.95 0.95
5. Se debe buscar el valor crtico de KW en tabla correspondiente, para ello se
utiliza el numero de sujetos de cada grupo y se selecciona el valor crtico de
acuerdo con el nivel de significancia que se desea utilizar. Sin embargo la
tabla no es util cuando se tiene un grupo con mas de 5 casos o se comparan
mas de tres grupos. En este caso se debe utilizar la tabla de valores crticos de
Chi cuadrada (vease pagina 195) pues podemos asumir que la distribucion es
similar a la de chi cuadrada. Para esta tabla se necesitan calcular los grados
de libertad con gl k 1, donde k es el numero de grupos y establecer
i i
i i
i i
Tamano de los
grupos
n1 n2 n3 0.05 0.01
3 2 2 4.71
3 3 1 5.14
3 3 2 5.36
3 3 3 5.60 7.20
4 4 2 5.33
4 3 1 5.21
4 3 2 5.44 6.44
4 3 2 5.73 6.75
.. .. .. .. ..
. . . . .
5 5 3 5.71 7.54
5 5 4 5.64 7.77
5 5 5 5.78 7.98
Muestras grandes 5.99 9.21
Tabla 4.7: Valores crticos para el analisis de varianza unifactorial por rangos de Kruskal-
Wallis pKWq.
i i
i i
i i
Aunque en nuestro ejemplo tenemos mas de cinco casos por grupo, podemos usar
la tabla con el valor para muestras grandes, ya que se estan comparando solo tres
grupos, en esta encontramos, al nivel de significancia de 0.05, un valor de KW de
5.99, que es igual al de la tabla de chi cuadrada. Al comparar KW obtenida (8.18),
encontramos que es mayor al valor de tabla, por lo que se rechaza la hipotesis nula,
por lo tanto: el nivel de estres es diferente entre enfermeras de terapia intensiva,
enfermeras de ciruga y enfermeras de urgencias.
i i
i i
i i
Tabla 4.8: Valores crticos de z para el numero de comparaciones multiples con hipotesis
bidireccional.
Para las diferencias entre los grupos 1 y 3, as como para las del 2 y 3, se
usa el mismo valor crtico ya que nu es igual a 7 y nv es igual a 6 para ambas
comparaciones, las hipotesis nulas son: Md1 Md2 y Md2 Md3 :
i i
i i
i i
d c
20p20 ` 1q 1 1 20p21q
2.394 ` 2.394 p0.143 ` 0.167q
12 7 6 12
c
420
b
2.394 p0.31q 2.394 p35qp0.31q
12
?
2.394 10.85 p2.394qp3.294q 7.89
i i
i i
i i
En la base de datos se debe tener una variable para los grupos (V. I. que es el
area en la que trabajan las enfermeras) y una que contiene el nivel de estres (V.
D.), en la ventana de dialogo se debe incluir la V. D. en Lista Contrastar varia-
bles y la V. I. en Variable de agrupacion, adicionalmente se deben especificar los
grupos por comparar con el boton Definir grupos, en el dialogo correspondiente
se capturan los codigos asignados al primero y ultimo de los grupos en este caso
terapia intensiva es el 1, emergencias es el 3.
Prueba de Kruskal-Wallis
En primer lugar, se presentan los grupos comparados, con el numero de casos y
los rangos promedio, que se obtienen de dividir la suma de rangos de cada grupo
entre la cantidad de casos en el grupo.
i i
i i
i i
Rangos
Rango
Grupo N promedio
Nivel de estes Enfermeras de terapia
intensiva 7 5.79
Enfermeras de ciruga 7 11.64
Enfermeras de
emergencias 6 14.67
Total 20
Estadsticos de constrastea,b
Nivel de
estres
Chi cuadrado 8.109
gl 2
Sig. asintot. 0.017
a. Prueba de Kuskal-Wallis.
b. Valores de agrupacion: Grupo.
i i
i i
i i
cada grupo entre la cantidad de casos en el grupo, sin embargo este dato es de
difcil interpretacion ya que depende del numero total de sujetos en la muestra.
Se debe mencionar el valor de la prueba estadstica (X 2 ) y comparar el nivel de
significancia obtenido con el que hayamos elegido para la prueba de hipotesis con
que se esta rechazando o aceptando, la hipotesis nula. De acuerdo con el estilo de
la APA (2010) se tienen dos opciones:
1. Sin el apoyo de figuras o tablas se describen las medianas en el texto:
Se observaron diferencias en el nivel de estres entre enfermeras de tera-
pia intensiva, enfermeras de ciruga y enfermeras de urgencias pX 2 p1q
8.109, p 0.05q. Las enfermeras en urgencias presentan el nivel de estres
mas alto pMd 3.5q, seguidas de las enfermeras de ciruga pMd 3q y las
que tienen el nivel mas bajo de estres son las de terapia intensiva pMd 1q.
2. Utilizando figuras o tablas:
Se observaron diferencias en el nivel de estres entre enfermeras de tera-
pia intensiva, enfermeras de ciruga y enfermeras de urgencias pX 2 p1q
8.109, p 0.05q. Las enfermeras en urgencias presentan el nivel de estres
mas alto, seguidas de las enfermeras de ciruga y las que tienen el nivel mas
bajo de estres son las de terapia intensiva (vease figura 4.5).
4 3.5
3
3
Mediana
2
1
1
0
Terapia Ciruga Urgencias
intensiva
Figura 4.5. Nivel de estres entre enfermeras de terapia intensiva, de ciruga y de urgencias
pX 2 p1q 8.109, p 0.05q.
Estos datos se utilizaran para llevar a cabo la discusion posterior de los resul-
tados encontrados en el estudio.
i i
i i
i i
En esta seccion se presentan las pruebas que se tienen que seleccionar cuando el
problema que se debe analizar es de comparacion de muestras relacionadas. En
todos los casos se explica paso a paso el algoritmo para calcular cada una de las
pruebas, posteriormente el analisis utilizando el paquete estadstico IBM SPSS
Statistics version 21 [SPSS] (2012) y se termina cada una explicando la forma de
reportar los resultados siguiendo el manual de la APA (2010).
Nominal
Ordinal
Ordinal
Escalar
Escalar
Anlisis de varianza
t de Student Q de
McNemar para medidas
para muestras Wilcoxon Friedman Cochran
(dicotmica) repetidas
relacionadas (dicotmica)
(ANOVA)
i i
i i
i i
p Dq2
2 2
d D
n
Para calcular los grados de libertad:
gl n 1
i i
i i
i i
X Y D D2
18 20 2 4
16 22 6 36
18 24 6 36
12 10 2 4
20 25 5 25
17 19 2 4
18 20 2 4
20 21 1 1
22 23 1 1
20 20 0 0
10 10 0 0
8 12 4 16
20 22 2 4
12 14 2 4
16 12 4 16
16 20 4 16
18 22 4 16
20 24 4 16
18 23 5 25
21 17 4 16
2
X 340 Y 380 D 40 D 244
x 17 y 19 D 2 n 20
14
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
2. Obtener las diferencias (D) entre los puntajes obtenidos en la primera me-
dicion y la segunda medicion (datos de la columna X menos los datos de la
columna Y).
3. Elevar las diferencias alcuadrado (D2 ) ` 2
4. Sumar las diferencias p Dq y las diferencias elevadas al cuadrado D
5. Calcular la suma de cuadrados de las diferencias
402 1600
d2 244 244 244 80 164
20 20
6. Obtener la desviacion estandar de las diferencias
c
164 ?
SD 8.2 2.864
20
7. Determinar el error estandar de la diferencia media
2.864 2.864 2.864
S D ? ? 0.657
20 1 19 4.359
i i
i i
i i
15
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
i i
i i
i i
20 19
16
17
12
Media
0
Autoestima antes del Autoestima despues del
taller taller
Figura 4.6. Comparacion del nivel de autoestima entre las mediciones antes y despues de
asistir al taller ptp19q 3.044, p 0.05q.
i i
i i
i i
Esta descripcion sera la base para llevar a cabo la discusion posterior de los
resultados encontrados en el estudio.
Prueba de Wilcoxon
La prueba de rangos asignados de Wilcoxon pertenece a las pruebas no parametri-
cas de comparacion de dos muestras relacionadas (Siegel & Castellan, 1995), es
decir:
Es libre de curva, no necesita una distribucion especfica
Nivel ordinal de la variable dependiente
Se utiliza para comparar dos grupos relacionados de rangos (medianas) y de-
terminar que la diferencia no se deba al azar (que la diferencia sea estadsticamente
significativa).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres laboral de los trabaja-
dores de una empresa antes y despues de la implementacion de un programa de
mejoramiento del ambiente laboral; el nivel de estres se midio en una escala de 0
= nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto. Las calificaciones se muestran
a continuacion:
i i
i i
i i
Rango
Ordenar las En el caso de que existan valores repetidos,
diferencias el rango que les corresponde es igual a la suma
mayores a 0 de los lugares asignados entre el numero de
D , veces que se repite cada uno
1 1// para los 1:
1 2
.
1`2`3`4
1 3// 4 2.5
-
1 4*
2 5
para el 2: 5`6
2 5.5
2 6
Vease el tratamiento de rangos en la prueba U de Mann-Whitney
para una explicacion mas detallada.
3. Una vez asignados los rangos se deben acomodar los correspondientes a las
diferencias positivas y los de diferencias negativas en la columna respectiva
y despues sumarlos para obtener T ` y T .
4. Se debe encontrar el valor de probabilidad asociado a T ` pcq con el nume-
ro de casos ajustado (N), en la tabla de valores crticos de T ` . En esta se
muestra la probabilidad asociada para una prueba de una cola, para obtener
16
El nivel de significancia que se establece para las ciencias sociales y en psicologa normalmente
es de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
6p6 ` 1q 42
T ` 10.5
4 4
c c c
p6qp6 ` 1qpp2qp6q ` 1q p42qp13q 546 ?
T ` 22.75 4.77
24 24 24
13 10.5 2.5
z 0.53
4.77 4.77
i i
i i
i i
Tabla 4.9: Valores crticos de T ` para la prueba de rangos asignados de Wilcoxon de una
cola.
Wilcoxon en SPSS
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres laboral de los trabaja-
dores de una empresa antes y despues de la implementacion de un programa de
mejoramiento del ambiente laboral; el nivel de estres se midio en una escala de 0
= nada, 1 = bajo, 2 = medio, 3 = alto, 4 = muy alto.
i i
i i
i i
En la base de datos se debe tener la medicion del nivel de estres laboral (V.
D.) en los dos momentos que fue evaluada, reflejadas aqu como Estres al iniciar
el programa (medicion 1) y como Estres al finalizar el programa (medicion 2),
se deben elegir ambas variables e incluirlas en la seccion de Contrastar pares,
ademas de asegurarse de que este seleccionada la prueba Wilcoxon en la seccion
de Tipo de prueba.
17
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es de
0.05, este puede variar la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
Rangos
Rango Suma de
N promedio rangos
Estres laboral al Rangos negativos 2 a 4.0 8.0
iniciar el programa Rangos positivos 4b 3.2 13.0
Estres al finalizar Empates 1c
el programa Total 7
a. Estres laboral al iniciar el programa Estres laboral al finalizar el programa
b. Estres laboral al iniciar el programa Estres laboral al finalizar el programa
c. Estres laboral al finalizar el programa Estres laboral al iniciar el programa
i i
i i
i i
Estadsticos de contrasteb
Estres laboral al
iniciar el programa
Estres laboral al
finalizar el programa
z 0.541a
Sig. asintot. (bilateral) 0.589
a. Basado en rangos negativos
b. Prueba de los rangos con el signo de Wilcoxon
2.5
2 2 2
Mediana
1.5
1
0.5
0
Estrs laboral antes del Estrs laboral despus
programa del programa
Figura 4.7. Comparacion del nivel de estres laboral antes y despues del programa de me-
joramiento del ambiente laboral pz 0.541, p 0.05q.
i i
i i
i i
Estos datos se utilizaran para llevar a cabo la discusion posterior de los resul-
tados encontrados en el estudio.
Despues
`
A B
Antes
` C D
2 p|B C| 1q2
X
B`C
Donde B y C son las celdillas en las que se esperan los cambios, esta formula
incluye una correccion de continuidad que mejora la estimacion de la X 2 , esto se
hace, como se aprecia en la formula, al restar 1 al valor absoluto de la resta de
B C (quitando el signo resultante de esta resta).
Para la prueba de McNemar siempre se tiene un grado de libertad pgl 1q.
Problema para explicar el procedimiento:
Se desea conocer si la participacion en un taller de socializacion de pacientes
con esquizofrenia cambia al sentirse solos. Para ello se pregunta a los pacientes
si se sienten solos o no antes y despues del taller, los resultados se resumen en la
tabla:
i i
i i
i i
Es un problema de comparacion:
Dos grupos relacionados
Nivel de medicion de la variable dependiente: nominal (dicotomica)
H0 : No hay diferencias en la proporcion de pacientes que se sienten solos antes y
despues del taller de socializacion.
Prueba estadstica: McNemar
Regla de decision: Si el valor calculado es mayor o igual al valor de tabla
seleccionado, considerando el nivel de significancia elegido a priori18 se rechaza
la H0 .
1. En primer lugar deben organizarse las respuestas en una tabla como la si-
guiente. En cada celdilla se capturan la cantidad de sujetos que mantienen
su respuesta (S S o No No) y los que cambian (de No a S o de S a
No):
Sentirse solo
despues del taller
S No
Sentirse solo S 7 16
antes del taller No 4 15
i i
i i
i i
En la base de datos se debe tener la medicion del sentirse solo (V. D.) en los
dos momentos que fue evaluada, reflejadas aqu como Sentirse solo antes (medi-
cion 1) y como Sentirse solo despues (medicion 2), se deben elegir ambas variables
e incluirlas en la seccion de Contrastar pares, ademas de asegurarse de que este se-
leccionada la prueba McNemar en la seccion de Tipo de prueba.
19
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Prueba de McNemar
En primer lugar se presenta la tabla de frecuencias que se mantienen y que
cambian.
Sentirse solo antes del taller y Sentirse solo despues del taller
Sentirse solo antes del taller Sentirse solo despues del taller
S No
S 7 16
dimension0
No 4 15
Estadsticos de contrasteb
Sentirse solo
antes del taller y
Sentirse solo
despues del taller
N 42
Sig. exacta (bilateral) 0.012a
a. Se ha usado de distribucion binomial
b. Prueba de McNemar
i i
i i
i i
80
73.8
60 54.8
%
40 45.2
26.2
20 Si No
0
Sentirse solo antes del taller Sentirse solo despus del
taller
Figura 4.8. Proporcion de pacientes con esquizofrenia que se sentan solos antes y despues
de asistir al taller de socializacion pp 0.05q.
Estos datos se utilizaran para llevar a cabo la discusion posterior de los resul-
tados encontrados en el estudio.
i i
i i
i i
donde:
N = numero total de casos
k = numero de mediciones
R = suma de rangos de cada medicion
Sin embargo, si cuando se hace la asignacion de rangos hay observaciones
empatadas, se debe hacer una correccion a la formula anterior como sigue:
12 R2 3N 2 kpk ` 1q2
Fr (4.11)
Nk t3
Nkpk ` 1q ` pk1q
donde:
t = numero de empates en cada conjunto de rangos iguales por cada sujeto, se
incluyen los conjuntos con rangos unicos (empates = 1).
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres laboral en trabajadores
de una empresa antes y despues de un taller sobre manejo del estres en el trabajo,
ademas se realizo una medicion de seguimiento un mes despues de finalizado el
taller; el nivel de estres se midio en una escala de 0 = nada, 1 = bajo, 2 = medio, 3
= alto, 4 = muy alto, las calificaciones se muestran a continuacion:
i i
i i
i i
20
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Para los datos del presente ejercicio se tienen 3 mediciones por lo que el ran-
go mnimo por asignar a las calificaciones por sujeto es 1 y el maximo es el
3. Sin embargo, cuando existen observaciones repetidas (empates), el rango
que les corresponde es igual al promedio de los rangos, es decir: la suma de
los lugares asignados de manera secuencial entre el numero de veces que se
repite cada numero, por ejemplo: para el sujeto 1 existe un empate con el 3
que se repite 2 veces en las posiciones 2 y 3 por lo que el rango debe ser:
2`3
2 2.5; para el tercer sujeto el 1 se repite 2 ocasiones en los lugares 1 y
2, el rango correspondiente debe calcularse como sigue: 1`2 2 1.5. Final-
mente para el cuarto caso el 2 se repite 2 ocasiones en las posiciones 1 y 2,
el rango correspondiente es: 1`2 2 1.5 (estos son los rangos encerrados en
rectangulos en la tabla de arriba).
2a. Se considera a cada numero repetido como observaciones empatadas y el
numero de veces que se repiten es el valor t, que representa un conjunto de
empates por sujeto: el primer conjunto es el del rango 2.5 del caso 1, que
se repite 2 veces, por lo que para este conjunto t es igual a 2; el segundo
conjunto es el correspondiente al rango empatado igual a 1.5 del sujeto 3,
que se repite 2 veces, por lo que t para este conjunto es igual a 2 y el tercer
conjunto es el correspondiente al sujeto 4 en el rango 1.5, que se repite 2
veces, con un valor t igual a 2. Es decir, existen tres conjuntos de empates,
cada uno con t igual a 2.
Para esta prueba es necesario considerar ademas a todos los rangos no repe-
tidos como un conjunto con t igual a 1, pues se deben incluir en el ajuste de
la formula.
Se pueden resumir estos datos como sigue, escribiendo el valor de t y calcu-
lando t3 y t3 :
i i
i i
i i
6. Una vez hecho lo anterior, se debe buscar el valor crtico para la prueba de
Friedman en la tabla. Para obtener este valor se usa el numero de mediciones
pkq y el numero de sujetos pNq, ademas del nivel de significancia que se elija
para probar la H0 . La regla de decision es: si el valor de Fr obtenido, es
mayor o igual al valor en tabla, se rechaza la hipotesis nula.
Para este ejercicio, con 3 mediciones y 7 casos, usando un nivel de signifi-
cancia de 0.05, el valor de tabla es 7.14, el valor de Fr obtenido (7.28) es
mayor por lo que H0 se rechaza, por lo tanto: el nivel de estres laboral de
los trabajadores es diferente antes del taller para el manejo del estres en el
trabajo, despues del taller y en el seguimiento.
6a. Si se tienen mas casos de los que pueden encontrarse en la tabla de Friedman,
se puede asumir que la distribucion es similar a la de chi cuadrada, por lo que
se debe usar esa tabla (ver pagina 195) para encontrar el valor crtico para
probar la hipotesis nula. Los grados de libertad se calculan con: gl k 1,
donde k es el numero de mediciones. La regla de decision es: si el valor
obtenido es mayor o igual al de tabla, se debe rechazar la H0 .
i i
i i
i i
k N 0.05 0.01
3 3 6.00
4 6.50 8.00
5 6.40 8.40
6 7.00 9.00
7 7.14 8.86
8 6.25 9.00
9 6.22 8.67
10 6.20 9.60
11 6.54 8.91
12 6.17 8.67
13 6.00 9.39
8 5.99 9.21
4 2 6.00
Tabla 4.10: Valores crticos para la prueba estadstica de analisis de varianza de dos clasi-
ficaciones por rangos de Friedman pFr q.
i i
i i
i i
Tabla 4.11: Valores crticos de z para el numero de comparaciones multiples con hipotesis
bidireccional.
i i
i i
i i
Friedman en SPSS
Problema para explicar el procedimiento:
Se desea probar si hay diferencias en el nivel de estres laboral en trabajadores
de una empresa antes y despues de un taller sobre manejo del estres en el trabajo,
ademas se realizo una medicion de seguimiento un mes despues de finalizado ta-
ller; el nivel de estres se midio en una escala de 0 = nada, 1 = bajo, 2 = medio, 3
= alto, 4 = muy alto.
Determinar el tipo de problema, los grupos a comparar, si son independientes
o relacionados, el nivel de medicion, la prueba estadstica que debe utilizarse y
plantear la hipotesis nula que se debe probar de acuerdo con el nivel de medicion
y tipo de problema correspondiente.
Es un problema de comparacion:
Tres grupos relacionados
Nivel de medicion ordinal
H0 : No hay diferencias en el nivel de estres laboral en trabajadores antes del taller
para el manejo del estres en el trabajo, despues del taller y en el seguimiento.
Prueba estadstica: Friedman
Regla de decision: Si p 0.05,21 se rechaza la H0 .
La prueba de Friedman en el paquete estadstico SPSS se encuentra en el
menu Analizar / Pruebas no parametricas / Cuadros de dialogo antiguos / K mues-
tras relacionadas.
En la base de datos se deben tener las tres mediciones del nivel de estres laboral
(V. D.) reflejadas aqu como Nivel de estres antes (medicion 1), Nivel de estres
despues (medicion 2) y Nivel de estres en el seguimiento (medicion 3), se deben
elegir las tres variables e incluirlas en la seccion de Variables de contraste, ademas
de asegurarse de que este seleccionada la prueba Friedman en la seccion de Tipo
de prueba.
21
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza con la
prueba de hipotesis.
i i
i i
i i
Rangos
Rango
promedio
Nivel del estres antes
del programa 2.64
Nivel de estres despues
del programa 1.29
Nivel de estres en el
seguimiento 2.07
i i
i i
i i
Estadsticos de contrastea
N 7
Chi-cuadrado 7.280
gl 2
Sig. asintota 0.026
a. Prueba de Friedman
i i
i i
i i
4
3
3
Mediana
2 2
1
1
0
Estrs laboral Estrs laboral Seguimiento
antes del taller despus del taller
Figura 4.9. Comparacion del nivel de estres laboral en los trabajadores antes y despues de
asistir al taller sobre manejo del estres en el trabajo y en la medicion de seguimiento a un
mes de finalizado pX 2 p2q 7.28, p 0.05q.
Estos datos se utilizaran para llevar a cabo la discusion posterior de los resul-
tados encontrados en el estudio.
Prueba Q de Cochran
La prueba Q de Cochran es una prueba no parametrica de comparacion de tres o
mas muestras relacionadas (Siegel & Castellan, 1995):
Es libre de la curva normal, se ajusta a la distribucion de chi cuadrada
Nivel nominal (solo variables dicotomicas) de la variable dependiente
Se utiliza para comparar tres o mas grupos relacionados de proporciones y
determinar que las diferencias no se deban al azar (que las diferencias sean es-
tadsticamente significativas).
La formula para calcular la Q de Cochran es la siguiente:
pk 1qtk G2 p Gq2 u
Q
k L L2
donde:
i i
i i
i i
X Y Z L L2
0 0 0 0 0
1 1 0 2 4
0 1 0 1 1
0 0 0 0 0
1 0 0 1 1
1 1 0 2 4
1 1 0 2 4
0 1 0 1 1
1 0 0 1 1
0 0 0 0 0
1 1 1 3 9
1 1 1 3 9
1 1 0 2 4
1 1 0 2 4
1 1 0 2 4
1 1 1 3 9
1 1 0 2 4
1 1 0 2 4
29
L
L2 63
G X 13 GY 13 GZ 3
G 29
G2X 169 G2Y 169 G2Z 9
2
G 347
Es un problema de comparacion:
Tres grupos relacionados
Nivel de medicion de la variable dependiente: nominal (dicotomica)
i i
i i
i i
i i
i i
i i
En la base de datos se deben tener las tres mediciones del consumo de drogas
(V. D.) reflejadas aqu como Usa drogas (1era. medicion), Usa drogas (2da. medi-
cion) y Usa drogas (3era. medicion), se deben elegir las tres variables e incluirlas
23
El nivel de significancia que se establece en ciencias sociales y en psicologa normalmente es
de 0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la
prueba de hipotesis.
i i
i i
i i
Frecuencias
Valor
0 1
Usa drogas (1era. medicion) 5 13
Usa drogas (2era. medicion) 5 13
Usa drogas (3era. medicion) 15 3
i i
i i
i i
Estadsticos de contraste
N 18
Q de Cochran 16.667a
gl 2
Sig. asintot. 0.000
a. 0 se trata como un exito
PRUEBAS DE ASOCIACION
En esta seccion se presenta una breve explicacion de lo que significa el valor ob-
tenido en una correlacion llamado coeficiente de asociacion o de correlacion,
as como el signo asociado a ese coeficiente, posteriormente se abordan las prue-
bas si el problema que se debe analizar es de asociacion.
i i
i i
i i
En todos los casos se explica paso a paso el algoritmo para calcular cada una
de las pruebas, posteriormente el analisis utilizando el paquete estadstico IBM
SPSS Statistics version 21 [SPSS] (2012) y se termina cada una explicando la
forma de reportar los resultados siguiendo el manual de la APA (2010).
80 72.2 72.2
60
40
%
20
16.7
0
Final del Seguimiento 3 Seguimiento 6
programa meses meses
Variable 1 Escalar
Pearson (rp)
Spearman (rs) Variable 2 Escalar
Variable 1 Ordinal
Spearman (rs)
Variable 2 Ordinal
Variable 1 Dicotmica
Coeficiente Phi
Variable 2 Dicotmica (r)
Correlacin Biserial
Puntual (rbp)
Variable 2 Escalar u
ordinal
i i
i i
i i
Tipos de Correlacin
Y Y Y
X X X
Directamente proporcional Inversamente proporcional Sin relacin
Y Y
X X
Correlacin curvilnea Correlacin curvilnea
Figura 4.11
i i
i i
i i
Una forma de representar la relacion entre variables son las graficas de disper-
sion, donde cada punto es el lugar en que se cruzan las calificaciones de la primera
variable pXq y la segunda variable pYq para cada sujeto. Si se traza una lnea que
cruce la mayora de los puntos se puede apreciar el tipo de relacion (vease la figura
4.11). En las relaciones curvas, para algunas magnitudes de X, Y incrementa, pero
disminuye en otros valores de X.
donde:
N = numero de sujetos
X, Y = calificaciones de las variables a relacionar
Problema para explicar el procedimiento para calcular la correlacion de Pear-
son:
X Y X2 Y2 XY
26 8 676 64 208
24 12 576 144 288
18 26 324 676 468
17 29 289 841 493
18 30 324 900 540
7 31 49 961 217
15 19 225 361 285
20 18 400 324 360
18 28 324 784 504
2 2
X 163 Y 201 X 3187 Y 5055 XY 3363
p Xq2 26569 p Yq2 40401
N9
i i
i i
i i
en la que los estudiantes con calificaciones mas altas tienen mayor depresion; tam-
bien utiliza una escala de autoestima pYq en la que los puntajes mayores indican
mayor autoestima. Los resultados se muestran a continuacion:
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicion, la prueba
estadstica que debe utilizarse y plantear la hipotesis nula que se va a probar
de acuerdo con el nivel de medicion y tipo de problema correspondiente.
Es un problema de asociacion:
Nivel de medicion intervalar para ambas variables
H0 : No hay relacion lineal entre el puntaje de depresion y el de autoestima
en estudiantes de preparatoria.
Prueba estadstica: correlacion Pearson
Regla de decision: Si el coeficiente calculado es mayor o igual al de tabla
seleccionado, considerando el nivel de significancia elegido a priori24 se
rechaza la H0 .
2. Se tienen que elevar al cuadrado los puntajes obtenidos para la primer va-
riable pXq y los de la segunda pYq y escribirlos en las columnas X 2 y Y 2 .
Multiplicar las dos calificaciones y colocar los resultados en la columna co-
rrespondiente pXYq.
3. Sumar los puntajes de `las variables,
2as
como los puntajes elevados al cua-
drado de cada variable X 2 y Y , y elevar las sumas de las calificacio-
2
2
nes al cuadrado p Xq y p Yq .
4. Calcular la correlacion de Pearson:
p9qp3363q p163qp201q
rp a
rp9qp3187q 26569srp9qp5055q 40401s
30267 32763
a
p28683 26569qp45495 40401q
2496 2496 2496
a ? 0.761
p2114qp5094q 10768716 3281.572
5. Se debe buscar el valor crtico para la correlacion Pearson, para ello se calcu-
lan los grados de libertad pgl N 1q y se establece el nivel de significancia
24
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
i i
i i
i i
En la base de datos se deben tener las dos variables que se van a asociar, por
un lado el Puntaje de depresion (V1) y por el otro el Puntaje de autoestima (V2),
ambas deben ser incluidas en la seccion de Variables. Tiene que estar activa la
prueba de Pearson en la seccion de Coeficientes de correlacion.
25
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
i i
i i
i i
Correlaciones
Correlaciones
Puntaje de Puntaje de
depresion autoestima
Puntaje de depresion Correlacion de Pearson 1.000 0.761*
Sig. (bilateral) 0.017
N 9 9
Puntaje de autoestima Correlacion de Pearson 0.761* 1.000
Sig. (bilateral) 0.017
N 9 9
La correlacion es significante al nivel 0.05 (bilateral)
40
Nmero de sntomas de
30
depresin
20
10
rP = -0.761, p < .05
0
0 5 10 15 20 25 30
Calificacin de autoestima
i i
i i
i i
rP = -0.761*
Depresin Autoestima
* p < 0.05
6 d2
rS 1 3 (4.12)
N N
donde:
N = numero de sujetos
d2 = diferencias entre los rangos asignados a las variables elevadas al cuadrado
Sin embargo, cuando al asignar los rangos hay valores repetidos en alguna de
las variables se debe hacer una correccion y usar la formula que sigue:
pN 3 Nq 6 d2 T X `T
Y
2
rS a (4.13)
pN 3 Nq2 pT X ` T Y qpN 3 Nq ` T X T Y
donde:
T pt3 tq
i i
i i
i i
donde:
t = numero de empates en cada conjunto de rangos iguales para cada variable
Problema para explicar el procedimiento para calcular la correlacion de Spear-
man:
Se desea saber si existe relacion entre la actitud hacia el psicologo pXq y la
actitud hacia la psicoterapia pYq, en un grupo de padres de familia. La actitud es
evaluada como sigue: 1 = muy desfavorable hasta 7 = muy favorable. Los resulta-
dos se muestran a continuacion:
X Y RX RY d d2
6 7 8 9 1 1
7 5 9 7 2 4
5 4 7 6 1 1
3 2 5 2.5 2.5 6.25
4 6 6 8 2 4
2 3 3 4.5 1.5 2.25
2 3 3 4.5 1.5 2.25
1 2 1 2.5 1.5 2.25
2 1 3 1 2 4
2
N9 d 27
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicion, la prueba
estadstica que debe utilizarse y plantear la hipotesis nula que se va a probar
de acuerdo con el nivel de medicion y tipo de problema correspondiente.
Es un problema de asociacion:
Nivel de medicion ordinal para ambas variables
H0 : No hay relacion lineal entre la actitud hacia el psicologo y la actitud
hacia la psicoterapia, en padres de familia.
Prueba estadstica: Correlacion Spearman
Regla de decision: Si el coeficiente Spearman calculado es mayor o igual
al de tabla seleccionado, considerando el nivel de significancia elegido a
priori26 se rechaza la H0 .
26
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
Datos
ordenados
de la Rango
variable 1
pXq
al valor mas pequeno del rango 1, el valor mas bajo
1 1
, posible es el 0
$
2 2. el 2 que se repite 3 veces:
En el caso de que existan valores
2 3 3 2`3`4
repetidos (llamados tambien empates),
3
2 4
- 3 & el rango que les corresponde es igual
3 5 al 3 le corresponde el lugar 5 al promedio de los rangos, es decir:
4 6 al 4 le corresponde el lugar 6
la suma de los lugares asignados de
5 7 al 5 le corresponde el lugar 7
manera secuencial entre el numero
%
6 8 al 6 le corresponde el lugar 8 de veces que se repite cada numero.
7 9 al 7 le corresponde el lugar 9
Datos
ordenados
de la Rango
variable 2
pXq
al valor mas pequeno del rango 1, el valor mas bajo
1 1
* posible es el 0
$
2 2 el 2 que se repite 2 veces: En el caso de que existan valores
2 2`3
2 3* 3 2.5
repetidos (llamados tambien empates),
3 4 el 3 que se repite 2 veces:
& el rango que les corresponde es igual
2 4`5
3 5 2 4.5 al promedio de los rangos, es decir:
4 6 al 4 le corresponde el lugar 6
la suma de los lugares asignados de
5 7 al 5 le corresponde el lugar 7
% manera secuencial entre el numero
6 8 al 6 le corresponde el lugar 8 de veces que se repite cada numero.
7 9 al 7 le corresponde el lugar 9
i i
i i
i i
3, este se repite 3 veces por lo que t para este conjunto es igual 3. Para la
variable Y, hay dos conjuntos de tangos empatados, uno en la calificacion
2 con rango asignado igual a 2.5, este se repite dos veces por lo que t para
este conjunto es igual a 2; el segundo es para la calificacion 3 con rango 4.5
repetido dos veces, por lo que t para este conjunto es igual a 2.
Se pueden resumir estos datos y obtener el valor de T para cada variable
como sigue:
Conjuntos Conjuntos
2 (3) 2 (2.5) 3 (4.5)
de X de Y
t 3 t 2 2
t3 27 t3 8 8
t3 t 24 T X 24 t3 t 6 6 T Y 12
4. Se debe buscar el valor crtico del coeficiente Spearman en la tabla, para ello
se utiliza el numero de casos pNq y el nivel de significancia elegido para pro-
bar la hipotesis nula. La regla de decision es: si el coeficiente Spearman
calculado es mayor o igual al de la tabla se rechaza la hipotesis nula.
i i
i i
i i
N 0.05 0.01 0.001
5 1.000
6 0.886 1.000
7 0.786 0.929 1.000
8 0.738 0.881 0.976
9 0.700 0.833 0.933
10 0.648 0.794 0.903
11 0.618 0.755 0.873
12 0.560 0.727 0.860
Muestras grandes
Cuando la cantidad de sujetos llega a 20 casos y mas, se puede verificar la signi-
ficancia de la prueba convirtiendo el coeficiente de correlacion a calificaciones z
pues se asume que muestras grandes se distribuyen normalmente:
?
z rS N 1
i i
i i
i i
entonces: existe relacion lineal entre la actitud hacia el psicologo y la actitud hacia
la psicoterapia, en padres de familia. Ademas la correlacion es moderada (esta en
el rango entre 0.5 y 0.8) y directamente proporcional (tiene signo positivo).
Spearman en SPSS
Problema para explicar el procedimiento para calcular la correlacion de Spearman:
Se desea saber si existe relacion entre la actitud hacia el psicologo y la actitud
hacia la psicoterapia, en un grupo de padres de familia. La actitud es evaluada
como sigue: 1 = muy desfavorable hasta 7 = muy favorable.
Se debe determinar el tipo de problema, el nivel de medicion, la prueba es-
tadstica que debe utilizarse y plantear la hipotesis nula que se va a probar de
acuerdo con el nivel de medicion y tipo de problema correspondiente.
Es un problema de asociacion:
Nivel de medicion ordinal para ambas variables
H0 : No hay relacion lineal entre la actitud hacia el psicologo y la actitud hacia la
psicoterapia, en padres de familia.
Prueba estadstica: Correlacion Spearman
Regla de decision: Si p 0.05,27 se rechaza la H0 .
El coeficiente de asociacion Spearman en el paquete estadstico SPSS se en-
cuentra en el menu Analizar / Correlaciones / Bivariadas.
27
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
En la base de datos se deben tener las dos variables que se van a asociar, por un
lado la Actitud hacia el psicologo (V1) y por el otro la Actitud hacia la psicoterapia
(V2), ambas deben ser incluidas en la seccion de Variables. Se tiene que activar la
prueba de Spearman en la seccion de Coeficientes de correlacion.
i i
i i
i i
Correlaciones no parametricas
Correlaciones
Actitud hacia
Actitud hacia la
el psicologo psicoterapia
Rho de Spearman Actitud hacia Coeficiente de
el psicologo correlacion 1.000 0.769a
Sig. (bilateral) 0.015
N 9 9
Actitud hacia Coeficiente de
la psicoterapia correlacion 0.769a 1.000
Sig. (bilateral) 0.015
N 9 9
a. La correlacion es significativa al nivel 0.05 (bilateral)
rS = 0.769*
Actitud hacia el Actitud
Psiclogo hacia la psicoterapia
* p < 0.05
Figura 4.14. Relacion entre la actitud hacia el psicologo y la actitud hacia la psicoanalista
en un grupo de padres de familia.
i i
i i
i i
Estos datos se utilizaran para llevar a cabo la discusion posterior de los resul-
tados encontrados en el estudio.
|BC AD|
r a
pA ` BqpC ` DqpA ` CqpB ` Dq
donde:
A, B, C y D son las frecuencias observadas en una tabla de datos cruzados de 2 2
A B A`B
C D C`D
A`C B`D N
Consumo de alcohol
del padre
No bebedor Bebedor Total
Consumo de alcohol No bebedor 80 30 110
de estudiantes de Bebedor 9 21 30
preparatoria Total 89 51 N = 140
Procedimiento:
1. Se debe determinar el tipo de problema, el nivel de medicion, la prueba
estadstica que va a utilizarse y plantear la hipotesis nula que va a ser probada
de acuerdo con el nivel de medicion y tipo de problema correspondiente.
Es un problema de asociacion:
i i
i i
i i
| 1410| 1410
0.364
3870.233 3870.233
4. El coeficiente Phi esta relacionado con la prueba de chi cuadrada, por esa
razon debe calcularse la chi cuadrada de 2 2 (formula de la pagina 195)
y comparar el resultado con la tabla de valores crticos que se encuentra en
la pagina 195. La regla de decision para rechazar la hipotesis nula al de-
pender de la prueba de chi cuadrada es: si se rechaza la H0 relacionada
con la prueba de chi cuadrada, tambien debe ser rechazada la hipotesis
nula de la correlacion Phi.
4a. Calcular la chi cuadrada:
140 2
140 p80qp21q p30qp9q 2 p140qp1680 270 70q2
X2
p110qp30qp89qp51q 14978700
28
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
Recuerdese que se tiene que comparar la chi cuadrada obtenida con el valor de
tabla de valores crticos de chi cuadrada (vease la tabla en la pagina 195), este
valor se busca utilizando un grado de libertad y el nivel de significancia elegido
para probar la hipotesis nula. La regla de decision es: si el valor de X 2 obtenido
es mayor o igual al de tabla se rechaza la hipotesis nula.
Con 1 grado de libertad al nivel de significancia de 0.05 se tiene un valor de
X 2 en tabla de 3.841, el valor obtenido de X 2 (16.783) es mayor al de tabla por lo
que se rechaza la hipotesis nula, por lo tanto la hipotesis nula de la prueba Phi se
rechaza tambien, entonces: existe relacion entre el consumo de alcohol del padre y
el consumo de alcohol de estudiantes de preparatoria. Ademas esta relacion es baja
(esta en el rango de 0.3 a 0.5) y directamente proporcional (tiene signo positivo).
29
El nivel de significancia que se establece en ciencias sociales y psicologa normalmente es de
0.05, este puede variar en la regla de decision a 0.01 y 0.001 si se requiere mayor certeza en la prueba
de hipotesis.
i i
i i
i i
i i
i i
i i
Medidas simetricas
Sig.
Valor aproximada
Nominal por Phi 0.364 0.000
nominal V de Cramer 0.364 0.000
N de casos validos 140
a. Asumiendo la hipotesis alternativa
b. Empleando el error tpico asintotico basado
la hipotesis nula
i i
i i
i i
r = 0.364* Consumo de
Consumo de Alcohol de
Alcohol del Padre Estudiantes de
Preparatoria
* p < 0.05
Figura 4.15. Relacion entre el consumo de alcohol del padre y el consumo de alcohol de
estudiantes de preparatoria.
REFERENCIAS
[3] Haber, A. & Runyon, R. P. (1973). Estadstica general. Bogota: Fondo Edu-
cativo Interamericano.
i i
i i
i i
[6] Pagano, R. R. (2008). Estadstica para las ciencias del comportamiento. (7a.
ed.). Mexico. D. F.: Cengage Learning Latinoamerica.
[7] Ritchey, F. J. (2008). Estadstica para las Ciencias Sociales. (2a. ed. En
espanol). Mexico: Mc Graw Hill.
i i
i i