Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Esta guía pretende llevar a cabo una introducción a los conceptos básicos del contraste de hipótesis
estadístico. Con su lectura se puede dar respuesta a dos preguntas fundamentales: ¿Qué tipo de
análisis estadístico es adecuado para analizar los datos? y ¿cómo se interpreta esa inforn1ación
estadística?
, ,
l. ESTADISTICA DESCRIPTIVA E INFERENCIA ESTADISTICA
El análisis estadístico puede agruparse en dos vertientes diferenciadas. Por un lado, la estadística
descriptiva, que se encarga de describir las características de los sujetos que forman parte del
estudio para presentar la información de forma organizada y resumida, por ejemplo, qué cantidad
o proporción de mujeres y hombres, sus edades, sus niveles en las variable de interés, etc. Y, por
otro, la estadística inferencia! que trata de contrastar hipótesis partir de los datos de la muestra
para que puedan generalizarse a la población.
Esta generalización de los resultados depen derá en parte del proceso de selección muestra! y su
tamaño. No obstante, contar con muestras pequeñas no es un impedimento para realizar
contrastes estadísticos utilizando una metodología rigurosa y correcta.
Univariada
Descriptiva
.Bjy..ar.iad.a
_(_C_on:.ela.cio_o_e_s_)
Estadística
Pruebas
Paramétricas
Inferencia!
(Contraste de
Hipótesis)
Pruebas No
Paramétricas
2
Enrique Navarro Asencio (@eduktive)
investigación no tiene ese objetivo y solo pretende describir un grupo de sujetos, las correlaciones
son estadísticos descriptivos.
Esa inferencia, por tanto, permite la generalización de los resultados de una muestra a la población
en términos de probabilidad. Esta generalización de los resultados dependerá principalmente del
proceso de selección muestra! que debe garantizar la representatividad de la muestra.
Antes de comenzar con la descripción de las diferentes pruebas que se utilizan para el contraste de
hipótesis en estudios con datos empíricos, conviene introducir algunos conceptos básicos.
3
Enrique Navarro Asencio (@eduktive)
4
Enrique Navarro Asencio (@eduktive)
quien decide qué niveles o modalidades tiene esa variable y permite distribuir a los sujetos de
forma aleatoria en esos niveles, como diferentes dosis de medicamento o diferentes modalidades de
un programa de intervención (control, experimental). En can1bio, son variables asignadas si no
pueden ser manipuladas por el investigador, es decir, son características propias de los sujetos
como el género, nivel educativo, edad, etc.
El investigador quiere comprobar si los resultados en creatividad de los chicos y las chicas son
estadísticamente iguales. Esta hipótesis para ser contrastada en primer lugar se formula en
términos estadísticos.
Una hipótesis estadística es una afirmación sobre las características de una distribución de
probabilidad y surge de la hipótesis de investigación formulada. Siguiendo con el ejemplo anterior
y considerando que la creatividad se ha medido en una escala de intervalo, el investigador quiere
probar si las medias de chicos y chicas son iguales.
La hipótesis de investigación es el origen de las hipótesis estadísticas, pero no son exactamente lo
mismo. Mientras que la hipótesis de investigación hace referencia a algún aspecto observado de la
realidad, las estadísticas hacen referencia a la distribución de probabilidad que, en este caso, como
se cuenta con una variable cuantitativa (distribución normal), se formula sobre la distribución de la
media:
Mediachicos= Mediachicas
Las hipótesis estadísticas son siempre 2: Nula (representada por Ho) y alternativa (representada p
La hipótesis nula es siempre la hipótesis que se somete a contraste y siempre se formula en
términos de igualdad cuando se comparan los resultados de dos o más grupos o de negación
cuando se trata de correlación, es decir, indica que no hay correlación entre variables o que el valor
de la correlación es igual a cero. En cambio la hipótesis alternativa incluye el resto de resultados
posible que no se establecen en la nula.
Las hipótesis estadísticas se formulan de esta manera para que rechazar la hipótesis nula suponga
auton1áticamente la confirmación de la alternativa, Ambas son complen1entarias y mutuamente
excluyentes. Por ejemplo, en el caso de buscar la relación entre dos variables la hipótesis nula (Ho)
quedaría formulada de la siguiente forma:
5
Enrique Navarro Asencio (@eduktive)
0,75
50% 50%
0,5
0,25
G
5000 LANZAMIENTOS
FIGURA 3. DISTRIBUCI N BINOMIAL CON IGUAL PROBABILIDAD
6
Enrique Navarro Asencio (@eduktive)
Utilizar variables cuantitativas que cumplen con los requ1s1tos de normalidad, como ya se
mencionó en el tema anterior, es uno de los supuestos que se deben cumplir para utilizar pruebas
estadísticas paran1étricas. En can1bio, si la distribución de puntuaciones no cumple con la
normalidad se deberán emplear pruebas no paramétricas.
• Pruebas Paramétricas: se utilizan con variables cuantitativas y con una muestra
suficiente de sujetos (al menos 30 casos por grupo). Estos requisitos son necesarios para
obtener una distribución normal de las puntuaciones en la variable analizada.
• Pruebas NO Paramétricas: se utilizan con variables dependientes cualitativas, ya
sean ordinales o nominales. También cuando se cuenta con variables cuantitativas pero
no se alcanza el tamaño mínimo recomendado.
La decisión de emplear un tipo de pruebas u otras depende de las características de las variables
que forman parte de la investigación. Para utilizar pruebas paramétricas las variables deben
cumplir una serie de supuestos:
• Variables dependientes cuantitativas: medidas en escalas de intervalo o razón. En
algunas ocasiones variables ordinales pueden considerarse cuantitativas si cumplen con
el supuesto de normalidad
• Normalidad de las puntuaciones: las variables objeto de estudio deben tener
distribución normal, es decir, con forn1a de can1pana de Gauss. Este supuesto puede
comprobarse con la prueba de Kolmogorov-Smirnov, pero si se cuenta con variables
cuantitativas y un tamaño muestra! suficiente (30 casos).
1
Conviene recordad que la varianza es un estadístico descriptivo de dispersión
8
Enrique Navarro Asencio (@eduktive)
2. Correlación: Pearson
B. No Paramétricos
1. Diferencias entre grupos: U de Mann-Whitney, H de Kruskal-Wallys y W de
Wilcoxon
2. Correlación: Spearman, Tau b, Tau c, Gamma y Chi-cuadrado, biserial-puntual
El estadístico siempre va acompañado de un valor de probabilidad asociado. Normalmente se
nombra como sig. (bilateral) o P-valor. Este valor es el que determina si el estadístico calculado ha
resultado significativo.
NIVEL DE SIGNIFICACIÓN
Cada estadístico estimado en un contraste de hipótesis, ya sea paramétrico o no paramétrico, de
correlación o comparación, siempre se acompaña de su probabilidad de ocurrencia de la hipótesis
nula (p-valor).
Esta probabilidad asociada al estadístico indica el número de ocasiones (cuántas veces de cada 100,
es una proporción) que s e cumplirá la hipótesis nula. Ese valor se debe comparar con un valor de
probabilidad, elegido por el investigador, que establece el límite para considerar que una hipótesis
se cumple. Ese valor de comparación es el nivel de significación o nivel de error que se espera
cometer (a) y en investigación social no debe superar el 5%, es decir, una probabilidad de 0,05.
Para aceptar la hipótesis nula deberá cumplirse más del 5% de las ocasiones, por tanto, debe tener
una probabilidad asociada que supere el 0,05.
Unos valores bajos de probabilidad asociada al estadístico inferior o igual al nivel de error (5% o
inferior o igual a 0,05) señalarán que la hipótesis nula no se cumple el número suficiente de
ocasiones y, en consecuencia, deberá rechazarse y, por tanto, aceptar la hipótesis alternativa. En
cambio, si la probabilidad supera ese valor deberá aceptarse.
Ese 5% (a=,05) es el lín1ite establecido por consenso en investigación. No obstante, si el resultado
de la probabilidad es igual o inferior al 1% (p = ,01) indica que la hipótesis nula solo ocurre una de
cada 100 veces. Si esa probabilidad es del 0,1% (p= ,001) nos indíca que ocurre una de cada 1000
ocasiones. Cuanto más bajo sea el nivel de significación más seguridad habrá al rechazar la
hipótesis nula.
Siempre que se realiza un contraste de hipótesis estadístico hay cierta probabilidad de error. Ese
5% indica también el error que se asume en el contraste de hipótesis. Utilizar este punto de corte
del valor de la probabilidad conlleva asun1ir un 95% de nivel de confianza, pero es posible aunque
poco probable que rechacen1os una hipótesis nula cuando es cierta, o que la aceptemos cuando es
falta. Los distintos tipos de error que pueden cometerse se resumen en la siguiente tabla:
Realidad
Ho cierta H0 Falsa
Correcto El,«.t'9ol
No Rechazo Ho
El tratamiento no tiene efecto y B tratamiento si tiene efectD
así se decide. pen, nolo pen:lblmas.
Robustez estadística Probablldad 11
Rechazo H0
··••1'9o•
B bataiNlnlD no tiene etem,
Correcto
El tratamiento tiene efecto y el
Acepto H 1 pen, adeddeq• sL experimento lo confirma.
P.obablldada Potencia estadística
Por tanto, cuando se rechaza la hipótesis nula es porque tiene poca probabilidad de ocurrencia. En
un análisis de correlación la hipótesis nula se formula en términos de negación de la relación entre
las variables de rendimiento. Y, por tanto, la obtención de un valor de probabilidad inferior a 0,05
quiere decir que esa falta de relación, la hipótesis nula, ocurre menos del 5% de las veces y debe ser
rechazada. En el otro 95% de los casos la relación es significativa. De forma opuesta, cuando el
valor de probabilidad supera ese 0,05 la hipótesis nula tiene una probabilidad de ocurrencia
suficiente para no ser rechazada.
1.5 CLASIFICACIÓN DE ANÁLISIS ESTADÍSTICOS PARA EL CONTRASTE
DE HIPÓTESIS.
En este apartado se presentan los estadísticos más habituales para contrastar hipótesis de
correlación o de comparación de grupos, diferenciando entre paramétricos y no paramétricos.
Los dístintos análisis de correlación que se incluyen en esta guía están representados en la Figura
6. El coeficiente Pearson se emplea con variables cuantitativas y tamaños muestrales grandes (por
encima de 30 casos). El coeficiente Spearman (también tau-b, tau-e y gamma) se emplean cuando
no se alcanza ese tamaño muestra! o cuando las variables analizadas tienen naturaleza ordinal.
Cuando se correlaciona una variable cualitativa dicotómica y otra cuantitativa se utiliza la
correlación biserial-puntual. Finalmente, el coeficiente chi-cuadrado analiza la relación entre
variables cualitativas nominales o entre una variable non1inal y otra ordinal.
El estadístico chi-cuadrado tiene variantes en función del nún1ero de niveles de la variable
nominal. Si las variables tienen el mismo número de categorías, especialmente si las variables a
correlacionar tienen dos únicas categorías, se utiliza el coeficiente de contingencia. En cambio, si el
número de niveles es distinto se en1plearía chi-cuadrado.
Cuaiitatlvas Ordinales
Descrl ptiva BI variada
(Correlación) (.SRe.a.o:o.a.o,
t.au.b,
tau.e, gamma)
10
Enrique Navarro Asencio (@eduktive)
T de S.tudeot para
1 grupo
una muestra
Independientes
{T de Student)
Paramétrica 2 grupos
Relacionados
�
{T de S.tu.d.e.nt)
Independientes
{ANOVA)
VD. Ordinal o
Nominal (Chl
1 grupo
Cuadrado como
bondad de ajuste)
2 grupos
N o Paramétrlc a
Relacionados
(Me N.e.m;,r)
VD. Ordinal (H de
Kruskal Wallis)
1 ndepend lente-s
Relacionados
vo y V I nomina1
(Friedman)
11
Enrique Navarro Asencio (@eduktive)
Todas las pruebas paramétricas y no paramétricas se describen en esta guía excepto aquellas que se
utilizan para comparar más de dos grupos relacionados (ANOVA de medidas repetidas, Friedman y
Q de Cochran). Se excluyen debido a su alta complejidad de interpretación y porque son poco
utilizadas en este campo de estudio. Las pruebas para grupos relacionados, tanto paramétricas
como no paramétricas, normalmente comparan únicamente dos grupos: un pretest con un postest.
Grupo A Grupo B
Media en Razonamiento Espacial= 9,75 Media en Razonamiento Espacial = 5,25
12
Enrique Navarro Asencio (@eduktive)
Grupo A Grupo B
Raz. = 4,5 .r. -3.al.
···�--- · · · --;;a.
...................·····- · .......... _1.
, hl,···········
Raz. = 8 i..._,
,·····�·.. ...........,_ ················-�·············,
.. ..
....... . • .J
........
i
,,.....
La otra opción, ya mencionada, para forma grupos relacionados es la utilización de los mismo
sujetos en varias ocasiones de medida, es decir, la comparación de los resultados de un pretest con
un postest.
13
2 . PRUEBAS ESTADiSTICAS {PARAMtTRIC\S Y NO
PARA.MtTRICAS)
··""" -� ..... .... '""'*"''"" ... ,.'!.t�d •
........,_:r.:._.....,..__.,,.........,..._:-0... __
o..n .. y,, .. i..-....,
...... l•p<
......IW'"',.,__ ,nloli,V....
..w ..............-................
,i........
(:
!::."'..:::.tr!:!':t::::.:."d'=i:..':i:'..t ·-·
. "'
1 •..··- ......
..
_.,o14.,
.._...,...... 1o
..,"'-"'" ........... ..... .. ...................... -,i,_,..__,
••,....__..___ _.................... - ......
1n.,.,, .......-.._.,_
.....iün··--•-"'*'•
-· ............. "'""" -6"'"-. :¡,.. ...,,¡,_ .......... --·-�·"'
,_ - ._i., ....,..,.,. ..., ,...., -1 -"'"* .,.,..., "'.,...,,.
d•f"'•h•u••
....,,_..., .,._,.....,..,..,............ ni--,,•-1.'-ol•Jil-d•b•®••
·-
......
mn,,....,.¡,,.;i
,.""�1....................-.....
. t.,................................
_.....
..,.....,..............-"'"........ ...
Tlodo..
0.......................t,J,,fse'*-"..
,n11..i. tto- .... "
I•-...................................... . ...
....
• id -- ........ .- ..... ... ,___ ... "'...,,u. ...e_..
...., ...... ...
(_........ ... .t-)...t,,d�•••........,.8"<-{v,n,b'-iod"'-l...-.
� .. -...................-•.i.
........11"4'.(on'4
J ... \.,.......� ...........i.. ....J.t,a,o"'-.
,ldó,..,i,....
�u . J,n.1�.\'(.'U .•l :.\",'.ltt. J..I.>"'.\','IA('.J,;l,\J..>J.>J. l>(>.hJU ,� ,.
/ 'Jc \ '11�\(J,; YJlt UIA tPLHI It..\f
J\. JU
............. ..-i....dobt-6.............. � .. ........ ...i.,._i...-. r.... ....
l; .�..
, \b,
.. � ..- .._ .... .b..... 1 ...... , .... " ......,....d J,.., - ....-.
� ,. -·"'"'
.. �r- o,,•......,,..;. _...,_ .........,.... v,hnb,..l
Enrique Navarro Asencio (@eduktive)
2.1.1 DIFERENCIAS
ENTRE IAS PUNTUACIONES DE DOS GRUPOS
INDEPENDIENTES. PRUEBA T DE STUDENT
La variable independiente debe tener únicamente dos categorías independientes. Es decir, solo
pueden compararse dos grupos distintos y sus niveles o categorías deben ser mutuamente
excluyentes. Por ejemplo, e l género (hombre-mujer), rendimiento categorizado (alto-bajo),
14
,...........�.......i. ...i.--·,�-i)ll,..'lqJ._.,,...,,._ ,. ,.. ,..._
........,....,<i,-.0...,..,..........P".........).-.
,_....__
!k--- � ... ........... ,_, _d....... .....,.............
tJ ..,.._,...,,..¡..,...-t, ¡.-,.•:1.-•d;;....,
l .-.__,.¡ •.,•!• d,t,b. !J"'p••T•
l!l'!'(I...................
.i.,_..i..,w ...., d-ti..,;.,. '"""'- "" -� d6,,n,. ..,,_ �'/ Ju_,,. .. .t
,_I"'_,.,,......
_..._
Íl�·-•'P"..............,, .. 1
•.u.,,...,__,........... _ _
1
............ ..... _..,.._ ,,,....,_ . ..
""""""'••l••••••1t""'"''-
"'*'P"•"-'1* ....... ... .,..,_
, .. .......
,......,.,. :,.'""",:., -...u.-.,..,. _.......,._ ..� ... .¡ .........
......,..,
....-.d., -...... ........,.,.w.,..,... t)l'll.. \)io\,U,
. ..,,.,_,._
,...
..,,._ ,.,.
_,,,.... .......
,. ,ii.-�
-...... ...
.......-
.... .....w.,a,,
..
. .................. "' .
......
...()1 ..-.\Wt-,d ,.p-.,,,-.
._ d
1 t:,H _1,14, --, .....,, .u..., .... 1......... ..., ..... c,,,.-df1 -......
. .....,..,.,....,.""._ )
"',__ ,__....
.- ,. ,.. ,. ,. .. .... ...
0,-. . t...,:i:'A\p,1_
. ... 1 ....
.,.. ...1....... ,.
.. ,,...
.
!:':::'.'?:...........,.....-,......,;...
......,... ..I,,............._.. ...,.
¡;;;;;:;:;;;;
. ...._
•.•••.,r..e•-�---..i
......•
_ ,., ...
.�-·-
-,.,,.· .� · m �--- => 1
•
1
1.-w,1,. ......, •-·�·do,.., � ...
...... b,._ - ................ "- ""_.._
.., � 1.....,.
.........�.(\>d"1
.....)
"
Enrique Navarro Asencio (@eduktive)
ence: 3,365
Probabilidad core: 9,434
asociada
'- �=....-!"
- re :
P: 000
The obs erved difference b etween the9roup means is si9nifican t
Tabla 2. Prueba T de diferencias entre dos grupos. Resultados EZAnalyze
1
La tabla de resultados se acompaña de un gráfico de barras que representa las puntuaciones
medias de los dos grupos comparados (ver la Figura 11)
15
Enrique Navarro Asencio (@eduktive)
9,000
8,000
7,000
6,000
S,000
4,000
3,000
2,000
1,000
,000
Muj"
Esta misma tabla se muestra también los resultados del ANOVA Para comprobar si existen
diferencias entre los grupos se observa el valor de la probabilidad asociada al estadístico F de
Snedecor (P). Esta probabilidad tiene un valor de 0,001, valor inferior a 0,05. Como la
probabilidad de ocurrencia de la hipótesis nula es muy baja debe ser rechazada y, por tanto,
aceptar la alternativa y afirmar diferencias entre los grupos.
EZAnalyze ANOVA Report-ANOVA ofAXENOFO by CONTACT
GrandMean 35,050
N 100
CONT ACT(group)
1
N
37
GroupMean
35,459
=---
Std Deviation
9,873
2 32 30,000 9,333
3 31 39,774 10,459
ANOVA Table
Source ofVariance SS DF MS F
Between Groul!.s 1514,141 2,000 757,07 1 7,738
Within Grou _l!!_ 9490,609 97,000 9 7,8.4- ..,_l ___
Total 11004,750
CP ,oo0
Eta Squared , 1 38=----------
The A NOVA results indicate that at least two ofthegroups differed significantly
Tabla 3. Prueba F de Snedecor (ANOVA)
Como en este caso se cuenta con n1ás de dos grupos, la prueba F de Snedecor no informa entre qué
grupos se producen las diferencias. Para averiguarlo debe observarse la tabla de contrastes
posteriores (Tabla 4). E n esta tabla se comparan las diferencias entre cada grupo por separado, es
decir, el grupo 1 con el grupo 2, el grupo 1 con el grupo 3 y el grupo 2 con el grupo 3.
La forma de interpretar los contrastes posteriores es igual que la de cualquier otro contraste de
hipótesis. En realidad, no son más que pruebas T de Student para cada par de grupos observados.
Debe observarse por tanto, la probabilidad asociada a ese estadístico T (P-Unadjusted). Si ese valor
es inferior a 0,05, las diferencias entre las puntuaciones de los dos grupos son significativas.
En este ejemplo se han encontrado díferencias significativas entre los grupos 1 y 2 y entre los
grupos 2 y 3. En cambio, las diferencias no son estadísticamente significativas entre los grupos 1 y
3. Esta tabla también ofrece información sobre el valor exacto de esa diferencia de medias en la
columna "mean difference"
Post Hoc tests Comparison Mean Difference T-Value P - Unadjusted P - Bo nferroni EtaSquared
Group_l
1 and2 5,459 2,349 ,022 ,065 ,076
1 and3 4,315 1,747 ,085 ,256 ,044
Group_2
2 and3 9,774 3,917 ,000 ,001 ,201
Tabla 4 . Contrastes posteriores (post hoc)
Finalmente los resultados se acompañan de un gráfico de barras que muestra las medias en
xenofobia de los tres grupos comparados (Figura 12).
17
Enrique Navarro Asencio (@eduktive)
41000
40,000
31000
30,000
0
� 25,000
] 20,000
••
:¡; 15,000
10,000
5,000
postest son significativas, siendo más altas en el postest. Esto quiere decir que el programa de
educación intercultural ha mejorado el nivel de conocimientos sobre otras culturas y religiones.
EZAnalyze Results Report- Paired T-Test ofINFORMA2 with INFORMA3
NPairs: 100
Mean Difference: ____ -2,840
SE of Diff.:
Eta Squared:
- - ---- - - - - - -
,208
-
,6 5_ _0___________
____
T-Score: 13,636
P: ,O�Q�O ________ ]
The difference between INFORMA2 and INFORMA3 is si9niftcant
Tabla S. Resultados prueba T para dos grupos relacionados
Los resultados se acompañan de un gráfico de barras que plasma las medias de las puntuaciones
pretest y postest.
14.000
ll,000
10.000
• 8000
J
• 6 000
4 000
2 000
·ººº
ltlFORMA2 IHFORMA.3
Pa iredVariables
También existe la posibilidad de comparar los resultados obtenidos por la muestra en una variable
determinada, por ejemplo, inteligencia, con una puntuación de esa variable que sirva como
referente. Esta puntuación de referencia es un dato conocido, es decir, se ha encontrado en algún
trabajo de investigación con caracteristicas similares, es el dato de la población, etc.
Si el investigador pretende averiguar si la media en nivel de vocabulario de los sujetos de la
muestra difiere de los resultados obtenidos en otra investigación o en la población de referencia.
Por ejemplo, trata de confirmar que la media de su n1uestran en nivel vocabulario es igual a la de la
población, que fue igual a 15. Por tanto, las hipótesis se formularian de la siguiente manera:
• Hipótesis Nula: No existen diferencias estadísticamente significativas en el nivel de
vocabulario de la muestra y un nivel de vocabulario igual 15.
19
Enrique Navarro Asencio (@eduktive)
T-Score: 1,497
Eta ,060 HivddeVO( llhOIMiopr evio(0-30J ,nv
S uared: VatlKll•U
P: ,143
Tabla 6 y Figura 14. Resultados prueba T para una 1nuestra.
Se debe aceptar por tanto la hipótesis nula formulada. No es posible afirmar la existencia de
diferencias estadísticamente significativas entre las dos medias comparadas.
20
Enrique Navarro Asencio (@eduktive)
Este estadístico puede tomar valores entre -1 y +1. El cero quiere decir ausencia de correlación. A
medida que el valor s e acerca a los extremos (-1 o +1) la correlación es más potente. El signo señala
la direccionalidad de la correlación. Un valor negativo quiere decir que a medida que aun1entan los
valores de una variable disminuyen los de la otra (correlación inversa). En can1bio, si el valor es
positivo, a medida que aumentan unos también lo hacen los otros y viceversa (correlación directa).
Por ejemplo, si se seleccionan 30 individuos y se mide su peso y altura. Utilizando estas dos
variables con10 referencia es posible elaborar un gráfico de dispersión como el siguiente (Figura
15):
100
•
90
• • •• • • •
80 • Pesa 76 kg.
• • �
•• • • • •
70
• • • .
60 • •• E
Pesa 50 kg. • •
50 • 0
40 Mide 161 cm. ·-
• �
30 •
140 150 160 170 180 190 200
Figura 15. Gráfico de dispersión con las variables peso y altura
Este gráfico representa con un punto a cada uno de los sujetos estudiados. Este punto representa
su altura y peso concretos y observando su forma de agrupación es posible averiguar la existencia
de cierta tendencia en los datos, como se muestra en el Figura 16.
100
.•. . ..
• ..
90 - .,·
. ·• •
.•. . •• -.•..•
80 •
•'
,.
,.
70 •
• •
60 - • "
·'
••
50 - .,·
•
40 •
30 1 1 1
21
Enrique Navarro Asencio (@eduktive)
A simple vista puede observarse una relación directa entre las variables peso y altura, es decir, a
media que la altura es mayor también lo es el peso. Aunque los gráficos de dispersión permiten
observar el sentido de la relación (ver Figura 17), para conocer el grado exacto de la relación es
necesario calcular un índice de correlación.
.l
330 100
80
70 Cierta relación
60
• inversa
•
50 •• •
• • •••
• • .• • . -
40
30
• •• • • •
20
10
• •
o . . .
140 150 160 170 180 190 200
22
Enrique Navarro Asencio (@eduktive)
}2
• • •
47
•
• • •
42
o
z
w
�
37
•••
32
27
• •
22 • •
17
•
72 82 92 102 112 122 132 JU
DOGMAT
23
Enrique Navarro Asencio (@eduktive)
15 4,5
21 8
16 6
15 4,5
14 3
21 8
4 1
5 2
21 8
DIDIIIIIIDl�DIEIEI
Rango 1 2 3 4,5 ..___4,5; 6 8 8 8
Esto índica que la hipótesis nula planteada tiene pocas probabilidades de ocurrencia y, por tanto,
debe ser rechazada.
Co1nprensión lectora (0-30)
Mann-Whitney U 63,000
Wilcoxon W 234,000
z -2,799
Asy1np. Sig. (2-tailed) ,005
a. Not corrected for ties.
Tabla 9. Prueba U de Mann-Whitney
En este caso se pueden afirmar diferencias en la variable dependiente (comprensión lectora) entre
los grupos. El valor de la probabilidad asociada es igual a 0,005, inferior al 0,05 que se utiliza como
margen de error.
Para conocer qué grupo ha obtenido mayores puntuaciones en la variable dependiente debe
observarse la tabla de rangos. Un mayor rango índica que ese grupo obtiene mayores puntuaciones
en la variable dependiente.
25
Enrique Navarro Asencio (@eduktive)
TestStatisticsª
Co1np rensión lectora (0-30)
Chi-Square 4,738
df 2
Asy1np . Sig. ,094
a . Kruskal Wallis Test
Tabla 11. Prueba H de Kruskal Wallis
Aunque en la tabla aparezca el estadístico Chi-square (chi-cuadrado), el estadístico utilizado es H
de Kruskal Wallis. Chi-cuadrado es solo una transforn1ación porque H no tiene distribución de
probabilidad conocida y, por ese motivo, se transforma en chi para poder asignar esos valores de
probabilidad.
En este caso la probabilidad asociada al estadístico H es de 0,094. Valor que supera el 0,05
establecido con10 límite. Por tanto, no se pueden asumir diferencias estadistican1ente significativas
entre los grupos comparados. Debe aceptarse la hipótesis nula.
26
Enrique Navarro Asencio (@eduktive)
Media de Su1na de
N Rangos Rangos
Nivelde Vocabulario (postest) - Nivel de Rangos Ne gativosª ºª ,00 ,00
Vocabulario (pretest) Rangos Positivosb 3b 2,00 6,00
E1npates< 33<
Total 36
a. Nivel de Vocabulario (postest) < Nivel de Vocabulario (pretest)
b . Nivelde Vocabulario (postest) > Nivelde Vocabulario (pretest)
c. Nivelde Vocabulario (postest) = Nivelde Vocabulario (pretest)
Tabla 12. Rangos. Pru e b a W de Wilcoxon
Es necesario analizar la Tabla 13 para comprobar la existencia de diferencias estadísticamente
significativas entre pretest y postest.
Test Statisticsb
Nivel de Vocabulario
(postest) - Nivelde
Vocabulario (pretest)
z -1,732 ª
Asy1np. Sig . (2-tailed) ,083
a. Basado en rangos ne gativos.
b. Wilcoxon S igned Ranks Test
Tabla 13. Pru eb a Wde Wilcoxon
El valor de probabilidad asociada al estadístico calculado es de 0,083, valor que se encuentra por
encima de 0,05. Por tanto, debe aceptarse la hipótesis nula y no se pueden afirmar diferencias
entre las puntuaciones de pretest y postest.
27
Enrique Navarro Asencio (@eduktive)
VOCA Post
No SuEera SuEera Total
V O C APr
_ No Recuento 10 7 17
e Supera % dentro de COM2 58,8% 41,2% 100,0%
Supera Recuento 5 8 13
% dentro de COM2 38,5% 61,5% 100,0%
Total Recuento 15 15 30
% dentro de COM2 50,0% 50,0% 100,0%
Tabla 14. Tabla de contingencia
Para comprobar si los cambios entre pretest y postest son estadísticamente significativos debe
observarse la siguiente tabla:
Pruebas de chi-cuadrado
Sig. exacta
Valor (bilateral)
Prueba de McNe1nar , 77 4'
N de casos válidos 30
a . Utilizada la distribución bino1nial
Tabla 15. Prueba de 1ncne1nar
El resultado de la prueba indica que la probabilidad asociada al estadístico (0,774) supera al nivel
de error asumido (0,05) y, por tanto, debe aceptarse la hipótesis nula y afirmar que no hay un
mayor número de casos que supere la prueba de vocabulario en el postest que en el pretest.
28
Enrique Navarro Asencio (@eduktive)
29
Enrique Navarro Asencio (@eduktive)
30
Enrique Navarro Asencio (@eduktive)
En la tabla de resultados (Tabla 18) aparecen dos coeficientes de correlación porque es una tabla
simétrica. Incluye los valores de correlación entre madurez lectora y nivel de vocabulario y también
entre nivel de vocabulario y madurez lectora.
El resto de coeficientes de correlación para variables ordinales (Tabla 19) n1uestran valores muy
similares:
Asy1np. Std.
Value Error Aee rox. T Aeerox. Si�.
Ordinal by Ordinal Kendall's tau-b ,902 ,051 8,947 ,000
Kendall's tau-e ,813 ,091 8,947 ,000
Ga1n1na 1,000 ,000 8,947 ,000
N ofValid Cases 36
Tabla 19. Correlación tau-b, tau-e y ga1n1na entre Madurez lectora y nivel de vocabulario catego1izadas.
Todos los coeficientes resultan significativos. Los valores de probabilidad asociada (Approx. Sig.)
son inferiores a 0,05. Un análisis en profundidad de cada uno de ellos indican que tau-b es el que
obtiene un valor más parecido a Spearman (Tau-b= 0,902 y Spearman= 0,916). El coeficiente
Gamma indica una correlación perfecta entre las variables, con un valor de 1. En cambio, tau-e es el
más conservador de los tres, con un valor de 0,813. No obstante, las diferencias entre coeficientes
son mínimas. En todos los casos la intensidad de la correlación es alta.
31
Enrique Navarro Asencio (@eduktive)
Analizando la tabla de contingencia se observa cierta tendencia. Hay un mayor número de casos
con nivel de vocabulario alto y que han asistido a preescolar. En cambio, los que no han asistido a
preescolar tienen un mayor nún1ero de casos con nivel de vocabulario bajo.
Categorización Nivel de Vocabulario
Ba ja Media Alta Total
Asistencia a Preescolar Sí 1 9 6 16
No 6 11 1 18
Total 7 20 7 34
Tabla 20. Tabla de con tingencia de Asistencia a preescolar y nivel de vocabulario
Los resultados también incluyen un gráfico de barras (Figura 20) con la misma información que la
tabla de contingencia:
Bar Chart
Categorización
"1ivel de
Vocabulario
•Boi•
••.eedia
DAiia
:,
o
u
...
Asistencia a Preescolar
"' "'
'"2:4�2..CORRELAci6iiiiiiRi fii.i}i vÁRIÁBLE..CUAUTA.TNA.NOMiiiAL..DICOTOMiCÁ...
YUNA VARIABLE CUANTITATIVA
Cuando contan1os con una variable cualitativa con dos categorías (dicotómica), por ejen1plo,
acertar o fallar un ítem, ser fumador o no fumador, superar o no superar una prueba, etc. y se
pretende correlacionar con las puntuaciones de una variable cuantitativa. En este caso, la
correlación adecuada e s la biserial-puntual.
Este estadístico de correlación es un caso particular de Pearson que se aplica cuando una de las
variables tiene valores de o y 1.
Sus resultados se interpretan de la misma forma que Pearson. El estadístico puede tomar valores
entre -1 y +1 y el cero quiere decir ausencia de correlación. A medida que el valor se acerca a los
extremos (-1 o +1) la correlación es más potente y el signo señala la direccionalidad de la
correlación.
33