Anlisisdedatosinferencialparamtricoynoparamtricoencienciassociales 160906175910

ANLISIS DE DATOS INFERENCIAL PARAMTRICO Y NO PARAMTRICO
Autor: Fernando Martnez Abad (fma@usal.es), Universidad de Salamanca.
NDICE
INTRODUCCIN AL ANLISIS INFERENCIAL DE DATOS EN CCSS ...................................................... 2

FUNDAMENTOS DE LA ESTIMACIN DE PARMETROS .................................................................. 5
DISTRIBUCIONES TERICAS: LA DISTRIBUCIN NORMAL ................................................................... 5
LA DISTRIBUCIN MUESTRAL y DISTRIBUCIN MUESTRAL DE LA MEDIA .......................................... 9
ESTIMACIN DE PARMETROS y CONTRASTE DE HIPTESIS ........................................................ 15
ESTIMACIN DE PARMETROS ......................................................................................................... 15
CONTRASTE DE HIPTESIS ................................................................................................................ 21
CONTRASTES DE HIPTESIS CON SOFTWARE INFORMTICO (SPSS) ................................................ 30
COMPROBACIN DEL SUPUESTO DE NORMALIDAD..................................................................... 32
1. EXPLORACIN INICIAL GRFICA .................................................................................................... 32
2. ESTUDIO DE LOS NDICES DE ASIMETRA Y CURTOSIS .................................................................. 34
3. CONTRASTE DE HIPTESIS ACERCA DE LA NORMALIDAD DE LA VARIABLE.................................. 34
DOS MUESTRAS INDEPENDIENTES .............................................................................................. 36
1. EXPLORACIN DESCRIPTIVA INICIAL ............................................................................................. 36
2. SUPUESTOS PREVIOS ..................................................................................................................... 37
3. CONTRASTE PARAMTRICO: PRUEBA DE T PARA GRUPOS O MUESTRAS INDEPENDIENTES ....... 38
4. CONTRASTE NO PARAMTRICO: PRUEBA DE LA U DE MANN-WHITNEY ...................................... 40
4.1 Una variable de agrupacin y otra cuantitativa ....................................................................................................... 40
4.2 Una variable de agrupacin y otra ordinal ............................................................................................................... 42
DOS MUESTRAS RELACIONADAS ................................................................................................. 45

3. CONTRASTE PARAMTRICO: PRUEBA DE T PARA GRUPOS O MUESTRAS RELACIONADAS .......... 46
4. CONTRASTE NO PARAMTRICO: TEST O PRUEBA DE WILCOXON................................................. 48
K MUESTRAS INDEPENDIENTES ................................................................................................... 50
3. CONTRASTE NO PARAMTRICO: PRUEBA DE KRUSKAL-WALLIS ................................................... 52
4. CONTRASTE PARAMTRICO: ANOVA DE 1 FACTOR ...................................................................... 55
5. EXPLICACIN TERICA: ANOVA DE 1 FACTOR .............................................................................. 58
Anlisis de datos inferencial paramtrico y no paramtrico en Ciencias Sociales Fernando Martnez Abad
INTRODUCCIN AL ANLISIS INFERENCIAL DE DATOS EN CCSS

Tal y como hemos estudiado el curso pasado (paradigmas de la investigacin educativa, T1
Metodologa de Investigacin), cuando se lleva a cabo un proceso de investigacin emprica en el
mbito de las Ciencias de la Educacin desde la perspectiva del paradigma positivista o cuantitativo,
se posee el objetivo primordial de extraer, a partir de los datos obtenidos en la muestra (n) recogida,
conclusiones que sean generalizables a toda la poblacin (N) de la que proviene dicha muestra.
Dicho de manera ms formal, podemos definir la inferencia estadstica como el conjunto de

tcnicas para llegar a inducciones (o inferencias) acerca de una poblacin completa basndose en
datos de una muestra integrante de la misma (Welkowitz, Ewen & Cohen, 1981, p.106).
Ocurre, como ya vimos, que para que fuera posible extraer estas generalizaciones las caractersticas
de la muestra obtenida deban ser similares a las de la poblacin, es decir, la muestra deba de ser
representativa. Si esto no fuera as, la muestra podra estar sesgada, y nos encontraramos con
muchas posibilidades de que los resultados obtenidos distasen mucho de los parmetros reales en
los que se mueve la poblacin. En este caso, el estudio resulta errneo y queda invalidado
simplemente por esta falta de representatividad de la muestra elegida.
POBLACIN
N
MUESTRA
n
Figura 1. Poblacin y muestra
Cabe recordar tambin, que para obtener una muestra representativa se consideraba como lo ms
importante que las caractersticas socio-demogrficas de inters en la muestra (distribucin por sexo,
edad, curso, provincia, nivel socio-econmico, localidad rural-urbana, estado civil, etc.) deban estar
repartidas de manera similar a las caractersticas de la poblacin, y que para conseguir esto existan
diversas tcnicas de muestreo probabilsticas (aleatoria simple y sistemtica, estratificada y por
conglomerados) y no probabilsticas (accidental, intencional y por cuotas).
Podramos preguntarnos en este punto que, dado que se puede cometer un sesgo (error) importante
al seleccionar una muestra inapropiada, por qu no trabajar directamente con la poblacin completa
para evitarlo, asegurando de este modo la representatividad y posibilidad de generalizacin de los
2
resultados obtenidos. Realmente, una situacin en la que se trabaja con la poblacin completa es la
ideal en el marco de la investigacin cuantitativa en Ciencias Sociales. No obstante, en contadas
ocasiones se puede trabajar en la prctica de la Investigacin Educativa con una poblacin completa,
por diversos factores:
En muchas ocasiones, el tamao de la poblacin es infinito, es decir ni siquiera est

claramente definido el alcance de la poblacin, ni se tiene un listado completo de todos los
sujetos que la componen, por lo que el acceso a todos ellos es una labor imposible. Si, por
ejemplo, queremos realizar un estudio a partir de la poblacin de educadores en Castilla y
Len, independientemente de si se trata de educadores en el mbito formal, no formal o
informal, o en cualquier nivel educativo, nos va a ser muy difcil delimitar el tamao y
caractersticas de la poblacin de referencia. En este ejemplo, el acceso a la poblacin
completa ser imposible, ya que no es posible conocer con exactitud (s de manera
aproximada) la distribucin completa de la poblacin. Por tanto, ser imposible disponer de
un listado completo con todas las personas que desarrollan su labor profesional en el mbito
de la educacin en Castilla y Len y, en ltima instancia, acceder a ellas.
Existen otras ocasiones en las que, a pesar de que s es viable obtener un listado ntegro
acerca de todos los sujetos y/o grupos que componen la poblacin, no es recomendable o
posible acceder a la poblacin completa por varios motivos. Estos motivos pueden estar
relacionados con varias cuestiones:
o Los recursos (econmicos, humanos y/o materiales) de los que dispone el grupo que
est implementando la investigacin son demasiado limitados como para poder
establecer un contacto con todos los miembros de la poblacin.
o El tamao de la poblacin es tan elevado y/o parte de la poblacin de tan difcil
acceso que el tiempo y esfuerzo necesarios para obtener informacin de todos los
sujetos no lo posibilita (por la planificacin temporal o cronograma, por falta de
recursos, por rpida obsolescencia de los temas tratados, etc.).
Se desean estudiar las competencias digitales del profesorado de educacin bsica

(Educacin Infantil, Primaria y Secundaria) de centros educativos de Castilla y Len. La
Consejera de Educacin tiene un registro de todo el profesorado, por lo que podemos
obtener un listado completo del mismo. No obstante, tanto el tamao de la poblacin como
la extensin de la propia comunidad autnoma y las posibilidades de acceso a profesores
dificultan poder realizar la prueba de competencias digitales a todos los profesores:
Conforme al cronograma disponemos de 2 meses para el trabajo de campo, 2 investigadores
que disponibles para desplazarse a las localidades de cada profesor y 3000 para gastos de
dietas y desplazamiento. As, dadas las limitaciones, se estima necesario llevar a cabo un
muestreo a partir de ese listado completo de profesores.
Dicho esto, queda clara la importancia capital de establecer tcnicas de muestreo apropiadas y lo
que es ms importante, una vez obtenida la muestra representativa, implementar tcnicas
estadsticas concretas para obtener informacin precisa acerca de la poblacin de referencia a partir
3
de la informacin muestral disponible en el estudio. A este conjunto de tcnicas, que tratan de

ofrecer la informacin poblacional con la mayor precisin a partir de la informacin aportada por la
muestra obtenida, se les denomina como tcnicas inferenciales, o estadstica inferencial. Todo el
procedimiento de la estadstica inferencial, al menos a nivel conceptual, se puede resumir en el
grfico mostrado a continuacin.
Figura 2. Procedimiento de la estadstica inferencial
Resulta que, dadas las cuestiones anteriormente sealadas, en las investigaciones cuantitativas
desarrolladas en el mbito de las Ciencias de la Educacin se emplea de manera generalizada
informacin de muestras de sujetos procedentes de una poblacin para tratar de establecer
conclusiones o generalizaciones acerca de la poblacin completa.
Desde un punto de vista formal, cabe destacar que todos los ndices que se pueden calcular a partir
de una muestra (media, desviacin tpica, mediana, varianza, asimetra, curtosis, coeficiente de
correlacin, etc.) se denominan estadsticos. Estos estadsticos simplemente aportan una
informacin acerca de los sujetos disponibles en nuestra muestra, nunca sobre la poblacin
completa. Por eso surgen las tcnicas de estadstica inferencial, que se emplean para estimar los
parmetros poblacionales de los que provienen esos estadsticos muestrales.
As, partiendo de los datos de una muestra que se supone que es representativa de la poblacin,
podemos estimar, con unos supuestos previos y unos niveles de error previamente asumidos, que
el valor poblacional (parmetro) de un estadstico obtenido en la muestra se encuentra en un
intervalo o rango de puntuaciones. Por ejemplo, si he evaluado el nivel de competencia lingstica en
lengua inglesa de una muestra representativa de profesores de Educacin Primaria de Castilla y Len,
conocida la puntuacin media ( ) en esta variable (estadstico), puedo aplicar las tcnicas
inferenciales para estimar entre qu valores se encontrar la competencia lingstica media () en
toda la poblacin (parmetro) asumiendo un error en esta estimacin de, por ejemplo, el 5% (el
asumido comnmente).
4
FUNDAMENTOS DE LA ESTIMACIN DE PARMETROS

Siempre que tengamos el inters de generalizar los datos obtenidos en una muestra a la poblacin
de referencia, va a ser necesaria la estimacin de los parmetros poblacionales a partir de los
estadsticos descriptivos obtenidos en nuestra muestra. Para poder estimar estos parmetros, las
tcnicas estadsticas parten de unas bases tericas fundamentales relacionadas con la existencia de
distribuciones tericas y con las distribuciones muestrales de los datos. En este apartado se
estudiarn de manera superficial estas dos cuestiones.
DISTRIBUCIONES TERICAS: LA DISTRIBUCIN NORMAL
La mayor parte de las medidas cuantitativas de rendimiento, actitudes, percepciones, etc. tomadas
en el marco de la investigacin cuantitativa en Ciencias de la Educacin (y en las Ciencias Sociales en
general) suelen tener un comportamiento similar en cuanto a la forma de su distribucin: La medida
de la altura de la poblacin, del peso de los bebs recin nacidos, el cociente intelectual, el nivel socio-
econmico, el rendimiento acadmico, etc., poseen distribuciones muy parecidas.
Las caractersticas de estas distribuciones tienen que ver con varias cuestiones:
La mayor parte de los sujetos de la poblacin se encuentran alrededor o cerca de los niveles
medios de altura, peso, cociente intelectual, rendimiento o nivel, mientras que son pocos los
que se alejan mucho del punto central, ya sea por la parte inferior o por la parte superior de
la distribucin.
Aproximadamente, los sujetos se distribuyen de manera simtrica en torno a las
puntuaciones superiores e inferiores a la media.
En suma, la distribucin de puntuaciones en estas variables tiene forma acampanada y simtrica, o

dicho de otra forma, la distribucin de este tipo de variables se ajusta habitualmente de una manera
muy importante a la distribucin normal, tambin conocida como la campana de Gauss.
Figura 3. Distribucin normal o campana de Gauss (Fuente: www.wikipedia.org)
5
La frmula para la obtencin de la funcin de densidad de esta distribucin terica es muy compleja,
ya que estamos hablando de una distribucin continua:
(x,)
A esta distribucin terica la llamaremos a partir de ahora distribucin normal o Z, con una media y
una desviacin tpica , y su notacin habitual ser del siguiente modo: Z(). As, una variable
observada en una muestra tendr una distribucin similar a la normal siempre y cuando la forma de
la distribucin sea similar a esta distribucin terica. Esta cuestin es independiente de la media y
desviacin tpica de la variable1, de hecho, lo ms habitual es estandarizar la media y desviacin
tpica de la distribucin normal a una =0 y =1, o lo que es lo mismo, Z(0,1). Cabe destacar tambin
que el valor mnimo y mximo de esta distribucin, dado que es asinttica, est entre (-, +)
Por tanto, la propiedad fundamental de esta distribucin es que es simtrica y posee curtosis
mesocrtica. Gracias a esta propiedad a la que generalmente se ajustan las distribuciones de las
variables estudiadas, es posible simplificar el conjunto de tcnicas estadsticas empleadas para
estimar los parmetros poblacionales, o lo que es lo mismo, calcular entre qu valores se encontrar
un parmetro poblacional partiendo de unos datos y unos estadsticos muestrales y asumiendo un
nivel de error concreto.
Pero en muchos casos en la investigacin prctica ocurre que a partir de las variables originales
disponibles se realizan una serie de clculos que impiden utilizar directamente la distribucin terica
Z como distribucin de referencia para la estimacin de parmetros, y es necesario emplear otras
distribuciones. Las otras distribuciones empleadas habitualmente son la T de student, la distribucin
2 y la F de Snedecor.
En lo que respecta a la distribucin 2, cabe sealar que es una distribucin terica conformada por
un sumatorio de variables independientes que siguen una distribucin normal Z(0,1) al cuadrado2.
2n
As, como se puede observar en la figura 4, en este caso no se obtiene una distribucin terica
simtrica, sino que, al estar conformada por un sumatorio de cuadrados, la distribucin tiene origen
en el 0, estando su rango de puntuaciones entre (0, +), dado que se trata de una curva asinttica
por el lado derecho. El apuntamiento de la curva de esta distribucin y la intensidad de su cada hacia
el eje x est determinado por el nmero de grados de libertad (n) de la distribucin, es decir, el
nmero de sumas de Z2 del que provenga. Si una variable que sigue esta distribucin proviene de una
suma de 10 variables que provienen de una distribucin normal (Z) al cuadrado, entonces los grados
1
Cabe recordar que, gracias a las propiedades de la media y la varianza/desviacin tpica, podemos modificar la
media o la desviacin tpica de una variable sin modificar su forma. Por lo tanto, podemos encontrarnos
variables con distribuciones muy similares o iguales a la normal con medias y desviaciones tpicas muy
diferentes.
2
La mayor parte de las veces que tratamos de estimar parmetros a partir de distribuciones tericas,
estandarizamos los valores de la media y la desviacin tpica de la variable que entendemos que se distribuye
como una Z a una =0 y =1.
6
de libertad sern 10, lo cual implica que esa curva asociada a la distribucin terica 2 sea de una
manera y no de otra.
Figura 4. Funcin de densidad 2 (Fuente: adaptado de www.wikipedia.org)
En cuanto a la T de student, es la distribucin que se emplea en la estimacin de parmetros como

alternativa a la distribucin normal cuando las varianzas o desviaciones tpicas poblacionales () son
desconocidas. As, la distribucin T posee propiedades similares a la Z, ya que es una distribucin
simtrica asinttica por ambos lados, con puntuaciones por tanto entre (-, +). De hecho, a
medida que los tamaos de las muestras a partir de las que se emplea para la estimacin de los
parmetros son mayores, la distribucin T se aproximar ms a la Z, siendo ambas distribuciones
iguales cuando el tamao o tamaos de muestra tienden a infinito. La formulacin de la distribucin
t es algo ms compleja, ya que procede de una combinacin entre la distribucin Z y la 2:
en donde Z sigue una distribucin normal Z(0,1) y X sigue una distribucin 2 con n grados de
libertad.
Esta distribucin, por tanto, es simtrica, con media 0 y n grados de libertad. Esto quiere decir que en
funcin del nmero de grados de libertad de la distribucin, su forma variar ligeramente. A nivel
general, la distribucin T se representa como una normal. En la figura 5 se puede observar cmo
cambia el apuntamiento de la curva en funcin de los grados de libertad encontrados en la
distribucin terica.
7
Figura 5. Funcin de densidad T (Fuente: adaptado de www.wikipedia.org)
Por ltimo, estudiaremos la distribucin F de Snedecor, basada tambin en la distribucin normal

Z(0, 1), como una distribucin terica proveniente de una divisin entre dos variables que siguen una
distribucin 2:
en donde X es una variable con distribucin 2 con n grados de libertad e Y es otra variable con
distribucin 2 con m grados de libertad. As, en este caso, en lugar de trabajar con un indicador de
grados de libertad, como ocurra en las distribuciones 2 y T, en este caso trabajamos con 2
indicadores n y m. As, se suele notar esta distribucin como Fn,m. La funcin de densidad de esta
distribucin la podemos observar en la figura 6. Ntese que, al igual que la distribucin 2, la
distribucin F tiene el mnimo en el valor 0 y es asinttica por la cola derecha. As, su rango de
puntuaciones es (0, +), como se puede observar en la figura 6.
8
Figura 5. Funcin de densidad F (Fuente: adaptado de www.wikipedia.org)
LA DISTRIBUCIN MUESTRAL y DISTRIBUCIN MUESTRAL DE LA MEDIA
Cuando se extrae una muestra de n sujetos a partir de una poblacin de N sujetos, la muestra
obtenida es una de las otras muchas muestras que se habran podido obtener en base a esa
poblacin. Para poder extraer conclusiones o inferencias acerca de toda la poblacin con respecto a
la variable o variables estudiadas a partir de los sujetos obtenidos en la muestras, es necesario tener
en cuenta que los valores, por ejemplo, de la media o medias de las variables medidas ( ) en la
muestra obtenida pueden no coincidir exactamente con el valor de la media poblacional ().
Analicemos ms en profundidad este aspecto: Sabemos que el clculo del nmero de muestras
posibles de tamao n a partir de una poblacin de tamao N se calcula de la siguiente manera:
9
EJEMPLO 1
Por ejemplo, si tenemos una poblacin de 5 sujetos y queremos obtener una muestra de 2 sujetos,
la cantidad de muestras posibles a obtener son 10. Imaginemos en este mismo ejemplo que
evaluamos el rendimiento en matemticas de los 5 sujetos de la poblacin, obteniendo los
siguientes resultados:
Tabla 1. Distribucin poblacional. Variable rendimiento en matemticas (N=5)
PUNTUACIN (xi)
Mara 6
Pedro 6
Juan 8
Sonia 4
Laura 6
Si calculamos la puntuacin media de la poblacin =(6+6+7+5+6)/5=6.
Podemos tratar de obtener todas las muestras posibles de tamao 2 para esta poblacin.
Tabla 2. Distribucin muestral de la media. Variable rendimiento en matemticas (N=5; n=2)
xi
Mara y Pedro 6; 6 6
Mara y Juan 6; 7 6.5
Mara y Sonia 6; 5 5.5
Mara y Laura 6; 6 6
Pedro y Juan 6; 7 6.5
Pedro y Sonia 6; 5 5.5
Pedro y Laura 6; 6 6
Juan y Sonia 7; 5 6
Juan y Laura 8; 6 7
Sonia y Laura 4; 6 5
As, se puede observar que, por ejemplo, la probabilidad de obtener una muestra con una media de 7
puntos (si se elige en la muestra a Juan y a Laura) es de 1 entre 10 muestras posibles (si
consideramos que todas las muestras posibles han tenido las mismas probabilidades de ser elegidas,
es decir, si el muestreo se ha realizado de manera probabilstica), es decir, existe un 10% de
10
probabilidades o 1/10 de que sea elegida. Por su parte, la probabilidad de obtener una muestra con
una media de 6 puntos es de 4 (Mara y Pedro; Mara y Laura; Pedro y Laura; Juan y Sonia) entre 10
muestras posibles, es decir, de 4/10, o lo que es lo mismo, 2/5 o un 40% de probabilidad.
O visto en una tabla con los datos acumulados:
Tabla 3. Frecuencias distribucin muestral de la media rendimiento en matemticas (N=5; n=2)
ni Pi Pa
5 1 10% 10%
5.5 2 20% 30%
6 4 40% 70%
6.5 2 20% 90%
7 1 10% 100%
As, se puede definir el siguiente grfico de la distribucin muestral de la media en la variable
rendimiento en matemticas para la poblacin definida de N=5 y n=2:
Frecuencia
5
0
5 5,5 6 6,5 7
Grfico 1. Distribucin muestral de la media. Variable rendimiento en matemticas (n=2)
Ntese que de todas las muestras posibles (10), la mayor parte tienen una puntuacin media de 6, es
ms probable obtener una muestra con una puntuacin media igual a la puntuacin media de la
poblacin que una muestra con una puntuacin media de 5 (una muestra de las 10, un 10% de
probabilidades de que salga elegida) o con una puntuacin media de 7 (una muestra de las 10, un
10% de probabilidades de que salga elegida).
EJEMPLO 2
Pensemos ahora en un ejemplo un poco ms complejo, imaginemos que tenemos una poblacin de
10 sujetos (N=10) y que queremos medir el rendimiento en matemticas a una muestra de 5 sujetos
(n=5) de los 10 que componen la poblacin. En este caso, el nmero de muestras posibles que se
pueden extraer aumenta considerablemente:
11
Tenemos las siguientes puntuaciones de los sujetos de la poblacin:

Tabla 4. Distribucin poblacional. Variable rendimiento en matemticas (N=10)
PUNTUACIN (xi)
Mara 3
Julio 8
Claudia 5
Marta 6
Elena 6
Fernando 7
Carmen 4
lvaro 6
Rodrigo 7
Andrs 8
En este caso, la puntuacin media de la poblacin es =(3+8+5+6+6+7+4+6+7+8)/10=6.Todas las

muestras posibles que se pueden extraer de este conjunto de sujetos de la poblacin tienen la
siguiente distribucin:
Tabla 5. Frecuencias distribucin muestral media rendimiento en matemticas (N=10; n=5)
ni Pi Pa
4.8 3 1.2% 1.2%
5.0 7 2.8% 4.0%
5.2 15 6.0% 9.9%
5.4 20 7.9% 17.9%
5.6 28 11.1% 29.0%
5.8 32 12.7% 41.7%
6.0 42 16.7% 58.3%
6.2 32 12.7% 71.0%
6.4 30 11.9% 82.9%
6.6 20 7.9% 90.9%
6.8 13 5.2% 96.0%
7.0 7 2.8% 98.8%
7.2 3 1.2% 100.0%
TOTAL 252 100.0%
Y esta distribucin muestral de la media se puede representar en el siguiente diagrama de densidad:
12
Frecuencia
45 42
40
35 32 32
30
30 28
25
20 20
20
15
15 13
10 7 7
5 3 3
0
4,80 5,00 5,20 5,40 5,60 5,80 6,00 6,20 6,40 6,60 6,80 7,00 7,20
Grfico 2. Distribucin muestral de la media. Variable rendimiento en matemticas (n=5)
Pensemos, en primer lugar, en el porcentaje de las muestras que est en un rango de puntuaciones
determinado; por ejemplo, el 97.6% de todas las muestras posibles obtiene una media en la variable
rendimiento en matemticas de entre 5 y 7 puntos, por lo que es muy poco probable que se obtenga
una muestra de n=5 a partir de una poblacin de N=10 en la que la puntuacin media sea de 4.8 o de
7.2 puntos.
En la estadstica inferencial se juega con esta probabilidad, asumiendo un error (nivel de
significacin) o una confianza (nivel de confianza) en todas las estimaciones de parmetros. En el
caso de este ejemplo anterior, lo ms probable (un 97.6% de probabilidad, o un nivel de confianza
del 97.6%) es que yo obtenga una muestra con un rendimiento medio en matemticas de entre 5 y 7
puntos. As, el error que se asume si se estima que la media poblacional est entre 5 y 7 puntos es
del 2.4% (100%-97.6%). Igualmente, existen un 73% de probabilidades de que obtenga una muestra
cuya puntuacin media est entre 5.4 y 6.6 puntos. As, si yo estimo que la media poblacional
(parmetro) en esta variable est entre 5.4 y 6.6 puntos estoy asumiendo un nivel de significacin del
27% o un nivel de confianza del 73%, un error demasiado grande (hay un 27% de posibilidades de
que la media de la muestra obtenida finalmente no est dentro del intervalo del parmetro
poblacional).
De todos modos, el problema no es tan sencillo como lo planteado en el ejemplo anterior por dos
cuestiones bsicas:
En primer lugar, en los estudios que se implementan en el mbito de las Ciencias de la

Educacin rara vez se tiene un conocimiento exacto de las puntuaciones de toda la poblacin
en la variable, por lo que no se puede calcular directamente la distribucin muestral de la
media a partir de la distribucin poblacional emprica. De hecho, si se conocieran las
puntuaciones de todos los sujetos de la poblacin en la variable o variables medidas no
tendra sentido estimar el intervalo en el que se encontrara el parmetro poblacional (ya lo
conoceramos exactamente) y, por ende, la distribucin muestral de la media.
Por otro lado, normalmente ni los tamaos de la poblacin ni los tamaos de la muestra con
los que contamos en nuestras investigaciones en Ciencias Sociales son tan reducidos como
en el ejemplo, por lo que el nmero posible de muestras a seleccionar es excesivamente
13
grande, y la obtencin emprica de la distribucin muestral de la media en la mayor parte de

los casos es una cuestin muy compleja o imposible si la poblacin es infinita/desconocida.
As, para simplificar y posibilitar la obtencin de la distribucin muestral de la media, la estadstica
inferencial aprovecha las propiedades de las distribuciones tericas (Z, T, 2, F). Antes de continuar,
es necesario aadir dos definiciones bsicas al respecto:
Si una variable se distribuye normalmente, entonces la distribucin muestral de la media

de esa variable tambin tendr una distribucin normal.
En la distribucin muestral de la media, el valor puntual de la media poblacional ()
coincide con el valor puntual de la media muestral ( ).
As, en el caso de que se cumpla el supuesto de normalidad de una variable (que la variable sea
normal), entonces la distribucin muestral de la media de esa variable ser tambin normal.
Podemos ir ms all de esta simple definicin y apoyarnos en el teorema central del lmite para
afirmar que a medida que el tamao muestral crece, la distribucin de la media muestral se
aproxima cada vez ms a la normal, independientemente de la distribucin de la variable que se est
mididendo (Tejedor Tejedor & Etxeberra Murgiondo, 2006, p.52). En este caso, podemos afirmar
que, si una muestra tiende al infinito, su distribucin muestral de la media tender a una distribucin
normal.
Ntese adems que la distribucin de la distribucin muestral de la media en la variable del anterior
ejemplo tiene una forma acampanada (distribucin normal). De hecho, se entiende que la gran
mayora de las variables cuantitativas que se miden en Ciencias Sociales tienen una forma similar a la
distribucin normal, o lo que es lo mismo, las variables de escala que medimos en Ciencias de la
Educacin (rendimiento, actitud, percepcin, etc.) provienen en la mayor parte de los casos de una
distribucin normal. Cuando se cumple este supuesto de normalidad de la variable (o la
fundamentacin del teorema central del lmite), se entiende que la distribucin muestral de la media
de esa variable es normal, y se puede partir de esta distribucin (Z) para estimar el intervalo en el
que se encontrar el parmetro poblacional de la media () a partir del estadstico de la media ( )
obtenido en la muestra. Basadas en la distribucin normal o Z se encuentran otras distribuciones que
(T, 2, F), una vez identificada la distribucin muestral de la media como normal, permiten llevar a
cabo estimaciones de parmetros en diversas situaciones prcticas, como veremos en los siguientes
temas.
Por tanto, como conclusin prctica de este apartado se puede sealar que, si las variables medidas
en nuestra muestra siguen una distribucin normal, es posible aprovechar el potencial de las
distribuciones tericas para estimar los parmetros poblacionales de los que provienen los
estadsticos de inters calculados. Este conjunto de tcnicas de anlisis de datos es el que
aplicaremos cuando llevemos a cabo algn procedimiento estadstico inferencial o de contraste de
hiptesis paramtrico.
14
ESTIMACIN DE PARMETROS y CONTRASTE DE HIPTESIS

Es a partir de las bases tericas estudiadas desde donde es posible extraer inferencias poblacionales
habiendo simplemente obtenido informacin en una muestra (al menos desde una perspectiva
paramtrica). En estos 2 apartados siguientes estudiaremos cmo extraer esta inferencia partiendo
del supuesto de que las variables obtenidas en la muestra proceden de la distribucin normal,
planteada a nivel terico.
ESTIMACIN DE PARMETROS
Ya hemos sealado que, gracias a la inferencia estadstica, es posible estimar con un margen de error
determinado entre qu valores se encontrar en la poblacin (parmetro) un estadstico obtenido en
la muestra. Lo cierto es que, mientras que es posible estimar el intervalo poblacional sobre cualquier
estadstico descriptivo (media, mediana, desviacin tpica, varianza, asimetra, etc.), lo ms habitual
es emplear la media como estadstico sobre el que extraer inferencias3. De hecho, en este curso
estudiaremos a nivel terico simplemente la estimacin paramtrica de la media, aunque a nivel
prctico tambin estudiaremos las tcnicas estadsticas alternativas cuando las distribuciones de las
variables no se ajustan a la distribucin normal.
Decamos que para estimar un parmetro debemos asumir un error en esa estimacin, y que la
estimacin consiste (generalmente) en el clculo de un intervalo en el que tenemos cierta seguridad
de que se encuentra el valor del estadstico que estamos estimando en la poblacin (normalmente la
media). As, en trminos generales, si en una estimacin queremos asumir un error ms pequeo, el
intervalo de confianza ser ms grande. Por qu ocurre esto?, pues lo vemos sencillamente con un
ejemplo:
Imaginemos que me apuesto con un amigo una cena: si soy capaz de calcular correctamente la altura
de un edificio, con un margen de error de 2 metros, mi amigo me pagar la cena, si no, se la pago yo.
En el ejemplo, me est permitido alejarme de la altura real del edificio como mximo 2 metros. As, si
el edificio mide realmente 23 metros, mi estimacin tiene que ser de entre 21 y 25 metros, o lo que
es lo mismo, debe estar dentro del intervalo (21, 25). Dicho de otro modo, tengo un margen de error
de 23 2 (este margen de error de 4 metros como mximo, 2 m por encima y 2 m por debajo, podra
ser considerado como mi nivel de confianza en la estimacin).
Imaginemos ahora que realizo la misma apuesta, pero que en este caso el margen de error en mi
estimacin es de 4 metros.
En este caso, para ganar la apuesta, considerando que el edificio mide 23 metros, debo dar una
estimacin de 23 4, es decir de entre 19 y 27 metros. Quiere decir esto que, al aumentar el tamao
del intervalo de confianza, esto es, al aumentar el nivel de confianza de la estimacin, es menos
probable que yo pierda la apuesta, es decir, que cometa un error en la estimacin.
3
Cuando no es posible considerar que la distribucin muestral de la media de una variable posee la
distribucin normal porque la variable de origen tiene una forma de su distribucin muy diferente a la normal,
se suele utilizar la mediana como estadstico para realizar la estimacin poblacional de la tendencia central de
la distribucin.
15
En el segundo ejemplo, por tanto, mientras que al aumentar el intervalo en el que puede entrar mi
estimacin de la altura del edificio aumenta mi confianza en ganar la apuesta, tambin se reduce la
posibilidad de error.
En la estimacin de parmetros estadstica ocurre exactamente lo mismo que en este ejemplo:
Mientras que en el ejemplo trato de estimar cul es la altura real del edificio a partir de la
informacin obtenida a travs de mis sentidos, permitiendo un margen de error ms o menos
amplio, en la estimacin de parmetros trato de estimar cul es el valor real (poblacional) de un
estadstico a partir de la informacin obtenida en la muestra, permitiendo un margen de error
concreto (intervalo de confianza).
Y, cmo se realiza la estimacin del intervalo de confianza exactamente? Pues bien, para realizar la
estimacin llevamos a cabo varios pasos:
1. Aceptacin del supuesto previo de que la distribucin de la variable a partir de la que quiero
realizar la estimacin es similar a la distribucin normal Z(, ).
2. Establecimiento del nivel de error y de confianza asumidos en la estimacin.
3. Estimacin del parmetro a partir de la distribucin muestral de la media de la variable, bajo
el supuesto previo de que es normal.
1. Supuesto previo de normalidad de la variable observada

La aceptacin de este supuesto previo se puede llevar a cabo mediante la aplicacin de varias
tcnicas estadsticas, que nos van a dar una seguridad suficiente como para aceptar que la
distribucin de la variable y, por ende, de la distribucin muestral de la media, es normal Z(, ). En
el caso ms habitual de que la varianza de la variable estudiada en la poblacin de referencia sea
desconocida, la distribucin empleada para la estimacin ser la T, y la media y desviacin tpica de
la distribucin sern = y = .
Las tcnicas que se emplean de modo ms habitual son las siguientes:
Exploracin grfica de la variable original obtenida en la muestra. Se puede obtener el

histograma y/o el diagrama de cajas de la variable y comprobar de manera visual si la
distribucin es simtrica y si el apuntamiento (curtosis) es muy elevado o muy poco.
Mientras que su empleo puede bastar para asumir la falta de normalidad de una variable
cuando tenemos distribuciones claramente asimtricas, cuando parece que la distribucin es
simtrica y con curtosis mesocrtica esta tcnica suele acompaarse de otro anlisis
numrico que confirme la normalidad de la variable o variables.
Anlisis de los valores de asimetra y curtosis de la variable o variables. Como ya se ha
estudiado el curso pasado, la distribucin normal posee un valor de asimetra=0 y un valor
de curtosis=0, es decir, es una distribucin simtrica y con curtosis mesocrtica. As, se
podran analizar los valores de asimetra y curtosis de las variables directamente para
comprobar si stos son o no son cercanos al 0, como prueba confirmatoria de la exploracin
visual llevada a cabo previamente. Si con este anlisis an tenemos dudas sobre la
normalidad de las variables, podemos aplicar alguna prueba concreta o contraste de
hiptesis, tcnica sealada a continuacin.
16
El contraste de hiptesis commente empleado para comprobar la hiptesis de normalidad

de una variable es la prueba de Kolmogorov-Smirnov. Esta prueba simplemente plantea la
hiptesis nula de que la distribucin de la variable es normal, hiptesis que se rechaza o no
se rechaza. Esta prueba se estudiar en los siguientes temas.
2. Establecimiento del nivel de error y de confianza asumidos
El nivel de error asumido generalmente se denomina nivel o nivel de significacin, y en Ciencias

Sociales se suele emplear de manera generalizada un 5% de error, aunque en ocasiones en las que
interesa mantener errores ms pequeos a la hora de plantear las estimaciones e hiptesis se
emplea el 1% de error. Un trmino ntimamente relacionado con el nivel o nivel de significacin es
el nivel de confianza. El nivel de confianza es igual al valor inverso del nivel de significacin. As, por
ejemplo, si establecemos un nivel de significacin del 5%, el nivel de confianza ser del 95% (100%-
5%). Por otro lado, si el nivel a es del 1%, el nivel de confianza ser del 99%.
Como ya se ha indicado previamente, si el nivel de significacin o de error es del 5%, el intervalo de

confianza de la estimacin de un parmetro ser ms pequeo que si el nivel de error asumido para
la estimacin de ese mismo parmetro es del 1%. Recordemos que esto es as porque, si quiero tener
una mayor seguridad en que no me estoy equivocando en mi estimacin (si quiero asumir un error
menor en mi estimacin), necesariamente deber incluir un rango superior, un intervalo ms grande,
de puntuaciones en las que posiblemente se encuentre el parmetro poblacional (normalmente de la
media). Por lo tanto, si decido asumir un error muy pequeo, es muy probable que el intervalo
resultante en la estimacin del parmetro sea demasiado amplio, y que no me aporte por tanto
demasiada informacin. Por otro lado, si asumo un error muy grande, mi estimacin estar dada en
un intervalo muy pequeo, por lo que mientras que voy a tener una informacin ms clara tambin
va a ser mucho ms probable que mi estimacin est equivocada. El consenso cientfico ms comn
acerca del nivel de error, como hemos sealado, es del 5%, y si no se indica lo contrario, ese ser el
nivel de significacin empleado en adelante.
3. Estimacin del parmetro deseado

Una vez tomadas las decisiones y asunciones previas, llega el momento de calcular el intervalo de
confianza del parmetro. En el caso (ms habitual) de que el parmetro a estimar sea la media,
partiremos, como ya hemos sealado, de la distribucin muestral de la media para llevar a cabo la
estimacin, considerando que la forma de esta distribucin es como la distribucin normal terica ya
estudiada.
Imaginemos que hemos obtenido una muestra de tamao n y queremos estimar el intervalo del
parmetro media en una variable. El objetivo ahora es calcular un intervalo a partir de la media de
esa variable que incluya la mayor cantidad posible de muestras que hubieran podido extraerse de la
poblacin inicial (cada una de ellas con una puntuacin media que puede ser distinta), hasta llegar al
error mximo definido en el paso 2. Por eso debemos volver a la distribucin muestral de la media
para calcular esto. Entendemos en primer lugar que la distribucin muestral de la media de nuestra
variable a partir de la que queremos estimar el parmetro de la media es normal Z(, ). Como
hemos visto antes, a partir de la distribucin muestral de la media de una variable, podemos calcular
en qu porcentaje de todas las muestras posibles su media se encuentra dentro de un intervalo dado
(ver ejemplo 2 pgina 12). O dicho de otro modo, podemos calcular un intervalo alrededor del punto
17
central de la distribucin muestral de la media que incluya un porcentaje determinado de todas las
muestras posibles de tamao n que se podran obtener a partir de la poblacin de referencia.
En la mayor parte de los casos, en los que es imposible obtener la distribucin muestral de la media
emprica porque no se tiene informacin sobre todos los sujetos de la poblacin, si se cumple el
supuesto de normalidad de la variable, se entiende que la distribucin de la media es normal y se
genera el intervalo de confianza alrededor de la media de la variable (estimacin puntual de la media
poblacional) a partir de esta distribucin normal (Z o T, en funcin de si se conoce o desconoce la
varianza poblacional). Aqu, como se puede ver en la figura 6, se puede generar un intervalo
alrededor de la media (por definicin, la media de la distribucin muestral de la media se entiende
que es igual a la media poblacional, que se estima puntualmente a partir de la media muestral) que
incluya un porcentaje concreto de todas las muestras posibles. Este porcentaje debe coincidir
exactamente con el nivel de confianza asumido en el paso anterior.
Figura 6. Distribucin muestral de la media normal (Fuente: adaptado de www.sac.org.ar)
Por definicin, en una distribucin normal Z(0, ), exactamente el 95% de los sujetos de la
distribucin est entre 1.96*. Por tanto, si la distribucin se estandariza a una Z(0, 1), el 95% de los
sujetos y, por ende, el 95% de las todas las muestras posibles en una distribucin muestral de la
media normal, se encontrar en el intervalo (-1.96, 1.96). As, si asumo la normalidad de la variable
original y un error del 5%, tendr un 95% de confianza si afirmo que el intervalo del parmetro media
para una =0 y Sx=1 se encontrar entre -1.96 y 1.96. Si se mantiene todo igual excepto el nivel de
error, que pasa del 5% al 1%, podra afirmar con un 99% de confianza que la media poblacional se
encuentra en el intervalo (-2.58, 2.58). Claro, siempre puedo haber elegido por pura mala suerte o
por errores/problemas en el muestreo una muestra tan extrema que est equivocndome en la
estimacin, este es el error asumido.
18
Ocurre, no obstante, que las variables que obtenemos en nuestros estudios no tienen =0 y Sx=1,
sino puntuaciones totalmente diferentes. En este caso, simplemente aplicando las propiedades de la
media y de la varianza, se puede estimar el intervalo del parmetro ajustado a los valores exactos de
la media y la desviacin tpica de la variable original. La frmula general para el clculo de la amplitud
del intervalo de confianza si se conoce la varianza poblacional es la siguiente:
Donde 1-/2 se refiere al percentil correspondiente a la puntuacin Z que hay que seleccionar,
siendo el nivel de error asumido; y el ET se refiere al error tpico, un valor obtenido directamente a
partir de la varianza de la variable, en este caso:
En el caso de desconocer la varianza poblacional, cuestin que ocurre en la prctica totalidad de los
casos, no podemos emplear la distribucin Z, sino que tenemos que recurrir a la T, y por eso cambia
mnimamente la frmula:
Donde n-1 se refiere al nmero de grados de libertad (igual al tamao de la muestra menos 1) y al
nivel de error asumido. En este caso, el
Cabe destacar que las frmulas anteriores son vlidas para todos los casos en los que se realiza un
contraste de hiptesis basado en las distribuciones tericas Z o T. Lo nico que cambia en el clculo
de la frmula es el clculo del Error Tpico, que es diferente en funcin del tipo de contraste
realizado.
Nosotros trabajaremos en todo caso con esta segunda frmula para la estimacin de la amplitud del
intervalo de las medias poblacionales, ya que los ejemplos que veremos en clase consideran
desconocida la varianza poblacional. As, la frmula que emplearemos definitivamente para el clculo
de un intervalo de confianza para la media poblacional ser la siguiente:
EJEMPLO 3. Clculo de un intervalo para la media
Imaginemos que obtenemos una muestra representativa de n=61 maestros de Educacin Primaria en
formacin en la que medimos mediante una escala el nivel de actitudes hacia el empleo de la Pizarra
Digital Interactiva (PDI) en la docencia. Esta escala tiene un valor mximo posible de 10 puntos y
mnimo de 50, y en la muestra se obtienen los siguientes descriptivos para la variable:
=35.6 Sx=8.3
Tras comprobar que la variable actitudes hacia el empleo de la PDI en la docencia se distribuye
conforme a la distribucin normal, se nos pide que calculemos el intervalo de confianza para el
parmetro media (media poblacional) a partir de los datos de la muestra, tanto para el caso de que el
error sea de =5% como que sea de =1%.
19
Para el caso en el que el error es del 5%, debemos calcular el valor de la T para 60 (n-1) grados de
libertad y un error de 0.025 (por cada lado de la distribucin). Si consultamos las tablas de la
distribucin terica T, resulta que el valor para un nivel del 5% y 60 grados de libertad es de
2.0003.
Podemos observar esto mismo de manera visual. Como se muestra en la figura 7, en una distribucin
muestral de la media con forma T y 60 grados de libertad, el 95% de las muestras posibles estn en el
intervalo (-2.003, 2.003).
Figura 7. Intervalo para un nivel =0.05 en la distribucin t60;0.025 (Fuente: elaboracin propia)
As, ya disponemos de toda la informacin para poder calcular el intervalo del parmetro media:
En conclusin, si establezco una seguridad del 95% en mi estimacin, puedo afirmar que la media
poblacional de la variable actitudes hacia el empleo de la PDI en la docencia se encuentra dentro del
intervalo (33.46, 36.74).
Para el caso en el que el error es del 1%, debemos calcular el valor de la T para 60 (n-1) grados de
libertad y un error de 0.005 (por cada lado de la distribucin). Si consultamos las tablas de la
distribucin terica T, resulta que el valor para un nivel del 1% y 60 grados de libertad es de
2.6603, como se puede observar en la figura 8.
20
Figura 8. Intervalo para un nivel =0.01 en la distribucin t60;0.025 (Fuente: elaboracin propia)
As, ya disponemos de toda la informacin para poder calcular el intervalo del parmetro media:
Ntese que la amplitud del intervalo, en este caso, es mayor que en el anterior, porque estamos
asumiendo un error menor, es decir, que tenemos una confianza mayor (del 99% en este caso) sobre
la estimacin realizada.
CONTRASTE DE HIPTESIS
Todo este artefacto matemtico tiene mucho ms potencial que la simple estimacin del valor o
valores entre los que con mucha seguridad se va a encontrar el estadstico en la poblacin. Las bases
tericas y matemticas de la estimacin de parmetros se emplean de manera generalizada para
tratar de contrastar hiptesis de todo tipo:
Hiptesis sobre un solo estadstico en un grupo o una muestra: Comprobar si es plausible o si

se puede aceptar que una determinada poblacin posee una puntuacin media ()
determinada en una variable estudiada a partir de una muestra. Esto nos puede servir para
determinar el comportamiento de una poblacin, en comparacin con algn fundamento
terico (por ejemplo, si planteo la hiptesis terica de que la poblacin de Finlandia posee un
cociente intelectual superior a 100 puntos, valor medio en toda la poblacin general, puedo
obtener una muestra representativa de ciudadanos finlandeses a la que mido el cociente
intelectual con algn instrumento y estimar posteriormente el intervalo de la media en esa
poblacin. Si toda la amplitud o rango del intervalo calculado est por encima de 100, o lo
21
que es lo mismo, si el lmite inferior del intervalo obtenido es superior a 100 puntos, entonces
puedo aceptar la hiptesis planteada. En caso contrario, no puedo aceptar la hiptesis).
Hiptesis sobre un estadstico en dos o ms grupos o muestras: En muchas ocasiones nos
ocurre que queremos conocer si se puede concluir que una poblacin posee una puntuacin
media ms elevada que otro en alguna variable. Esto nos puede servir, por ejemplo, para
determinar si una poblacin tiene un grado de conocimientos superior a otra, si posee unas
actitudes ms elevadas que otra, etc. (por ejemplo, puedo querer comparar, a partir de la
muestra obtenida en las pruebas PISA, el rendimiento en comprensin lectora de las
poblaciones de estudiantes de algunas comunidades autnomas de Espaa. Para ello,
estimar el intervalo para la media en cada una de las poblaciones por separado y comparar
dichos intervalos en cada pareja. Si los dos intervalos obtenidos en dos de las comunidades no
se solapan en ningn momento, es decir, si los rangos de ambos intervalos no tienen valores
conjuntos, podr afirmar con el nivel de confianza establecido que existen diferencias
significativas en ambas poblaciones. En el caso contrario de que exista alguna parte conjunta
en la amplitud o rango de ambos intervalos, no podr afirmar que existan diferencias
significativas en cuanto a la media de ambas poblaciones).
Hiptesis sobre dos o ms estadsticos en un grupo o muestra: Principalmente en los
estudios de corte experimental en los que existe al menos una medida pretest y una postest,
nos interesa conocer si existen diferencias significativas entre el nivel alcanzado en la
medicin de la variable en el pretest y la medicin en el postest. As, determinaremos si una
poblacin ha alcanzado, por ejemplo, aprendizajes significativos (por ejemplo, si he diseado
un programa para la mejora de la convivencia en centros de Educacin Secundaria y quiero
evaluar su eficacia, puedo tomar como medida pretest el nmero de conductas disruptivas de
la convivencia generadas por la muestra de estudiantes de institutos las semanas previas a la
implementacin del programa y como medida postest el nmero de conductas disruptivas
generadas las semanas posteriores. En este caso, la tcnica procede calculando el intervalo
para la media poblacional de la diferencia entre las conductas disruptivas generadas en el
postest y en el pretest (postest-pretest), y comprobando si el valor 0 est incluido en ese
intervalo. En este caso, podr concluir que el programa no genera efecto alguno sobre la
poblacin de estudiantes de educacin secundaria en cuanto al nmero de conductas
disruptivas generadas antes y despus del programa. En el caso contrario podr concluir que
el programa genera un efecto significativo en la poblacin de estudiantes de educacin
secundaria).
Antes de entrar a estudiar en profundidad el funcionamiento de los contrastes de hiptesis para

resolver problemas, conjeturas o hiptesis como las planteadas encima, es necesario reparar
brevemente en los aspectos o elementos clave que posee todo contraste de hiptesis:
Hiptesis nula (H0): Se refiere a la conjetura que se pone a prueba en el contraste, es decir,
la hiptesis que plantea para su rechazo o no rechazo. La hiptesis nula siempre es la
hiptesis de igualdad.
Hiptesis alternativa (H1): Es la hiptesis opuesta o complementaria a la hiptesis nula. Si se
rechaza la hiptesis nula, entonces la hiptesis alternativa no se puede rechazar (se puede
aceptar como vlida). Sin embargo, si no se rechaza la hiptesis nula, entonces deberemos
22
rechazar la hiptesis alternativa planteada. En todo caso, la hiptesis alternativa es la

hiptesis de desigualdad.
Regin de rechazo (RR): Se refiere al conjunto de valores para los que se rechaza la H0, y por
tanto se acepta como vlida la hiptesis alternativa. Al igual que existe una Regin de
Rechazo de la hiptesis nula, existe una regin de aceptacin o no rechazo de la misma, que
denominaremos RA. Por ltimo, el punto o valor exacto que separa la regin de rechazo de la
regin de aceptacin lo denominaremos regin crtica (RC).
Nivel de significacin o error tipo I (): Ya hemos hablado del error, nivel o nivel de
significacin. Se refiere a la probabilidad de rechazar la H0 cuando realmente es verdadera
(normalmente se asume un error del 5%). Se podra llamar algo as como falso positivo.
Hemos dicho que cuando realizamos la estimacin de un parmetro, si asumimos un error
del 5%, resulta que puede nos puede haber ocurrido (por mala suerte o errores de muestreo)
que la muestra obtenida sea una muestra con una puntuacin media extrema, y que el
intervalo estimado no incluya el valor real del parmetro en la poblacin. Asumiendo ese
nivel de error, la probabilidad de que eso ocurra es del 5%. Cuando realizamos un contraste
de hiptesis nos ocurre lo mismo, podemos haber tenido mala suerte en la obtencin de la
muestra y que este problema nos lleve a rechazar hiptesis que en realidad en la poblacin
son ciertas.
Error tipo II (): Al igual que se puede rechazar la H0 cuando realmente esta hiptesis es
verdadera, tambin nos puede ocurrir lo contrario, que no rechacemos la H0 cuando en la
realidad esta hiptesis es falsa. A este error, que en realidad es un falso negativo, se le llama
error tipo II, o , y es mucho ms difcil de controlar que el error tipo I en un contraste de
hiptesis.
En realidad, se puede pensar el procedimiento del contraste de hiptesis como un juicio. Pensemos
en que somos miembros de un tribunal que debe juzgar y decidir sobre si un acusado es condenado o
queda en libertad. Evidentemente, al igual que en un contraste de hiptesis, deberemos tomar la
decisin a partir de las pruebas o evidencias que se tengan disponibles. Antes de iniciar el juicio y
durante el mismo se mantiene la propia presuncin de inocencia del acusado (hiptesis nula, el
acusado es inocente) hasta que las evidencias no demuestren claramente lo contrario (hiptesis
alternativa, de culpabilidad). Podramos resumir todas las posibles conclusiones del juicio en una
simple tabla.
EN REALIDAD
Es inocente Es culpable
El acusado es inocente y El acusado es culpable y

Queda en queda en libertad queda en libertad
libertad
ACEPTO H0 ERROR II (Ac. H0)
SENTENCIA
El acusado es inocente y es El acusado es culpable y es
Es condenado condenado condenado
ERROR I (Rech. H0) RECHAZO H0
23
En estos 4 escenarios existen dos situaciones acertadas y otras dos errneas. Sin embargo, el lector
estar de acuerdo con que no es lo mismo el error de condenar a un inocente que el error de que un
culpable quede en libertad. Al igual que ocurre con un juicio, lo ms importante en un contraste de
hiptesis es evitar el error tipo I, ya que se considera ms grave que el error tipo II. No obstante, si
nos ponemos muy estrictos (asumimos un error muy pequeo) para evitar el error tipo I, es decir,
para evitar condenar a un inocente, va a ser ms fcil acabar cayendo en el error tipo II, dejar en
libertad a una persona que realmente es culpable. Si un tribunal o juez nunca condena a nadie,
evidentemente no caer en el error tipo I, pero no pensaremos por ello que est realizando su labor
encomendada correctamente. Al respecto, se ha convenido en la comunidad cientfica que el mejor
equilibrio entre el error tipo I y el II est en considerar como tolerable un erro tipo I del 5% o del 1%,
segn el caso, como hemos visto hasta ahora.
En realidad este procedimiento corresponde al espritu de un juicio en el que la presuncin de

inocencia (hiptesis nula) se mantiene mientras no se demuestre claramente lo contrario
(hiptesis alternativa). El juez ha de tomar la decisin a partir de las pruebas que se presenten.
En estadstica las pruebas son los datos, los resultados del experimento, las observaciones o las
respuestas de una encuesta. La pregunta que nos hacemos es: desmienten los hechos
claramente la hiptesis nula? [] Resulta evidente que si nos ponemos muy estrictos en el
control del Error I podramos caer fcilmente en el Error II lo que tampoco es muy deseable. [...]
Un equilibrio entre las probabilidades de ambos errores es muy deseable []. No es ms que un
reflejo de la vida misma, en la que tomamos las decisiones asumiendo siempre un cierto riesgo
(Lpez Fidalgo, 2015, p.86-88).
Partiendo de estas ideas, podemos plantear el esquema general o los pasos que deben ser seguidos
en el contraste de hiptesis:
0. Planteamiento inicial del problema: Hiptesis o cuestiones de investigacin.

1. Determinacin de la normalidad de la variable o variables implicadas en el anlisis y del nivel
de error asumido.
2. Planteamiento de la hiptesis nula (H0) y la hiptesis alternativa (H1).
3. Clculo del intervalo o intervalos de los parmetros intervinientes en las hiptesis.
4. Toma de una decisin con respecto a las hiptesis planteadas
Normalmente, las cuestiones o hiptesis iniciales de la investigacin, vienen formuladas

previamente, ya que es lo que nos suele llevar a realizar todo el proceso investigador. Veamos a
continuacin algunos ejemplos de contrastes de hiptesis para los 3 casos generales abordados al
inicio de este apartado.
EJEMPLO 4. Contraste de hiptesis para una media en un grupo
Un investigador plantea que la clave de que los estudiantes de Educacin Secundaria de Finlandia
alcancen rendimientos tan altos en relacin a estudiantes de otros pases de la OCDE tiene que ver
con que el cociente intelectual medio de los jvenes Finlandeses es superior al del resto de estudiantes
de estos pases. Por los estudios demogrficos previos que existen al respecto, se sabe que el cociente
intelectual medio de los jvenes de estos pases es de 100 puntos (no se posee informacin acerca de
24
la varianza en la poblacin). Tras obtener una muestra representativa de n=105 estudiantes de

Finlandia, resulta que poseen un CI medio de =102.2 y una varianza de Sx2=164. La exploracin
previa de datos muestra que la distribucin de la variable CI es normal, y el investigador decide
asumir un nivel de significacin o error del 5%.
As, podemos plantear como hiptesis de investigacin (paso 0):
El cociente intelectual alcanzado por la poblacin estudiantes finlandeses de Educacin Secundaria

ser ms elevado que el cociente intelectual general del resto de estudiantes de Educacin
Secundaria de pases miembros de la OCDE
En cuanto al paso 1, ya hemos sealado que la variable CI en la muestra de estudiantes finlandeses

obtenida se distribuye normalmente y que el nivel de confianza marcado es del 95%.
En este ejemplo deberemos calcular el intervalo del parmetro poblacional media en la poblacin de
estudiantes finlandeses para comprobar si es plausible considerar que el CI medio de esta muestra es
de 100 puntos (H0) o no (H1). En este caso, como el valor del CI medio obtenido en la muestra es
superior a 100 puntos, en caso de rechazar la hiptesis nula podremos concluir que los estudiantes
finlandeses tienen un CI superior a 100 puntos. De este modo, las hiptesis estadsticas planteadas
son, por tanto, las siguientes (paso 2):
H0: finl=100
H1: finl100
Ntese que la hiptesis nula es la de igualdad y la alternativa la de desigualdad, y que lo que plantea
es, o bien que el CI medio poblacional de los estudiantes finlandeses se puede considerar de 100
puntos, o que no puede realizarse esta consideracin.
Una vez planteadas las hiptesis estadsticas, ya estamos en disposicin de generar el intervalo de
confianza para la media de la muestra, apoyndonos en la frmula descrita en la pgina 18. En este
caso, dado que no se posee informacin sobre la varianza poblacional, slo sabemos la muestral, la
distribucin a emplear es la distribucin t con 104 (n-1) grados de libertad. Cabe destacar que los
valores disponibles son los del tamao de la muestra, la media y la varianza. La varianza debe ser
previamente transformada en el valor de la desviacin tpica, ya que este es el valor necesario para
realizar los clculos.
Recordemos que la desviacin tpica es la raz cuadrada de la varianza: Sx2=164 Sx=12.81.
Se observa que el intervalo (99.71, 104.69), aunque por unas pocas dcimas, incluye el valor 100
dentro de los valores poblacionales de la media plausibles, por lo que no se puede rechazar la
hiptesis nula. As, la decisin tomada por el investigador (paso 4), o la conclusin final, es que los
estudiantes de educacin secundaria finlandeses no poseen un cociente intelectual diferente (ni por
25
supuesto superior) al del resto de estudiantes de este nivel educativo de pases pertenecientes a la
OCDE.
Podemos ver este intervalo mejor en una imagen (figura 9). Resulta que, como hemos entendido que
la distribucin muestral de la media en la variable CI tiene una forma normal, y que la estimacin
puntual de la m coincide con el valor de la media muestral obtenido, podemos calcular el intervalo
de puntuaciones entre el que se encuentran, en esta distribucin muestral, el 95% de todas las
muestras posibles obtenidas a partir de la poblacin de estudiantes de educacin secundaria en
Finlandia:
Figura 8. Intervalo para un nivel =0.05. EJEMPLO 4 (Fuente: elaboracin propia)
Se puede observar cmo ahora tenemos en este grfico una regin de aceptacin (si el valor
hipottico 100 entra en esta regin se acepta la hiptesis nula) y una regin de rechazo (sin el valor
hipottico 100 se encuentra fuera del intervalo, esto es, dentro de la regin de rechazo, se rechaza la
hiptesis nula), que nos aportan una indicacin precisa acerca de la decisin a tomar.
EJEMPLO 5. Contraste de hiptesis para comparar la media de una variable en varios grupos
Un grupo de investigadores de la Universidad de Salamanca tiene indicios de que existen diferencias

significativas en cuanto al nivel de comprensin lectora de los estudiantes de Educacin Secundaria
de algunas comunidades autnomas en Espaa. Por eso, quiere comparar, a partir de la muestra
obtenida en las pruebas PISA 2012, el rendimiento en comprensin lectora de las poblaciones de
estudiantes de Madrid, Andaluca y Castilla y Len. Para ello, extrae los resultados obtenidos por los
estudiantes de estas 3 comunidades autnomas, comprobando previamente que se cumple el
supuesto previo de normalidad en cada una de las 3 poblaciones (se desea trabajar con un 5% de
error):
26
nMad= 536 =87.9 32.3
nAnd= 883 =83.6 15.2
nCyL= 345 =90.1 19.8
Podemos plantear como hiptesis de investigacin (paso 0):

Los niveles de comprensin lectora de los estudiantes de ltimo curso de educacin secundaria en
Espaa sern diferentes en funcin de la comunidad autnoma en la que cursen sus estudios
Ya sabemos que las distribuciones son normales y que el nivel de confianza deseado en este caso es
del 99% (paso 1), as que directamente vamos a plantear las hiptesis estadsticas. En este caso no
planteo que si los valores medios en la muestra se ajustan o no a un valor terico exacto, sino que
me estoy planteando si existen diferencias entre varios grupos, por eso ahora no debo estimar
solamente el intervalo de un parmetro, sino de 3. Por lo tanto, estos 3 parmetros deben estar
presentes en la hiptesis, y mantenerse el criterio general de que la hiptesis nula es de igualdad y la
alternativa de desigualdad (paso 2):
H0: Mad =And= CyL
H1: Mad And CyL

Vemos que simplemente planteo en un caso que las medias entre los grupos son iguales y en el otro
que no son iguales. Podra generar a partir de esta hiptesis general algunas hiptesis subordinadas,
una por cada pareja de comunidades autnomas (Madrid con Andaluca; Madrid con Castilla y Len;
Andaluca con Castilla y Len), pero esta formulacin puede ser suficiente en este caso (lo
importante en el planteamiento de las hiptesis es que se entienda lo que se contrasta, en este caso
vamos a contrastar la igualdad o desigualdad de las medias poblacionales de 3 poblaciones distintas).
Ahora, pues, debemos calcular los parmetros poblacionales en los 3 grupos a partir de una T con n-1
grados de libertad en todo caso (paso 3). A pesar de que existe un procedimiento estadstico ms
ajustado para el contraste de estas diferencias entre grupos (que es el que emplea el software SPSS),
el procedimiento estudiado puede ser considerado como vlido:
En este caso, vemos que la media poblacional con un intervalo de puntuaciones ms bajo es el de los
estudiantes de Andaluca, pero que su intervalo se solapa con el de los estudiantes de Madrid. Por
otro lado, el intervalo de los estudiantes de Castilla y Len, que poseen los valores ms elevados, se
solapa con el de los de Madrid, pero con el de los de Andaluca. Veamos estos resultados incluyendo
las 3 distribuciones muestrales de la media en un hipottico eje x conjunto en la figura 9:
27
Figura 9. Intervalos distribuciones muestrales EJEMPLO 5 (Fuente: elaboracin propia)
Claramente se muestra cmo, mientras que existe un intervalo comn en las estimaciones
poblacionales de Andaluca y Madrid y de Madrid y Castilla y Len, los intervalos entre Andaluca y
Castilla y Len estn separados. Entonces, puedo acabar tomando las siguientes decisiones a partir
de este contraste (paso 4):
- A nivel general, puedo rechazar H0, ya que los niveles de comprensin lectora de los
estudiantes en Espaa son diferentes en funcin de la comunidad autnoma, al menos en
algn caso. As, existen diferencias significativas en funcin de la comunidad autnoma de
procedencia en cuanto al nivel de comprensin lectora de los estudiantes espaoles.
- A nivel especfico, puedo establecer 3 conclusiones:
o No rechazo la H0 en el caso de las diferencias entre los estudiantes de Andaluca y de
Madrid. No se poseen evidencias suficientes para afirmar que las poblaciones de
estudiantes de estas dos comunidades autnomas posean unos rendimientos en
comprensin lectora diferentes (recordemos que esto es un juicio, y que no
debemos juzgar al acusado como culpable hasta que no tengamos evidencias
irrefutables, en este caso parece que los estudiantes de la muestra de Madrid tienen
un rendimiento ligeramente superior, pero con el nivel de error asumido no
podemos afirmar que estas diferencias puedan ser reales en la poblacin). As, no
existen diferencias significativas entre ambos grupos en cuanto a su nivel de
comprensin lectora.
o No rechazo la H0 en el caso de las diferencias entre los estudiantes de Madrid y
Castilla y Len por las mismas circunstancias. Adems, en este caso, las puntuaciones
son mucho ms cercanas entre ambos grupos, y el rea comn de los intervalos
estimados es mucho ms grande, por lo que tenemos mucha ms seguridad en
nuestra afirmacin de no rechazar la H0. Por tanto, no existen diferencias
significativas entre ambos grupos.
o Rechazo la H0 en el caso de las diferencias entre los estudiantes de Andaluca y
Castilla y Len. Parece que la poblacin de estudiantes de Castilla y Len posee un
rendimiento en comprensin lectora superior a la poblacin de estudiantes de
Andaluca, alcanzndose diferencias significativas entre ambos grupos.
28
EJEMPLO 6. Contraste de hiptesis para comparar varias variables en un grupo

Un equipo de investigadores quiere comprobar la eficacia de un programa integral para la mejora de
la convivencia en el aula de Educacin Primaria. Para ello, tras medir el nmero de conductas
disruptivas de cada uno de los 15 estudiantes de 6 curso participantes en el programa durante el
mes anterior a la aplicacin del programa (pretest), procede a la implementacin de las actividades
del mismo, con una duracin de tres meses. Finalmente, durante el mes posterior a la aplicacin del
programa, se vuelve a registrar la cantidad de conductas disruptivas de cada estudiante,
obtenindose los siguientes resultados:
Pretest Postest
Estudiante 1 6 3
Estudiante 2 0 1
Estudiante 3 2 3
Estudiante 4 11 2
Estudiante 5 15 10
Estudiante 6 27 12
Estudiante 7 4 2
Estudiante 8 7 1
Estudiante 9 8 0
Estudiante 10 20 3
Estudiante 11 4 2
Estudiante 12 6 5
Estudiante 13 8 1
Estudiante 14 7 3
Estudiante 15 2 0
Para tomar una mayor seguridad de los resultados obtenidos, se desea trabajar con un nivel del
1%.
En este caso, debemos trabajar con los datos de la diferencia entre el postest y el pretest, as que el
primer paso es generar una nueva variable que resulte de esta resta (diferencia=postest-pretest).
Pretest Postest Diferencia
Estudiante 1 6 3 3
Estudiante 2 0 1 -1
Estudiante 3 2 2 0
Estudiante 4 11 2 9
Estudiante 5 15 10 5
Estudiante 7 4 2 2
Estudiante 8 7 1 6
Estudiante 9 8 0 8
Estudiante 11 4 2 2
Estudiante 12 6 5 1
Estudiante 13 8 1 7
Estudiante 14 7 3 4
Estudiante 15 2 0 2
29
8.47 3.13 5.33

Sx 7.26 3.46 5.21
Ya vemos, en primer lugar, cmo, mientras que inicialmente la cantidad media de conductas
disruptivas de la muestra de estudiantes fue de 8.47 puntos, tras la aplicacin del programa se
reduce a 3.13 conductas disruptivas de media por estudiante. As, se han reducido de media 5.33
conductas disruptivas por estudiante. Ahora la duda es si estas diferencias son suficientes como para
poder considerarse significativas. Aunque los programas estadsticos emplean un clculo estadstico
especfico ms ajustado para realizar esta estimacin, realizaremos los clculos a partir de la frmula
estudiada inicialmente, que realiza un ajuste razonablemente similar.
La hiptesis de investigacin planteada en este caso podra ser la siguiente (paso 0):
El nmero de conductas disruptivas de la convivencia escolar de estudiantes de 6 de educacin
primaria se reducir tras la aplicacin de un programa de mejora de la convivencia escolar en el aula.
En cuanto al paso 1, ya se ha sealado que se posee un nivel de significacin del 1%, y tras el estudio
de la distribucin de la variable, resulta que se acepta la normalidad de la misma.
As, se pueden generar las siguientes hiptesis estadsticas con respecto a los grupos (paso 2):
H0: pretest =postest postest -pretest = 0

H1: pretest postest postest -pretest 0
Vamos a calcular ahora el intervalo de confianza de la variable diferencia (paso 3). Dado que esta
variable nos muestra la diferencia de conductas disruptivas entre el postest y el pretest, en este
orden, en este caso nos interesa que exista un intervalo con un rango de puntuaciones negativo
(indicando que en el postest existen menos conductas disruptivas que en el pretest) y que no incluya
el valor 0 como plausible (que nos indicara que se podra aceptar que en la poblacin no existe
ningn tipo de reduccin de las conductas disruptivas). Recordemos que en este caso trabajamos con
una distribucin T con 14 grados de libertad y un nivel /2 de 0.005 (existe un error de 0.01, el 1%):
En conclusin (paso 4), resulta que tengo evidencias suficientes para rechazar la H0, ya que resulta
que postest-pretest0 para un nivel de confianza del 99%. As, el programa de mejora de la convivencia
es efectivo, ya que parece que ejerce un efecto significativo sobre la reduccin de conductas
disruptivas en el aula.
CONTRASTES DE HIPTESIS CON SOFTWARE INFORMTICO (SPSS)
Aunque en realidad cuando realizamos un contraste de hiptesis estamos empleando todo este
artefacto estadstico/matemtico, el software estadstico empleado para el anlisis de datos
descriptivo e inferencial de manera ms generalizada, SPSS, no nos suele aportar la informacin de
los contrastes de hiptesis de este modo, incorporando las hiptesis estadsticas, los intervalos de
confianza para los parmetros que se deben estimar y la decisin tomada. En su lugar, simplemente
nos aporta informacin en todo contraste de hiptesis acerca del valor de la significacin exacta de
ese contraste (SPSS llama a este valor Sig., aunque tambin lo podemos denominar como p-valor).
30
Qu quiere decir esto exactamente? Pues el valor devuelto por el programa informtico es una
probabilidad, es decir, un valor entre 0 y 1. Lo que nos est indicando exactamente en cada uno de
los 3 casos estudiados es lo siguiente:
Contraste de hiptesis para una media en un grupo: El valor de la significacin (sig.)
devuelto por el programa estadstico en este caso nos indica la probabilidad que existe de
que la muestra a partir de la que se ha generado la estimacin provenga de una poblacin
con la media con el valor sealado en la hiptesis nula (en el ejemplo 3, =100).
Contraste de hiptesis para comparar la media de una variable en varios grupos: En este
caso, el valor de la significacin devuelto por SPSS nos indica la probabilidad exacta de que
las muestras que se comparan provengan de la misma poblacin o de poblaciones con la
misma media (en el ejemplo 4, Mad =And= CyL). En el caso de que el contraste sea no
paramtrico, la comparacin se hace entre las medianas de los grupos (MdnMad = Mdn And =
MdnCyL)
Contraste de hiptesis para comparar varias variables en un grupo: Lo que indica este valor
Sig. o p-valor es la probabilidad de que la muestra obtenida en el estudio provenga de una
poblacin en la que la diferencia entre las puntuaciones de las variables es 0 (En el caso del
ejemplo 5, las variables pretest y postest, o sea, postest-pretest=0). En el caso de que el
contraste sea no paramtrico, la comparacin se hace entre las medianas de las variables
(Mdnpret = Mdnpost).
Ntese que en realidad, este valor de la significacin o p-valor se est refiriendo en todos los casos a
la probabilidad de que H0 sea cierta o, dicho en trminos del ejemplo del juicio, la probabilidad de
que el acusado sea inocente (si la probabilidad de que sea inocente no es suficientemente baja, tan
baja como el nivel de significacin planteado inicialmente, no deberamos acusarle). As, la
interpretacin de este nivel Sig. o p-valor siempre es la misma, en funcin del nivel de error o que
hayamos prefijado:
En el caso de que p-valor < , entonces tendr evidencias suficientes como para rechazar la
H0, ya que la probabilidad de cometer un error tipo I es menor al nivel de error establecido
previamente (normalmente del 5%). En este caso rechazar la hiptesis nula y podr afirmar
que existen diferencias significativas bien entre varios grupos, o entre varias medidas en un
mismo grupo, o entre la media de un grupo y la de una poblacin hipottica.
En el caso de que p-valor , entonces no tendr evidencias suficientes como para rechazar
la H0, ya que la probabilidad de cometer un error tipo I es menor al nivel de error establecido
previamente. En este caso no rechazar la hiptesis nula y no podr afirmar que existan
diferencias significativas entre las puntuaciones en una variable de varias muestras, o entre
la puntuacin en varias variables en una muestra, o entre la puntuacin de una muestra y la
de una poblacin hipottica.
A lo largo de los siguientes temas abordaremos desde un punto de vista prctico una por una las
tcnicas estadsticas inferenciales ms habituales, por lo que profundizaremos en las implicaciones
de este p-valor.
31
COMPROBACIN DEL SUPUESTO DE NORMALIDAD

En todo caso, para poder proceder a la estimacin de parmetros conforme a las tcnicas
paramtricas estudiadas en el apartado previo, es necesario comprobar previamente la normalidad
de la variable o variables intervinientes en el anlisis. Para ello, se planteaban 3 grupos de tcnicas
complementarias entre s, que vamos a desglosar en este captulo.
1. EXPLORACIN INICIAL GRFICA
El objetivo principal de la exploracin grfica es la comprobacin inicial de si la forma de la

distribucin se podra ajustar a una distribucin normal, esto es, de forma simtrica y con un
apuntamiento ni exageradamente alto ni bajo.
Para ello, se pueden emplear varios grficos, como son, principalmente, el histograma y el diagrama
de cajas.
En primer lugar, el histograma, como ya hemos estudiado, presenta la informacin en forma de
diagrama de barras en el que no existe separacin entre cada una de las barras del grfico al
considerarse que la variable representada es una variable continua o de intervalo. As, la anchura de
cada una de las barras presenta un intervalo de puntuaciones concreto de la variable, y la altura la
proporcin o frecuencia de sujetos que han obtenido una puntuacin comprendida en ese intervalo.
Imaginemos que hemos evaluado el rendimiento en matemticas (entre 0 y 10 puntos) en una
muestra de 260 estudiantes de 4 de educacin secundaria, habiendo obtenido una puntuacin
mnima de 3.85 puntos y mxima de 10). Podramos calcular el histograma mostrado en el grfico 1.
Este grfico se obtiene en SPSS en men grficos generador de grficos histograma.
Grfico 1. Histograma rendimiento en matemticas, intervalos de 0.4 puntos

En este primer histograma se observa cmo se presentan los resultados con intervalos de 0.4 puntos,
empezando el intervalo en la puntuacin ms baja hasta el primer corte [3.85, 4.25), el segundo
desde 4.25 hasta 4.65, y as sucesivamente.
32
El tamao del intervalo podemos prefijarlo nosotros como nos venga en gana, por ejemplo, el grfico
2 muestra el histograma de la misma distribucin con los intervalos de 1 punto de tamao y no de
0.4 puntos.
Grfico 2. Histograma rendimiento en matemticas, intervalos de 1 punto

En este ejemplo el tamao del intervalo elegido nos permite observar la distribucin general de la
variable de manera un poco ms clara.
Podemos tambin elegir, como se puede observar en el grfico 3, como grfico para observar la
distribucin el diagrama de cajas, que nos muestra esta distribucin pero en lugar de en un eje
horizontal, en un eje vertical. En SPSS este grfico se obtiene en men grficos generador de
grficos diagramas de caja.
Grfico 3. Diagrama de cajas rendimiento en matemticas.
33
En este caso recordemos que el diagrama de cajas representa los 3 cuartiles (Q1 o P25, Q2 o P50 o
mediana y Q3 o P75).
En el ejemplo, tanto en el grfico de cajas, como en el histograma, se observa cmo de manera muy
ligera la distribucin posee una asimetra negativa, esto es, la cola ms larga de la distribucin desde
la posicin ms elevada o la posicin de la mediana se encuentra en las puntuaciones bajas. O lo que
es lo mismo, hay una mayor acumulacin de sujetos en las puntuaciones altas que en las bajas de la
variable.
2. ESTUDIO DE LOS NDICES DE ASIMETRA Y CURTOSIS
El anlisis grfico inicial simplemente nos aporta informacin exploratoria acerca de la distribucin
de la variable en la que ya veamos algunas cuestiones de falta de normalidad ms o menos claras.
Mientras que la observacin grfica de una clara falta de normalidad puede ser suficiente para
considerar que una variable no se distribuye normalmente, no se puede tomar la decisin de que una
variable es normal simplemente con el anlisis grfico. Es necesario realizar un anlisis posterior al
menos de los ndices de asimetra y curtosis.
Recordemos que una distribucin de datos se considera normal cuando la asimetra y la curtosis
tienen exactamente el valor 0. En la prctica esto no nos va a ocurrir nunca, pero s es importante
que los valores de asimetra y curtosis estn cercanos a esta puntuacin central.
Esta informacin la pedimos en SPSS en men analizar Estadsticos descriptivos Descriptivos,
obeniendo la siguiente tabla:
Estadsticos descriptivos
N Asimetra Curtosis
Estadstico Estadstico Error tpico Estadstico Error tpico
REND_MATEM 260 -,342 ,151 -,459 ,301

N vlido (segn lista) 260
A partir de la tabla anterior, podramos extraer la siguiente informacin esencial:

ASIMETRA CURTOSIS
RENDIMIENTO MATEMTICAS -0.342 -0.459
En este caso, a pesar de que los valores muestran que la variable posee una ligera asimetra negativa
y curtosis platicrtica, los valores son cercanos a 0, por lo que se podra aceptar la hiptesis de
normalidad de la variable. No obstante, dado que an existen algunas dudas, puede ser preferible
establecer los contrastes de normalidad que nos saquen de dudas al respecto.
3. CONTRASTE DE HIPTESIS ACERCA DE LA NORMALIDAD DE LA VARIABLE
Como ya hemos indicado, existe una prueba bsica para el contraste del ajuste a la distribucin
normal de una variable, que se llama generalmente prueba o test de Kolmogorov-Smirnov. Esta
prueba realizar un contraste de hiptesis en el que plantear la hiptesis nula de que la variable se
distribuye conforme a una distribucin normal o que no lo hace. Por lo tanto, si se obtiene un p-
valor, o Sig., inferior al nivel , o de significacin, preestablecido se deber rechazar la H0, y si este
valor es superior se deber aceptar la hiptesis de que la distribucin de la variable medida proviene
de una distribucin normal.
34
As, las hiptesis planteadas son:
H0: La distribucin de los datos proviene de una distribucin normal
H1: La distribucin de los datos no proviene de una distribucin normal
En men SPSS analizar pruebas no paramtricas cuadros de dilogo antiguos K-S de una
muestra se obtiene la siguiente tabla:
Prueba de Kolmogorov-Smirnov para una muestra
REND_MATEM
N 260
a,b
Parmetros normales Media 7,0769
Desviacin tpica 1,27851
Diferencias ms extremas Absoluta ,087
Positiva ,051
Negativa -,087
Z de Kolmogorov-Smirnov 1,403
Sig. asintt. (bilateral) ,039
a. La distribucin de contraste es la Normal.

b. Se han calculado a partir de los datos.
La informacin bsica que se debe extraer de esta tabla generalmente para informar del resultado de
la prueba es simplemente la de la Z y la de la Sig.:
Zk-s P-VALOR
RENDIMIENTO MATEMTICAS 1.403 0.039
Ntese que el p-valor es de 0.39, es decir, resulta que hay una probabilidad de 0.039 de que la
variable rendimiento en matemticas obtenida a partir de la muestra provenga de una variable con
distribucin normal en la poblacin. Esto quiere decir que el nivel de error tipo I exacto que puedo
cometer si rechazo H0 es del 3.9%. Depender, por tanto, la decisin final que yo tome en este
contraste del nivel o de error que yo haya preestablecido (del 5% o del 1%):
Si he establecido un a=0.05 Rechazo H0, la distribucin de los datos no proviene de una

distribucin normal.
Si a=0.01 No rechazo H0, la distribucin de los datos proviene de una distribucin normal.
A nivel general, en este caso, en base a los 3 anlisis realizados, se podra asumir que la distribucin
proviene de una distribucin normal, ya que parece que no existen grandes problemas de asimetra y
normalidad y que las grficas de la distribucin parecen ser cercanas a una distribucin normal.
35
DOS MUESTRAS INDEPENDIENTES

Ya hemos comentado que cuando queremos comparar la media de dos grupos en una variable, y se
cumplen las condiciones de normalidad de la variable objeto de estudio, estamos en condiciones de
aplicar un contraste de hiptesis paramtrico, la prueba de t para dos muestras independientes,
basada en el estadstico de contraste t. En este caso, la variable que establece los dos grupos ser
una variable cualitativa (normalmente dicotmica) y la variable sobre la que se quieren comparar las
puntuaciones medias ser una variable cuantitativa (recordemos que no se puede calcular la media
en variables no cuantitativas). En el caso de que no se cumpla el supuesto de normalidad, o que la
variable sobre la que se quieren comparar las puntuaciones medias no sea cuantitativa, o sea, que
sea ordinal, el contraste a realizar ser el contraste no paramtrico de la U de Mann-Whitney.
As, como en todo proceso de contraste de hiptesis, lo primero que tendremos que hacer ser una
exploracin descriptiva inicial de las variables y la comprobacin del supuesto previo de normalidad.
En este ejemplo, vamos a comparar las puntuaciones obtenidas en el pretest de nuestra base de
datos entre los estudiantes de Castilla y Len y de Andaluca
1. EXPLORACIN DESCRIPTIVA INICIAL
Parece que la distribucin por comunidad autnoma no est repartida de modo muy equilibrado,
tenemos 200 estudiantes en Castilla y Len por 60 en Andaluca.
Comunidad autnoma
60
Castilla y Len
Andaluca
200
No obstante, esto no es problemtico, ya que la tcnica estadstica ajusta automticamente estas

diferencias (en caso de que existieran diferencias mucho ms marcadas deberamos plantearnos de
nuevo la aplicacin del contraste de hiptesis). S que queda patente que tenemos ms de 30 sujetos
por grupo, cuestin esencial para poder realizar el contraste con mnimas garantas.
En cuanto a la variable cuantitativa, veamos algunas de sus caractersticas para todo el grupo y
separando por comunidad autnoma (en SPSS men datos Segmentar archivo). Se observa cmo
la puntuacin media de la muestra de Castilla y Len en el pretest es ms alta, y cmo tenemos
36
niveles de dispersin similares en ambos grupos, asimetra prcticamente nula y curtosis platicrtica
moderada de manera generalizada.
Mdn CV As Curt
Castilla y Len 37.43 37 7.44 19.88% 0.06 -0.61
Andaluca 34.97 34 6.84 19.56% -0.08 -0.74
Total 36.86 36 7.36 19.97% 0.06 -0.58
2. SUPUESTOS PREVIOS
En este caso slo ser necesario comprobar el supuesto previo de normalidad. Posteriormente,
deberemos comprobar la homocedasticidad (igualdad de varianzas) cuando realicemos la prueba.
En primer lugar, vimos que las distribuciones parecan simtricas y con leve curtosis platicrtica.
Veremos si este pequeo desajuste con respecto a la curva normal es suficiente para que exista falta
de normalidad. Recordemos que la prueba de dos muestras independientes compara las medias de
las dos distribuciones de los dos grupos (en este caso estudiantes de Castilla y Len y de Andaluca),
por lo que deberemos comprobar la normalidad de los dos grupos por separado. Veamos en primer
lugar, por tanto, el histograma para ambos grupos en la variable puntuacin en el pretest (vamos
forzar 10 intervalos y el eje X con puntuaciones entre 20 y 55 puntos).
Vemos distribuciones aproximadamente normales, al menos a priori. En todo caso, veamos lo que
ocurre cuando aplicamos la prueba de normalidad. Recordemos antes las hiptesis planteadas en
este contraste:
37
Zk-s P-VALOR
Castilla y Len 1.024 0.245
Andaluca 0.689 0.729
Recordemos que partamos, si no se deca lo contrario, de un nivel de significacin del 5%, es decir,
aceptaremos la hiptesis nula cuando el p-valor sea superior o igual a 0.05 y la rechazaremos cuando
sea inferior a este valor. En este caso, ambos contrastes indican un p-valor superior a 0.05, por lo que
aceptamos H0, es decir, podemos afirmar que ambas distribuciones provienen de la distribucin
normal. As, puedo continuar con el contraste de hiptesis.
3. CONTRASTE PARAMTRICO: PRUEBA DE T PARA GRUPOS O MUESTRAS

INDEPENDIENTES
Bien, una vez hecho todo lo anterior, vamos a completar la prueba. Para ello debemos, inicialmente,
quitar la segmentacin del archivo. Para ello, vamos a men datos Segmentar archivo y
seleccionamos analizar todos los casos.
Una vez estamos seguros de que el archivo no est segmentado, seleccionarmos men analizar
Comparar medias Prueba T para muestras independientes. En la ventana emergente, debemos
aadir como variable de agrupacin la variable cualitativa que establece los dos grupos (comunidad
autnoma en este caso) y en el botn definir grupos indicar los dos grupos que se quieren
comparar4. En grupo 1 y grupo 2 deberemos aadir el nmero con el que se han codificado ambos
grupos (recordemos que esto lo podemos ver en la vista de variables, en valores). Por otra parte, en
la ventana variables para contrastar se debe aadir la variable cuantitativa (en este caso la
puntuacin en el pretest).
Obtenemos las siguientes tablas:
Estadsticos de grupo
Error tp. de la
Comunidad autnoma N Media Desviacin tp. media
Puntuacin Castilla y Len 200 37,4250 7,43781 ,52593

en el pretest Andaluca 60 34,9667 6,83948 ,88297
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas Prueba T para la igualdad de medias
Sig. Diferencia Error tp. 95% Int. de conf.
F Sig. t gl (bilateral) de medias diferencia Inf Sup.
Puntuacin Se han asumido ,646 ,422 2,286 258 ,023 2,45833 1,07531 ,34083 4,5758
en el pretest varianzas iguales
No se han asumido 2,392 104,4 ,019 2,45833 1,02774 ,42038 4,4962

varianzas iguales
4
Por qu crees que el SPSS requiere que definas qu grupos comparar?
38
La informacin de la primera tabla (a excepcin del error tpico en la variable puntuacin en el

pretest para cada grupo) ya la habamos obtenido en las fases previas, por lo que no cabe analizarla.
En cuanto a la informacin obtenida en la segunda tabla, es la que me interesa. Se observa, en
primer lugar, que nos aparece una prueba llamada Prueba de Levene. Esta es la prueba de
homocedasticidad a la que hacamos referencia previamente. En funcin de esta prueba,
asumiremos varianzas iguales o no las asumiremos, y deberemos coger la informacin de arriba o la
informacin de abajo. Veamos las hiptesis de esta prueba:
H0: Se asumen varianzas iguales
H1: No se asumen varianzas iguales
Como el p-valor asociado (en SPSS siempre se llama sig.) a esta prueba es de 0.422, superior al valor
0.05, aceptamos la hiptesis nula, y asumimos varianzas iguales. As, en este caso debo interpretar
los datos superiores de la prueba de t y desechar los de la fila inferior. En todo caso, las hiptesis
planteadas en esta prueba de t para grupos independientes se mantienen inalterables:
H0: And= CyL
H1: And CyL

Por lo tanto, estamos planteando si es plausible aceptar que la poblacin de estudiantes andaluces y
castellanoleoneses poseen niveles de desempeo en el pretest diferentes (H1) o si los niveles
mostrados en la prueba del pretest se pueden considerar iguales (H0).
En cuanto a la informacin que aparece, adems del valor del estadstico de contraste (t) y el de la
significacin de la prueba (p-valor), nos encontramos con los grados de libertad de la prueba (gl), la
diferencia de medias (media en la variable cuantitativa, punt. en el pretest, de los estudiantes de
Castilla y Len, menos la media de los estudiantes de Andaluca, 37.4250-34.9667), el error tpico,
que ya lo hemos explicado como un indicador para calcular los intervalos de confianza, y el intervalo
de confianza de la diferencia de medias, es decir, de 2.45833. En este caso, ese intervalo (0.34083,
4.5758) se puede calcular a partir de la siguiente frmula:
En todo caso, normalmente, es suficiente con informar del valor del estadstico de contraste t y el p-
valor. Podramos resumir todo el proceso de la siguiente manera:
Tras la exploracin inicial del comportamiento de la variable puntuacin en el pretest y
la comprobacin del supuesto de normalidad de la misma tanto para los estudiantes
andaluces (Zk-s=0.689; p.=0.729) como para los de Castilla y Len (Zk-s=1.024; p.=0.245),
se aplica el contraste de hiptesis paramtrico. Asumiendo un nivel de confianza del
95%, el resultado de la prueba de t para grupos independientes muestra diferencias
significativas entre ambos grupos (t=2.286; p.=0.023). Por lo tanto, se rechaza la
hiptesis nula, y se puede afirmar que los niveles medios de desempeo en el pretest
de los estudiantes andaluces y castellanoleoneses son diferentes. En concreto, los
estudiantes de Castilla y Len poseen un nivel de desempeo en la prueba superior a
los estudiantes de Andaluca.
39
4. CONTRASTE NO PARAMTRICO: PRUEBA DE LA U DE MANN-WHITNEY
4.1 Una variable de agrupacin y otra cuantitativa

Imaginemos que, en el mismo contraste anterior (comparar el rendimiento en el pretest de
estudiantes de Castilla y Len y Andaluca), tras realizar las pruebas de normalidad, las evidencias nos
indican que las distribuciones de la variable cuantitativa en los dos grupos o en alguno de los dos
grupos no se ajustan a la distribucin normal. En ese caso no sera lo ms correcto implementar
tcnicas paramtricas de anlisis de datos; deberamos plantear la aplicacin de una prueba no
paramtrica, en concreto la prueba de la U de Mann-Whitney.
Las pruebas no paramtricas tienen la peculiaridad, con respecto a las pruebas paramtricas, de que
emplean la mediana como estadstico de contraste en lugar de emplear la media. As, en el caso de
la prueba de la U de Mann-Whitney, las hiptesis planteadas son las siguientes:
H0: Mdn1= Mdn2
H1: Mdn1 Mdn2
As, comprobaremos la hiptesis de si las medianas de los grupos son iguales o diferentes. Antes de
plantear el contraste, como nos interesa comparar medianas, es interesante generar los diagramas
de cajas para la variable objeto de contraste (puntuacin en el pretest) para cada uno de los grupos
de estudiantes:
A priori se observa que la mediana (raya central) de la variable puntuacin en el pretest es

ligeramente superior en los estudiantes de la muestra Castilla y Len (si solicitamos la informacin
exacta sobre la mediana para esta variable en ambos grupos, resulta que es de 37 puntos en Castilla
y Len y de 34 en Andaluca). Ahora la duda es sern estas diferencias en la muestra
suficientemente grandes para considerar que en la poblacin se encuentran diferencias
significativas? Para resolver esta cuestin es para lo que vamos a aplicar la prueba inferencial no
paramtrica de la U de Mann-Whitney. Para realizar la prueba, simplemente accedemos a men
analizar Pruebas no paramtricas Cuadros de dilogo antiguos Muestras independientes.
La ventana emergente es muy similar a la de la prueba de t para grupos independientes: Debemos
sealar la variable de agrupacin, en este caso comunidad autnoma, y los valores de las categoras
40
Castilla y Len y Andaluca, y aadir la variable cuantitativa u ordinal que se va a contrastar, en este
caso puntuacin en el pretest. Las hiptesis concretas planteadas son:
H0: MdnAnd= MdnCyL
H1: MdnAnd MdnCyL
As, en SPSS Se obtienen las siguientes tablas:
Rangos
Rango Suma de
Comunidad autnoma N promedio rangos
Puntuacin en el pretest Castilla y Len 200 135,74 27147,50

(competencias digitales) Andaluca 60 113,04 6782,50
Total 260
a
Estadsticos de contraste
Puntuacin en
el pretest
(competencias
digitales)
U de Mann-Whitney 4952,500
W de Wilcoxon 6782,500
Z -2,053
a. Variable de agrupacin: Comunidad

autnoma
La primera de las tablas indica los rangos de los sujetos de cada muestra, es decir, la posicin media
de los sujetos de cada grupo despus de ordenar a todos los sujetos de menor a mayor puntuacin
en funcin de la variable de contraste (en este caso, puntuacin en el pretest). Resulta, como ya
veamos en el diagrama de cajas, que los estudiantes de Castilla y Len ocupan posiciones ms altas
en esta clasificacin de puntuaciones en el pretest, o lo que es lo mismo, en trminos promedios los
estudiantes de Castilla y Len tienen puntuaciones ms elevadas en el pretest que los de Andaluca.
Esto ya lo sabamos por la informacin analizada previamente, tanto en los diagramas de cajas, como
en los estadsticos descriptivos, por lo que esta primera tabla no es de gran inters, simplemente
confirma esas observaciones previas.
La tabla que ms interesa es la siguiente, que tiene 4 datos. Los 3 primeros datos indican
puntuaciones de los estadsticos a partir de los que se realiza el contraste de hiptesis. De stos, al
ser la distribucin terica ms conocida, se suele informar del valor de la Z junto con la significacin o
p-valor. Vemos cmo, al igual que ocurra en el contraste paramtrico, los resultados informan de
que existen diferencias significativas entre las medianas de los dos grupos, esto es, que se puede
afirmar que existen diferencias significativas entre los dos grupos de estudiantes. Podramos
informar de esto en un artculo o informe de investigacin de la siguiente manera:
41
Tras la decisin sobre el empleo de contrastes no paramtricos, se procede a la

aplicacin de la prueba de la U de Mann-Whitney. Los resultados indican que existen
diferencias significativas entre ambos grupos de estudiantes (Z=-2.053; p.=0.040),
siendo los estudiantes castellanoleoneses los que alcanzan un nivel de desempeo
superior en la variable puntuacin en el pretest (MdnCyL=37; MdnA=34).
Vase que las conclusiones que se pueden extraer del contraste paramtrico y del no paramtrico
son muy similares. Realmente, ante una variable cuantitativa con distribucin exactamente normal,
los resultados de aplicar el contraste paramtrico o el no paramtrico son prcticamente
coincidentes (recordemos que en una distribucin normal la media y la mediana coinciden en el
mismo valor de la variable).
4.2 Una variable de agrupacin y otra ordinal
Nos puede ocurrir que deseemos comparar el desempeo en una variable ordinal entre dos grupos.
Partiendo de la base de datos anterior, puede interesarnos saber si los estudiantes de Andaluca y de
Castilla y Len poseen niveles de actitudes diferentes en la variable Creo que el manejo de
herramientas informticas es esencial para los ciudadanos del siglo XXI. Dicha variable consiste en
una escala tipo Likert con valores de 1 a 5 puntos, correspondiendo 1 con Totalmente en
desacuerdo y 5 con Totalmente de acuerdo.
Veamos primero brevemente la distribucin de puntuaciones de esa variable en los dos grupos:
50%
45,00%
45%
38,50%
40% 36,50%
35%
30,00%
30%
25%
18,00% 18,30% Castilla y Len
20%
Andaluca
15%
10% 6,70%
4,50%
5% 2,50%
0,00%
0%
Totalmente en En desacuerdo Ni de acuerdo De acuerdo Totalmente de
desacuerdo ni en acuerdo
desacuerdo
Se ha generado el diagrama de barras conjunto por las puntuaciones relativas porque recordemos
que los tamaos de muestra de ambos grupos eran diferentes, y por lo tanto, no directamente
comparables. Parece que las distribuciones de las variables en ambas muestras es similar, teniendo
los estudiantes de Castilla y Len unas actitudes ligeramente superiores (ms de un 36% de los
estudiantes de Castilla y Len estn totalmente de acuerdo con la afirmacin, mientras que esto
ocurre con un 30% de los estudiantes andaluces).
Tambin podramos obtener el diagrama de cajas para cada grupo, para hacer una primera
comparacin de ambos grupos:
42
Vemos en ambos casos distribuciones con una asimetra negativa muy importante (los estudiantes
tienden a valorar con puntuaciones muy altas esta variable) y con una puntuacin mediana igual en
ambos casos (Mdn=De acuerdo). En todo caso, parecen distribuciones muy semejantes
Sern estas diferencias obtenidas en la muestra suficientes como para poder afirmar que en las
poblaciones tambin existen? Veamos, en primer lugar, que la formulacin de las hiptesis se
mantiene, ya que los grupos son los mismos que en el contraste previo:
H0: MdnAnd= MdnCyL
H1: MdnAnd MdnCyL
Por otro lado, podemos realizar el contraste del mismo modo que sealamos antes, accediendo a
men analizar Pruebas no paramtricas Cuadros de dilogo antiguos Muestras
independientes. Veamos las tablas resultantes:
Rangos
Rango Suma de
Comunidad autnoma N promedio rangos
Creo que el manejo de Castilla y Len 200 131,89 26377,50

herramientas informticas Andaluca 60 125,88 7552,50
es esencial para los Total 260
ciudadanos del siglo XXI
a
El manejo de herramientas inf. es esencial para los ciudadanos del siglo XXI
U de Mann-Whitney 5722,500
W de Wilcoxon 7552,500
Z -,577
a. Variable de agrupacin: Comunidad autnoma
43
Vemos, en primer lugar, que el rango promedio de los estudiantes de Castilla y Len (131.89) es
ligeramente superior al de los estudiantes de Andaluca (125.88), observacin coincidente con lo
sealado en el diagrama de barras conjunto.
En cuanto al contraste de hiptesis propiamente dicho, se observa que no existen diferencias
significativas entre las medianas de los grupos en la variable actitudes hacia las competencias
digitales (Z=-0.577; p.=0.564). As, acepto la hiptesis nula y concluyo que los dos grupos poseen
actitudes similares en lo que tiene que ver con las actitudes hacia las competencias digitales (no
existen diferencias significativas entre ambos grupos).
44
DOS MUESTRAS RELACIONADAS

Los contrastes para dos muestras relacionadas se emplean habitualmente cuando disponemos de
dos variables cuantitativas diferentes que queremos comparar en una sola muestra (tambin
podemos emplear este contraste, en la modalidad no paramtrica, en el caso de que queramos
comparar dos variables ordinales en una muestra). El caso ms prototpico en el que se aplica esta
prueba es cuando hemos desarrollado un diseo experimental con pretest y postest y queremos
comprobar si los sujetos muestran un nivel de desempeo diferente5 en el postest.
Al igual que en todo proceso de contraste de hiptesis, lo primero que tendremos que hacer ser una
exploracin descriptiva inicial de las variables y la comprobacin del supuesto previo de normalidad.
En este ejemplo, vamos a comparar las puntuaciones obtenidas por los estudiantes en el pretest y en
el postest en nuestra base de datos de trabajo, sin tener en cuenta ninguna variable de agrupacin.
Del total de 260 estudiantes de la muestra, resulta que la totalidad han completado tanto el pretest
como el postest, por lo que realizaremos el contraste incluyendo a todos los sujetos disponibles en la
base de datos. En el caso de que, por ejemplo, solamente 20 sujetos hubieran contestado tanto el
pretest como el postest, sera problemtico, ya que el contraste slo se podra realizar con esos 20
sujetos (independientemente de que, por ejemplo, hubieran completado el pretest 125 personas y el
postest 156).
En el caso de la prueba de t para grupos relacionados, si recordamos el primer bloque de contenido,
el clculo se realiza a partir de una nueva variable que podemos denominar diferencia (Xpostest-
Xpretest). As, la comprobacin de la normalidad se debe realizar sobre la nueva variable resultante de
restar la puntuacin en el postest menos la puntuacin en el pretest. En SPSS realizamos esa
operacin en men transformarCalcular variable, y en la ventana emergente, en el cuadro
variable de destino aadimos el nombre de la nueva variable, y en el cuadro expresin numrica
aadimos la resta (Puntuacin en el pretest-Puntuacin en el postest) seleccionando las variables de
la columna inferior izquierda.
Veamos los estadsticos descriptivos bsicos tanto para las variables pretest y postest como para la
variable diferencia. Dado que en este caso la homogeneidad de varianzas no es una cuestin
esencial, no es necesario aportar la informacin sobre el coeficiente de variacin:
n Mdn As Curt
Pretest 260 36.86 36 7.36 0.06 -0.58
Postest 260 36.73 38 6.59 -0.33 -0.46
Diferencia 260 -0.13 -1 9.48 0.23 -0.22
Parece que los estudiantes mostraron un nivel de desempeo prcticamente igual (ligeramente
superior en el pretest) en el pretest y en el postest67. Los niveles de asimetra en el pretest son
5
Cundo buscaremos que las puntuaciones en el postest sean ms altas? Y ms bajas?
6
Es deseable en este caso, en base al diseo, que los sujetos obtengan una puntuacin ms alta en el pretest?
7
Por qu en la mediana s se localizan esas diferencias? (piensa en las distribuciones de las variables)
45
prcticamente nulos y de ligera asimetra negativa en el postest, mientras que la variable diferencia
muestra una ligera asimetra positiva. En cuanto a la curtosis, tenemos una ligera curtosis platicrtica
en todos los casos.
Veamos si estos ligeros desvos en cuanto a la asimetra y la curtosis son suficientes para rechazar la
normalidad de las variables o no. En primer lugar, podemos observar el histograma de la variable
diferencia.
A priori parece que la distribucin tiene una variacin muy ligera sobre la distribucin normal terica.
En todo caso, aunque podramos considerar la distribucin normal a partir de este grfico, siempre
es mejor realizar el contraste, la prueba de Kolmogorov-Smirnov, que recordemos que tiene las
siguientes hiptesis:
Zk-s P-VALOR
Diferencia 1.201 0.112
Recordemos que el nivel de significacin es del 5%, es decir, aceptaremos la hiptesis nula cuando el
p-valor sea superior o igual a 0.05 y la rechazaremos cuando sea inferior a este valor. En este caso, el
contraste indica un p-valor superior a 0.05, por lo que aceptamos H0, es decir, podemos afirmar que
la distribucin de la variable diferencia proviene de la distribucin normal. As, puedo continuar con
el contraste de hiptesis.
3. CONTRASTE PARAMTRICO: PRUEBA DE T PARA GRUPOS O MUESTRAS RELACIONADAS
Una vez hemos hecho un anlisis descriptivo de las variables que vamos a contrastar y hemos
comprobado el supuesto de normalidad de la nueva variable generada denominada diferencia,
46
seleccionarmos men analizar Comparar medias Prueba T para muestras relacionadas. En este
caso, en la ventana emergente, debemos aadir como variable 1 la puntuacin en el postest y como
variable 2 la puntuacin en el pretest89 de agrupacin la variable cualitativa que establece los dos
grupos (comunidad autnoma en este caso) y en el botn definir grupos indicar los dos grupos que
se quieren comparar10. En grupo 1 y grupo 2 deberemos aadir el nmero con el que se han
codificado ambos grupos (recordemos que esto lo podemos ver en la vista de variables, en valores).
Por otra parte, en la ventana variables para contrastar se debe aadir la variable cuantitativa (en
este caso la puntuacin en el pretest).
Obtenemos las siguientes tablas:
Estadsticos de muestras relacionadas
Error tp. de la
Media N Desviacin tp. media
Par 1 Puntuacin en el postest 36,7308 260 6,59330 ,40890

(competencias digitales)
Puntuacin en el pretest 36,8577 260 7,36467 ,45674

Correlaciones de muestras relacionadas
N Correlacin Sig.
Par 1 Puntuacin en el postest 260 ,082 ,190

(competencias digitales) y
Puntuacin en el pretest
Prueba de muestras relacionadas
Diferencias relacionadas
95% Int. conf. dif. Sig.

Media Desv.Tip. E.T. media Inferior Superior t gl (bilateral)
Par 1 Punt. post-Punt. pret -,12692 9,47600 ,58768 -1,28416 1,03031 -,216 259 ,829
En este caso no hay comprobacin de la igualdad de varianzas porque el procedimiento slo trabaja
con una variable, la variable diferencia. Recordemos la hiptesis planteada en esta prueba de t para
grupos relacionados:
H0: Postest= Pretest
H1: Postest Pretest
8
En qu casos podra ser ms interesante poner el pretest como variable 1 y el postest como variable 2?
9
Qu crees que ocurrir si ponemos las variables al revs?
10
Por qu crees que el SPSS requiere que definas qu grupos comparar?
47
Por lo tanto, estamos planteando si es plausible aceptar que el grupo de estudiantes ha demostrado
niveles de desempeo diferentes en el pretest y el postest (H1) o si los niveles mostrados en ambas
pruebas se pueden considerar iguales (H0).
En este caso, nos encontramos con informacin complementaria similar al caso de la prueba de t
para grupos independientes. Adems del valor del estadstico de contraste (t) y el de la significacin
de la prueba (p-valor), nos encontramos con los grados de libertad de la prueba (gl), la diferencia de
medias (postest pretest, en la tabla llamada Media), el error tpico, y el intervalo de confianza de
la diferencia de medias. En este caso, ese intervalo (-1.28416, 1.03031) se puede calcular a partir de
la siguiente frmula:
Podramos interpretar directamente el contraste a partir de ese intervalo de confianza11, pero en

todo caso, es suficiente con informar del valor del estadstico de contraste t y el p-valor. Podramos
resumir todo el proceso de la siguiente manera:
Tras la exploracin inicial del comportamiento de la variables puntuacin en el pretest
y en el postest, y la comprobacin del supuesto de normalidad de la variable diferencia
(Zk-s=1.201; p.=0.112), se aplica el contraste de hiptesis paramtrico. Asumiendo un
nivel de significacin del 5%, el resultado de la prueba de t para grupos relacionados
muestra que no existen diferencias significativas entre las puntuaciones del pretest y el
postest (t=-0.216; p.=0.829). Por lo tanto, no se rechaza la hiptesis nula, y se puede
afirmar que los estudiantes han alcanzado niveles similares de desempeo en el
pretest y en el postest.
4. CONTRASTE NO PARAMTRICO: TEST O PRUEBA DE WILCOXON
El contraste no paramtrico equivalente a la prueba de t paramtrica para grupos relacionados se

denomina test de Wilcoxon. Simplemente realiza el contraste de la igualdad de medianas de dos
variables en un mismo grupo cuando no se asegura el supuesto de normalidad de la variable
diferencia o cuando se quieren comparar dos variables ordinales. Las hiptesis planteadas son las
siguientes:
H0: MdnPost = MdnPret
H1: MdnPost MdnPret
Imaginemos que, en el ejemplo anterior, hubiramos determinado en las pruebas de normalidad que
la variable diferencia (postest-prestest) no se distribuye normalmente. En ese caso deberamos haber
aplicado la prueba de Wilcoxon de la manera que se expone a continuacin. En primer lugar, para
solicitar la prueba debemos acceder en SPSS a men analizar contrastes no paramtricos
Cuadros de dilogo antiguos 2 muestras relacionadas. La ventana emergente que aparece es
prcticamente igual a la que utilizamos en la prueba de t para muestras relacionadas, simplemente
deberemos insertar la variable postest en la columna 1 y la pretest en la columna 2. Las tablas
resultantes de solicitar el contraste en SPSS son las siguientes:
11
Cmo podramos hacerlo?
48
Rangos
Rango
N promedio Suma de rangos
a
Puntuacin en el pretest Rangos negativos 112 136,06 15238,50
(competencias digitales) - b
Rangos positivos 139 117,90 16387,50
Puntuacin en el postest Empates 9
c
Total 260
a. Puntuacin en el pretest (competencias digitales) < Puntuacin en el postest (competencias digitales)

b. Puntuacin en el pretest (competencias digitales) > Puntuacin en el postest (competencias digitales)
c. Puntuacin en el pretest (competencias digitales) = Puntuacin en el postest (competencias digitales)
b
Puntuacin en el pretest (competencias

digitales) - Puntuacin en el postest
a
Z -,499
a. Basado en los rangos negativos.

b. Prueba de los rangos con signo de Wilcoxon
En la primera tabla se observan los rangos. Esta prueba va comparando cada pareja de valores en las
dos variables para cada sujeto, y comprueba si un sujeto posee una puntuacin mayor, menor o igual
en la primera variable que en la segunda. Como indica bajo la tabla, los rangos positivos se referirn a
aquellas veces en las que el sujeto ha obtenido una puntuacin mayor en el pretest que en el
postest, los rangos negativos cuando el sujeto ha obtenido una puntuacin mayor en el postest que
en el pretest y los empates cuando la puntuacin ha sido exactamente la misma. Se observa que, de
los 260 estudiantes de la muestra, 139 obtuvieron una nota superior en el pretest, 112 en el postest
y 9 obtuvieron puntuaciones iguales. No es necesario interpretar el rango promedio ni la suma de
rangos haciendo una interpretacin correcta de esta N.
Una vez visto que hay ms sujetos en la muestra que obtienen mejor puntuacin en el pretest que en
el postest, podemos comprobar si esas diferencias son significativas a partir del contraste de
hiptesis no paramtrico de la prueba de la W de Wilcoxon. Resulta que estas diferencias no son
significativas (Z=0.499; p.=0.618), por lo que aceptamos H0 y no podemos afirmar que los sujetos
obtienen puntuaciones ms altas en el pretest que en el postest (y evidentemente, tampoco
podemos realizar la afirmacin contraria).
49
K MUESTRAS INDEPENDIENTES
En ocasiones nos ocurre que queremos comparar las puntuaciones en una variable de ms de dos
grupos al mismo tiempo. Imaginemos, por ejemplo, que nos interesa comparar el rendimiento
acadmico en matemticas de los estudiantes de las distintas provincias de Castilla y Len; en este
caso, debemos aplicar una tcnica que permita comparar a varios grupos a la vez (estudiantes de
vila, Burgos, Len, Palencia, Valladolid, etc.). El conjunto de tcnicas que vamos a exponer aqu
permiten realizar estos clculos de manera conjunta, sin tener que separar los grupos en cada una de
las parejas posibles y realizar varias pruebas para 2 muestras independientes.
En este ejemplo, vamos a comparar el rendimiento alcanzado en Lengua Castellana por los
estudiantes de las distintas provincias de Castilla y Len representadas en la Base de Datos. As, lo
primero que debemos hacer es seleccionar los datos de los estudiantes de Castilla y Len. Para ello
vamos a men datos Seleccionar casos. En la ventana emergente debemos seleccionar si se
satisface la condicin, y en el cuadro en blanco de la ventana si la opcin, aadir en el cuadro
blanco la variable Comunidad autnoma y poner =1 (en la ventana debe aparecer el texto
CCAA=1).
Parece que la distribucin por provincia est repartida de modo razonablemente equilibrado y que
tenemos ms de 30 sujetos por grupo, por lo que estaramos en condiciones de aplicar un contraste
de hiptesis. Tenemos 200 estudiantes en Castilla y Len que se reparten del siguiente modo:
Provincia
90 82
80
69
70
60
49
50
40
30
20
10
0
Valladolid Len Salamanca
En cuanto al rendimiento en Lengua, la puntuacin media de los estudiantes de la muestra de

Salamanca es ms alta, y cmo tenemos niveles de dispersin superiores en Valladolid y variaciones
generales muy altas. La asimetra es claramente negativa y la curtosis mesocrtica en Salamanca,
mientras que tenemos curtosis platicrticas y ligera asimetra positiva en las otras provincias.
Mdn CV As Curt
Valladolid 5.06 4.6 2.66 52.57% 0.25 -1.14
Len 5.27 5.6 2.19 41.56% 0.10 -0.61
Total 6.80 7.15 2.14 31.48% -0.75 0.02
50
A priori, parece que las distribuciones de alguna de las variables pueden alejarse de la distribucin
normal, tanto por los estadsticos de forma como por la gran variacin de las mismas. Veamos para
confirmar estas observaciones el anlisis de los supuestos previos.
En este caso ser necesario comprobar tanto el supuesto previo de normalidad como el de
homocedasticidad.
Veremos en primer lugar la prueba de normalidad, tras el anlisis de los histogramas de las
distribuciones de las variables (forzando a 10 intervalos y el eje X con puntuaciones entre 0 y 10).
Vemos distribuciones alejadas de la normalidad por varias cuestiones tanto en Valladolid (curtosis
platicrtica) como en Salamanca (asimetra negativa). En todo caso, veamos lo que ocurre cuando
aplicamos la prueba de normalidad. Recordemos antes las hiptesis planteadas en este contraste:
51
Zk-s P-VALOR
Valladolid 0.844 0.475
Len 0.567 0.905
Salamanca 1.231 0.097
En base a estos resultados no tenemos evidencias suficientes para afirmar que existen diferencias
significativas entre la distribucin normal y las distribuciones de la variable rendimiento en lengua en
los grupos. No obstante, an tenemos que comprobar la hiptesis de igualdad de varianzas. Para ello,
tras quitar la segmentacin del archivo, accedemos a men analizar Comparar medias ANOVA
de un factor. En la ventana emergente debemos aadir en la lista de dependientes la variable
continua que queremos contrastar (rendimiento en lengua) y en el factor la variable de agrupacin
(provincia). En el botn opciones debemos seleccionar la opcin prueba de homogeneidad de las
varianzas. Recordemos las hiptesis asociadas a la prueba de homogeneidad de varianzas:
H0: Las varianzas en la variable de los 3 grupos son iguales
H1: Las varianzas en la variable de los 3 grupos no son iguales
La primera tabla que nos aparece es la que debemos interpretar:
Prueba de homogeneidad de varianzas

Rendimiento en Lengua Castellana
Estadstico de
Levene gl1 gl2 Sig.
3,825 2 197 ,023
Se observa un p-valor de 0.023<0.05. Por lo tanto, rechazo H0, y puedo afirmar que las varianzas
entre los grupos no son iguales, es decir, que no existe homocedasticidad. Este resultado imposibilita
la aplicacin de las tcnicas paramtricas, por lo que vamos a aplicar en este caso el contraste no
paramtrico.
3. CONTRASTE NO PARAMTRICO: PRUEBA DE KRUSKAL-WALLIS
Bien, una vez hecho todo lo anterior, vamos a completar la prueba. Para ello, vamos a men datos
Segmentar archivo y seleccionamos analizar todos los casos.
Una vez estamos seguros de que el archivo no est segmentado, seleccionarmos men analizar
Pruebas no paramtricas Muestras independientes. En la pestaa objetivo de la ventana
emergente, debemos seleccionar personalizar anlisis. Tras esto, accedemos a la pestaa campos,
donde aadimos en el cuadro campos de prueba la variable de contraste (en este caso, rendimiento
en Lengua), y en el cuadro grupos la variable de agrupacin (en este caso, provincia). Una vez hecho
eso, accedemos a la pestaa Configuracin, hacemos clic en personalizar pruebas, y seleccionamos
ANOVA de 1 va de Kruskal-Wallis. Seleccionamos ejecutar y nos aparecer en la ventana de
52
resultados la informacin del contraste. Recordemos antes de nada las hiptesis asociadas a este
contraste no paramtrico:
H0: MdnVallad= MdnLen = MdnSalam
H1: MdnVallad MdnLen MdnSalam

Por tanto, el contraste principal simplemente indica si existen o no existen diferencias significativas
entre alguno de los 3 grupos, independientemente de entre qu grupos se obtengan las diferencias.
La tabla mostrada inicialmente es la siguiente:
La informacin mostrada es muy simple y nos dice directamente que existen diferencias significativas
entre las medianas de alguno de los tres grupos. Veamos la informacin un poco ms detallada
haciendo doble clic encima del cuadro en SPSS:
En este caso ya vemos la informacin un poco ms desarrollada: en los 200 sujetos que compone la
muestra de estudiantes de Castilla y Len, parece que la divisin por Provincia devuelve diferencias
53
significativas (2=22.902; p.<0.001). El diagrama de cajas ya nos muestra que parece que, mientras
que Valladolid y Len poseen distribuciones de puntuaciones similares, los estudiantes de Salamanca
tienden a unas puntuaciones superiores. Si recordamos los estadsticos descriptivos obtenidos ms
arriba, la mediana del rendimiento en Lengua de los estudiantes de Valladolid era de 4.6, de los de
Len 5.6 y de los de Salamanca 7.15.
Pero en este punto surge una duda, es esta informacin suficiente para poder hacer una
interpretacin clara de las diferencias entre los grupos? Evidentemente, esta informacin global no
es suficiente, ya que no nos permite saber entre qu parejas de grupos en concreto (en este caso
entre qu provincias) se establecen estas diferencias. Para realizar esta comprobacin, SPSS incluye
las pruebas post-hoc, es decir, las pruebas por parejas asociadas al contraste de Kruskal-Wallis. Para
acceder a ellas, en la misma ventana en la que hemos localizado la informacin de los diagramas de
cajas, el N, el valor del estadstico de contraste Chi-Cuadrado, los grados de libertad y el p-valor,
buscamos en la ventana de la derecha la opcin ver, hacemos clic en el desplegable, y
seleccionamos la categora Comparaciones por parejas. Se nos abrir la siguiente informacin:
54
Cada uno de los puntos del grfico nos indica cada uno de los grupos y las lneas los contrastes. Las
lneas amarillas se corresponden con los contrastes que han resultado significativos en las
comparaciones por parejas. La informacin concreta est desplegada en la tabla inferior. En esta
tabla tenemos tanto la informacin del estadstico de contraste (Prueba estadstica), como la
informacin sobre la desviacin y error tpico en cada contraste y la significacin de la prueba. De las
dos columnas de la significacin siempre hay que interpretar como p-valor la que dice sig. ady..
En este caso, se puede concluir que la muestra de estudiantes de Salamanca ha obtenido
puntuaciones medianas significativamente superiores (rechazo H0) tanto con respecto a los
estudiantes de Len (2=-38.695; p.<0.001), como en relacin a los estudiantes de Valladolid (2=-
41.280; p.<0.001). Sin embargo, no existen diferencias significativas (acepto H0) entre el rendimiento
demostrado por los estudiantes de Len y de Valladolid (2=-2.584; p.>0.999).
As pues, la prueba de Kruskal-Wallis me permite comparar el desempeo en una variable
cuantitativa (cuando no se cumplen las condiciones de normalidad o homocedasticidad) u ordinal en
varios grupos al mismo tiempo (variable cualitativa politmica), y comprobar entre qu grupos
exactamente se generan las diferencias significativas, en el caso de existir.
4. CONTRASTE PARAMTRICO: ANOVA DE 1 FACTOR
Nos puede ocurrir que se cumplan las condiciones de normalidad y homocedasticidad, caso en el que
podremos realizar el contraste de hiptesis paramtrico denominado ANOVA (Anlisis de Varianza)
de 1 factor. Imaginemos, en el ejemplo anterior, que se cumplen las condiciones de normalidad y
homocedasticidad, por lo que estaramos en condiciones de realizar este contraste.
Recordemos que para poder aplicar el ANOVA de 1 factor es necesario disponer en SPSS de una
variable cuantitativa (variable de contraste) y otra cualitativa politmica (variable de agrupacin).
En el ejemplo anterior, para realizar este contraste de hiptesis, debemos acceder a men analizar
Comparar medias Anova de un factor. En la ventana emergente debemos aadir en la lista de
dependientes la variable continua que queremos contrastar (rendimiento en lengua) y en el factor la
variable de agrupacin (provincia). Por otro lado, es recomendable que seleccionemos en el botn
opciones la opcin descriptivos (si no hemos comprobado la homocedasticidad, recordemos en
esta misma opcin debemos seleccionar prueba de homogeneidad de las varianzas). Para que, en
caso de localizarse diferencias significativas en el contraste general, se realicen las pruebas post hoc
para cada pareja de grupos, debemos seleccionar el botn Post hoc, y seleccionar la opcin
Scheff. Estas pruebas post-hoc realizan una prueba de t para 2 grupos independientes en cada
pareja.
Recordemos las hiptesis del contraste principal:
H0: Vallad= Len = Salam
H1: Vallad Len Salam

Las tablas principales que devuelve SPSS en este contraste se muestran a continuacin:
55
Descriptivos
N Media Desviacin Error I.C. para la media al 95% Mnimo Mximo

tpica tpico Lm inferior Lm. superior
Valladolid 49 5,0627 2,65983 ,37998 4,2987 5,8266 ,90 9,98

Len 69 5,2732 2,19392 ,26412 4,7462 5,8002 1,20 10,00
Salamanca 82 6,8041 2,13677 ,23597 6,3346 7,2736 1,30 10,00
Total 200 5,8493 2,41925 ,17107 5,5120 6,1866 ,90 10,00
ANOVA de un factor
Suma de gl Media cuadrtica F Sig.

cuadrados
Inter-grupos 127,985 2 63,993 12,160 ,000

Intra-grupos 1036,719 197 5,263
Total 1164,704 199
Pruebas post hoc

Comparaciones mltiples
Variable dependiente: Rendimiento en Lengua Castellana
Scheff
(I) Provincia (J) Provincia Diferencia de Error Sig. Intervalo de confianza al 95%
medias (I-J) tpico Lmite inferior Lmite superior
Len -,21054 ,42856 ,886 -1,2676 ,8465

Valladolid *
Salamanca -1,74149 ,41422 ,000 -2,7632 -,7198
Valladolid ,21054 ,42856 ,886 -,8465 1,2676
Len *
Salamanca -1,53096 ,37476 ,000 -2,4553 -,6066
*
Valladolid 1,74149 ,41422 ,000 ,7198 2,7632
Salamanca *
Len 1,53096 ,37476 ,000 ,6066 2,4553
*. La diferencia de medias es significativa al nivel 0.05.
En primer lugar, se muestra la tabla de los estadsticos descriptivos para los 3 grupos de estudiantes.
Vemos inicialmente la N, media, desviacin tpica y error tpico para cada grupo en la variable
rendimiento en lengua, y en las ltimas columnas la puntuacin mnima y mxima registrada en la
variable. El intervalo de confianza mostrado es el resultante del clculo del intervalo para la media,
que ya vimos en el primer tema. Por ejemplo, en el caso de los estudiantes de Valladolid:
Realmente, podramos comparar estos intervalos de confianza de la media para anticiparnos al

resultado del contraste:
56
7,5
7,27
7,0
6,80
6,5
6,33
6,0 Media
5,83 5,80
Lm. Inf
5,5
Lm. Sup.
5,27
5,06
5,0
4,75
4,5
4,30
4,0
Valladolid Len Salamanca
Se observa en el grfico anterior cmo, mientras que los intervalos de confianza de Len y Valladolid
tienen una parte en la que se superponen (no existen diferencias significativas en la media de estos
dos grupos), el intervalo de confianza del rendimiento medio en Lengua en el caso de los estudiantes
de Salamanca no se solapa en ningn caso con los otros dos grupos. As, podramos concluir
simplemente con esta informacin que existen diferencias significativas globales entre los grupos y
que las diferencias existen entre los estudiantes de Salamanca y los de Len-Valladolid, teniendo los
estudiantes de Salamanca un rendimiento medio superior a los otros dos grupos.
En todo caso, vamos a analizar el resto de datos para confirmar estas afirmaciones. La segunda tabla
(ANOVA de un factor), muestra los resultados del contraste de hiptesis principal, el que determina si
existen diferencias globales entre los grupos. La informacin que interesa interpretar de esa tabla es
la puntuacin del estadstico de contraste, en este caso F, y el p-valor (Sig.). Los valores de la Suma
de Cuadrados, grados de libertad y Media Cuadrtica sern explicados a nivel terico en el siguiente
apartado. En este ejemplo, los resultados obtenidos en el contraste de hiptesis del ANOVA de 1
factor indican que existen diferencias significativas entre los grupos en cuanto al rendimiento en
lengua (F=12.16; p.<0.001), es decir, que rechazo la hiptesis nula de que no existen diferencias
entre los grupos.
En lo que respecta a las pruebas post-hoc, que determinan entre qu grupos en concreto se localizan
las diferencias, vemos informacin sobre la diferencia concreta de medias de cada pareja
contrastada, el error tpico del contraste, el p-valor asociado al contraste y el intervalo de confianza
de la diferencia de medias, calculado a partir de la obtencin de la amplitud del intervalo (t*E.T.). Se
observa que los contrastes significativos resultan de la comparacin SALAMANCA-LEN (p.<0.001) y
SALAMANCA-VALLADOLID (p.<0.001), mientras que la comparacin de la diferencia de medias LEN-
VALLADOLID no resulta significativa (p.=0.886). As, se confirman las observaciones realizadas a partir
del grfico y los intervalos de confianza iniciales:
Los resultados de la prueba de ANOVA de un factor para comprobar si los estudiantes
de las distintas provincias de Castilla y Len obtienen rendimientos medios en Lengua
57
Castellana diferentes resultan significativos (F=12.16; p.<0.001). As, se rechaza la

hiptesis nula de que no existen diferencias en las medias de los grupos de
estudiantes, y es necesario aplicar las pruebas post-hoc para determinar entre qu
grupos en concreto se obtienen las diferencias. En estas pruebas post-hoc se confirma
que el grupo de estudiantes de Salamanca alcanza rendimientos medios ms altos
tanto con respecto a los estudiantes de Valladolid como a los estudiantes leoneses
(p<.001), y que no existen diferencias significativas entre los estudiantes de Valladolid
y Len (p=0.886).
5. EXPLICACIN TERICA: ANOVA DE 1 FACTOR
Cabe realizar una breve explicacin de los valores de la tabla de ANOVA que no se han interpretado
(Suma de cuadrados, grados de libertad y Cuadrados medios). Veamos la siguiente tabla-resumen:
Media
Suma de cuadrados gl F Sig.
cuadrtica
Efectos
I-1 p-valor
principales
Error n-I
Total n-1
Se observa el clculo de todas las celdas. Veamos un pequeo ejemplo para hacernos una idea.
Imaginemos que tenemos un grupo de 12 estudiantes en un aula de educacin infantil y queremos
comprobar si el nivel de comprensin lectora (medido en una escala de 0 a 100 puntos) cambia en
funcin del mtodo de enseanza de la lectura aplicado a los estudiantes (mtodo alfabtico, mixto y
global). As, dividimos a los 12 estudiantes en 3 grupos de 4 estudiantes y a cada grupo le enseamos
durante todo el curso con uno de los 3 mtodos. Al final del curso medimos el nivel de comprensin
lectora, obteniendo los siguientes resultados:
Alfabtico Mixto Global
60 39 60
30 66 75
50 80 62
45 58 88
Si quisiramos preparar los datos para utilizar en SPSS, la informacin debera aparecer del siguiente
modo:
58
Comprensin lectora Mtodo*

1 60 1
2 30 1
3 50 1
4 45 1
5 39 2
6 66 2
7 80 2
8 58 2
9 60 3
10 75 3
11 62 3
12 88 3
1=Mtodo alfabtico; 2= Mtodo mixto; 3=Mtodo global
Pues bien, primero debemos calcular algunas cuestiones bsicas:

I= 3 (existen 3 grupos de sujetos, uno por mtodo de enseanza de la lectura).

A partir de aqu puedo calcular las sumas de cuadrados:

Ntese que
A partir de aqu ya slo me queda calcular las medias cuadrticas, el valor de F y el p-valor asociado:

Veamos pues la tabla de ANOVA completa que se obtiene de estos clculos:
Media
Suma de cuadrados gl F Sig.
cuadrtica
Ef. Ppales 1260.67 2 630.33 30.59 0.097
Error 1854.25 9 206.03
Total 3114.92 11
59
Por tanto, en este caso, dado que el p-valor es superior al nivel alfa (0.05), podemos determinar que
no existen diferencias significativas en cuanto al nivel de comprensin lectora alcanzado en funcin
del mtodo de enseanza aplicado a los estudiantes. No es necesario, pues, aplicar los contrastes de
hiptesis post-hoc para comprobar las diferencias entre cada pareja, ya que este contraste nos indica
que no existen diferencias entre ninguna de las parejas.
60

Anlisisdedatosinferencialparamtricoynoparamtricoencienciassociales 160906175910

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Anlisisdedatosinferencialparamtricoynoparamtricoencienciassociales 160906175910

Caricato da

Copyright:

Formati disponibili

ANLISIS DE DATOS INFERENCIAL PARAMTRICO Y NO PARAMTRICO

Autor: Fernando Martnez Abad (fma@usal.es), Universidad de Salamanca.

INTRODUCCIN AL ANLISIS INFERENCIAL DE DATOS EN CCSS ...................................................... 2

DOS MUESTRAS RELACIONADAS ................................................................................................. 45

INTRODUCCIN AL ANLISIS INFERENCIAL DE DATOS EN CCSS

Dicho de manera ms formal, podemos definir la inferencia estadstica como el conjunto de

Figura 1. Poblacin y muestra

En muchas ocasiones, el tamao de la poblacin es infinito, es decir ni siquiera est

Se desean estudiar las competencias digitales del profesorado de educacin bsica

de la informacin muestral disponible en el estudio. A este conjunto de tcnicas, que tratan de

Figura 2. Procedimiento de la estadstica inferencial

FUNDAMENTOS DE LA ESTIMACIN DE PARMETROS

DISTRIBUCIONES TERICAS: LA DISTRIBUCIN NORMAL

En suma, la distribucin de puntuaciones en estas variables tiene forma acampanada y simtrica, o

Figura 3. Distribucin normal o campana de Gauss (Fuente: www.wikipedia.org)

Figura 4. Funcin de densidad 2 (Fuente: adaptado de www.wikipedia.org)

En cuanto a la T de student, es la distribucin que se emplea en la estimacin de parmetros como

Figura 5. Funcin de densidad T (Fuente: adaptado de www.wikipedia.org)

Por ltimo, estudiaremos la distribucin F de Snedecor, basada tambin en la distribucin normal

Figura 5. Funcin de densidad F (Fuente: adaptado de www.wikipedia.org)

LA DISTRIBUCIN MUESTRAL y DISTRIBUCIN MUESTRAL DE LA MEDIA

Tabla 1. Distribucin poblacional. Variable rendimiento en matemticas (N=5)

Si calculamos la puntuacin media de la poblacin =(6+6+7+5+6)/5=6.

Tabla 2. Distribucin muestral de la media. Variable rendimiento en matemticas (N=5; n=2)

O visto en una tabla con los datos acumulados:

Tabla 3. Frecuencias distribucin muestral de la media rendimiento en matemticas (N=5; n=2)

Grfico 1. Distribucin muestral de la media. Variable rendimiento en matemticas (n=2)

Tenemos las siguientes puntuaciones de los sujetos de la poblacin:

En este caso, la puntuacin media de la poblacin es =(3+8+5+6+6+7+4+6+7+8)/10=6.Todas las

Tabla 5. Frecuencias distribucin muestral media rendimiento en matemticas (N=10; n=5)

Y esta distribucin muestral de la media se puede representar en el siguiente diagrama de densidad:

Grfico 2. Distribucin muestral de la media. Variable rendimiento en matemticas (n=5)

En primer lugar, en los estudios que se implementan en el mbito de las Ciencias de la

grande, y la obtencin emprica de la distribucin muestral de la media en la mayor parte de

Si una variable se distribuye normalmente, entonces la distribucin muestral de la media

ESTIMACIN DE PARMETROS y CONTRASTE DE HIPTESIS

1. Supuesto previo de normalidad de la variable observada

Las tcnicas que se emplean de modo ms habitual son las siguientes:

Exploracin grfica de la variable original obtenida en la muestra. Se puede obtener el

El contraste de hiptesis commente empleado para comprobar la hiptesis de normalidad

2. Establecimiento del nivel de error y de confianza asumidos

El nivel de error asumido generalmente se denomina nivel o nivel de significacin, y en Ciencias

Como ya se ha indicado previamente, si el nivel de significacin o de error es del 5%, el intervalo de

3. Estimacin del parmetro deseado

Figura 6. Distribucin muestral de la media normal (Fuente: adaptado de www.sac.org.ar)

EJEMPLO 3. Clculo de un intervalo para la media

Hiptesis sobre un solo estadstico en un grupo o una muestra: Comprobar si es plausible o si

Antes de entrar a estudiar en profundidad el funcionamiento de los contrastes de hiptesis para

rechazar la hiptesis alternativa planteada. En todo caso, la hiptesis alternativa es la

El acusado es inocente y El acusado es culpable y

En realidad este procedimiento corresponde al espritu de un juicio en el que la presuncin de

0. Planteamiento inicial del problema: Hiptesis o cuestiones de investigacin.

Normalmente, las cuestiones o hiptesis iniciales de la investigacin, vienen formuladas

EJEMPLO 4. Contraste de hiptesis para una media en un grupo

la varianza en la poblacin). Tras obtener una muestra representativa de n=105 estudiantes de

As, podemos plantear como hiptesis de investigacin (paso 0):

El cociente intelectual alcanzado por la poblacin estudiantes finlandeses de Educacin Secundaria

En cuanto al paso 1, ya hemos sealado que la variable CI en la muestra de estudiantes finlandeses

Recordemos que la desviacin tpica es la raz cuadrada de la varianza: Sx2=164 Sx=12.81.

Figura 8. Intervalo para un nivel =0.05. EJEMPLO 4 (Fuente: elaboracin propia)

Un grupo de investigadores de la Universidad de Salamanca tiene indicios de que existen diferencias

nMad= 536 =87.9 32.3

nAnd= 883 =83.6 15.2