Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
captulo '; ; V
E
rencia entre una muestra y una poblacin. En este captulo, presentamos el tema
crucial de la prueba de hiptesis. La prueba de hiptesis es un procedimiento sis
temtico para determinar si los resultados de un experimento a travs del cual se
analiza una muestra, sustentan una teora o innovacin prctica determinada que
se aplica a una poblacin, La prueba de hiptesis es el tema central de todos los captulos res
tantes de este libro, como lo es tambin en la mayora de las investigaciones cientficas. Casi
todos las publicaciones de investigacin psicolgica utilizan la prueba de hiptesis.
Es nuestro deber advertir que, para la mayora de los alumnos, la parte ms difcil del curso es.
el manejo de la lgica bsica de este captulo y de los dos siguientes. Este captulo, en particular,
requiere cierta gimnasia mental. Aun cuando se comprendan todos los razonamientos.la primera
vez, es recomendable realizar una revisin completa. La prueba de hiptesis involucra un grupo
de ideas que, contempladas separadamente, no tienen mucho sentido. Por lo tanto, en este captu
lo aprenderemos una cantidad comparativamente grande de ideas al mismo tiempo. Mirando el
lado positivo, una vez que hayamos incorporado bien los temas de este captulo y de los dos si
guientes, estaremos acostumbrados a este tipo de material, y el resto del curso resultar sencillo.
Al mismo tiempo, hemos desarrollado esta introduccin a la prueba de hiptesis de la mane
ra ms sencilla posible, y dejamos para los captulos posteriores todo aquello que poda poster
garse. Por ejemplo, las investigaciones psicolgicas reales casi siempre involucran muestras
compuestas por muchos -a veces muchsimos- individuos. Sin embargo, para simplificar las co
sas, todos los ejemplos de este captulo se refieren a estudios en los que la muestra est formada
por un slo individuo. Pra lograrlo, hemos tenido que crear algunos ejemplos bastante extra
os, por eso es conveniente que el alumno recuerde simplemente que estamos construyendo los
cimientos que, en el captulo 9, lo prepararn para comprender la prueba de hiptesis tal como se
realiza en la realidad.
Este es el primer ejemplo ficticio y, necesariamente, extrao. Durante varios aos se ha desarro
llado un gran proyecto de investigacin. En el contexto del proyecto, se ha administrado a bebs
recin nacidos una vitamina especial, y luego se ha controlado su desarrollo durante los primeros
dos aos de vida. Hasta ahora, la vitamina no ha acelerado el desarrollo de los bebs. La distribu
cin de la edad en la que stos y todos los bebs comienzan a caminar est representada por la fi
gura 6-1. En ella observamos que la media es 14 meses, el desvo estndar es de 3 meses, y las
edades siguen una curva normal. Mirando la curva podemos observar que menos del 2% de los
bebs comienzan a caminar antes de los 8 meses de edad (estos bebs se encuentran 2 desvos es
tndar por debajo de la media de edad para comenzar a caminar). (La distribucin qu analiza
mos, si bien es ficticia, en realidad es bastante similar a la distribucin que los psiclogos han
probado en el caso de bebs europeos, aunque esa distribucin real es levemente asimtrica hacia
la derecha; Bindley, Filliozat, Kackenberg, Nicolet-Mesteri & Sand, 1966).
Uno de los investigadores del proyecto ha tenido una idea. Sobre la base de algunas nuevas
teoras, razona que si la vitamina que toman los bebs estuviera ms refinada, su efecto podra
ser notablemente mayor, y que los bebs que tomaran la versin con alto grado de refinamiento
deberan comenzar a caminar mucho antes que los otros bebs. (Supondremos que el proceso de
purificacin no poda de ningn modo hacer que la vitamina fuera daina para los bebs). Sin
embargo, refinar la vitamina de este modo eleva en gran medida el costo'de cada dosis; por lo
tanto, el equipo de investigacin decide probar el procedimiento con dosis suficientes para un
slo beb. Entonces, se selecciona al azar un beb del proyecto para suministrarle la versin al
tamente refinada de la vitamina, y se realiza un seguimiento de su progreso junto con el de todos
los otros bebs de mismo proyecto. Qu tipo de resultado llevara a los investigadores a sacar
la conclusin de que la vitamina altamente purificada hace que los bebs caminen a ms tempra
na edad?
Lo que acabamos de describir es el ejemplo de un problema que se resuelve a travs de la
prueba de hiptesis. Los investigadores pretenden sacar una conclusin acerca de si la vitamina
purificada hace que los bebs en general caminen antes de lo esperado. La conclusin referida a
los bebs en general, sin embargo, se basar en los resultados obtenidos, estudiando slo una
muestra. (En este extrao ejemplo, la muestra es un slo beb).
Figura 6-1. Distribucin de edades en que los bebs comienzan a caminar (datos ficticios).
Existe un mtodo estndar para encarar un problema de prueba de hiptesis. El investigador utili
zar el siguiente razonamiento: comnmente, las chances de que un beb comience a caminar a
los 8 meses de edad o antes seran menores al 2%. Por lo tanto, caminar a ios 8 meses es altamen
te inverosmil Pero qu sucede si el beb que estamos estudiando comienza a caminar a los 8
meses? S esto sucede, podremos rechazar la idea de que la vitamina especialmente purificada
no produce ningn efecto. Si rechazamos la idea de que la vitamina especialmente purificada no
produce ningn efecto, debemos aceptar la idea de que s produce un efecto. (La lgica de este
ejemplo es crucial para todos los siguientes temas del libro. Tal vez sea conveniente volver a leer
este prrafo).
En primer lugar, los investigadores han comprendido qu tendra que suceder para poder sa
car la conclusin de que el procedimiento de purificacin especial marca una diferencia. Habien
do comprendido esto previamente, los investigadores pueden entonces continuar con la
realizacin de su estudio. En este caso, realizar el estudio significa suministrar la vitamina espe
cialmente purificada a un determinado beb y observar a qu edad ese beb comienza a caminar.
Si el resultado del estudio muestra que el beb comienza a caminar antes de los 8 meses, entonces
concluirn que es inverosmil que la vitamina especialmente purificada no provoque una diferen
cia. Si es inverosmil que la vitamina especialmente purificada no provoque una diferencia, en
tonces la conclusin es que probablemente s la provoque.
Este tipo de razonamiento al revs, contrario a lo que uno predice, es el corazn de la estads
tica inferencial en psicologa. Es algo as como una doble negacin. Uno de los fundamentos de
este mtodo es que podemos determinar directamente la probabilidad de obtener un resultado ex
perimental determinado s la situacin de que no se produzca diferencia es verdadera. En el ejem
plo de la vitamina purificada, los investigadores saben cules son las probabilidades de que los
bebs caminen a diferentes edades si la vitamina especialmente purificada no produce ningn
efecto. Es la probabilidad de que un beb camine a distintas edades lo que ya conocemos por ana
lizar bebs en general, es decir, bebs que no han recibido vitamina especialmente purificada.
(Supongamos que la vitamina especialmente purificada no produce ningn efecto. En ese caso,-la
edad en la que los bebs comienzan a caminar es la misma, reciban o no la vitamina especialmen
te purificada. Por lo tanto, la distribucin es la que aparece en la figura 6-1, basada en las edades
en las que los bebs en general comienzan a caminar).
Sin esta reconocidamente tortuosa manera de enfocar el problema, en la mayora de los casos
no habra modo de probar una hiptesis. En casi todas las investigaciones psicolgicas, ya sea con
experimentos, encuestas u otro mtodo, sacamos conclusiones evaluando la probabilidad de obte
ner nuestros resultados de investigacin si fuera verdad lo contrario a lo que estamos prediciendo.
Es decir, generalmente predecimos algn tipo de efecto pero evaluamos si existe tal efecto obser
vando si es inverosmil la hiptesis de que ese efecto no exista.
* En este caso hemos simplificado ei tema. La hiptesis de investigacin implica que una poblacin caminar antes que
ia otra, Por lo tanto, lo contrario implica que e l otro grupo caminar o bien al mismo tiempo o despus. A s, lo
contrario a la hiptesis de investigacin, en este caso incluye tanto la falta de diferencia com o una diferencia en direc
cin contraria a la predicha. En trminos de smbolos, si nuestra hiptesis de investigacin es jq c p j, entonces su
opuesto es p,j > Xj (el smbolo 5 significa mayor o igual a). Presentamos este tema con mayor detalle ms adelante
en este captulo. Por ahora, para simplificar el aprendizaje, algunas veces consideraremos que la hiptesis nula implica
que las dos poblaciones son esencialmente iguales, y otras veces consideraremos que implica que una poblacin es
igual u opuesta a la hiptesis de investigacin.
Una vez que hemos planteado la situacin en trminos de eleccin entre una hiptesis de investi
gacin y una hiptesis nula, el siguiente paso es analizar cmo podramos utilizar la informacin
que obtenemos sobre una muestra para realizar esta eleccin. La pregunta que planteamos es la
siguiente: dado un determinado resultado muestra! (en este caso, una observacin), qu probabi
lidad tenamos de obtener ese resultado si la hiptesis nula fuera verdadera?
Para responder esta pregunta, debemos saber cmo sera la situacin si la hiptesis nula fuera
verdadera. Es decir, necesitamos conocer los detalles de la distribucin de la poblacin de la cual
proviene la muestra si la hiptesis nula fuera verdadera. Si conocemos la distribucin de la pobla
cin de la que proviene nuestra muestra, y sabemos que se trata de una distribucin normal, nos
encontramos en una buena posicin: podemos determinar directamente la probabilidad de obte
ner cualquier valor determinado de esa distribucin utilizando una tabla de reas bajo la curva
normal.
Cmo podemos conocer los detalles de la poblacin de la cual proviene nuestra muestra si
la hiptesis nula es verdadera? Esto es posible porque, si la hiptesis nula es verdadera, ambas
poblaciones son iguales. Generalmente conocemos una de las poblaciones (poblacin 2); por lo
tanto, si la hiptesis nula es verdadera y las dos poblaciones son iguales, tambin conocemos la
otra poblacin (poblacin 1). En nuestro ejemplo, si la hiptesis nula es verdadera, ambas pobla
ciones siguen la curva normal, y presentan una media de 14 meses y un desvo estndar de 3 me
ses (vase figura 6-1).
En este libro llamaremos a la distribucin correspondiente a la situacin en la que la hiptesis
nula es verdadera, es decir, la distribucin con la que comparamos la muestra, distribucin com
parativa. (La distribucin comparativa a veces es denominada "modelo estadstico, y en la ma
yora de los casos tambin coincide con lo que se denomina una distribucin muestra, una. idea
que expondremos en el captulo 7). Es decir, en el proceso de la prueba de hiptesis, comparamos
los valores observados en la muestra con esta distribucin. Realizamos la comparacin calculan
do la probabilidad de obtener un valor tan extremo como el de nuestra muestra en esa distribucin
comparativa. En el ejemplo que estamos tratando, la distribucin comparativa es igual a la distri
bucin de valores de la poblacin 2, la poblacin a la que no se le ha aplicado el procedimiento
experimental.
Figura 6-2. Distribucin de la edad en la que los bebs comienzan a caminar (datos ficticios).
investigadores rechazan la hiptesis nula si la probabilidad de obtener un resultado tan extremo
(si la hiptesis nula fuera verdadera) es menor al 5%. Esta probabilidad generalmente se escribe
como p<0,05\ No obstante, en algunas reas de investigacin, o cuando los investigadores quie
ren ser especialmente cautelosos, utilizan un corte dei 1% (p<0,01).
A estos porcentajes se los denomina niveles convencionales de significacin. Se describen
como nivel de significacin 0,05 nivel de significacin 0,01. Cuando el valor muestral es tn ex
tremo que ios investigadores rechazan la hiptesis nula, se dice que el resultado es estadstica
mente significativo.
Los estudios acerca de la vitamina purificada y la felicidad son ejemplos que involucran hiptesis
direccionales. En cada caso, los investigadores estaban interesados en una direccin especfica del
efecto. Es importante observar que cuando un investigador propone una hiptesis direccional, la
hiptesis nula correspondiente es, tambin, en cierto sentido direccional. Si la hiptesis de investi
gacin establece que obtener 1 milln de dlares har ms feliz a una persona, la hiptesis nula es-
F ig u r a 6-S . D is tr ib u c i n d e v a lo r e s d e l n iv e l d e f e lic id a d c o n e l 5 % s u p e r io r s o m b r e a d o y la u b ic a c i n d e l
m illo n a r io q u e c o n fo r m a la m u e s tr a (d a to s f ic t i c io s ) .
tablece que el dinero no producir ningn efecto o har menos feliz a esa persona, (Expresado en
smbolos, si la hiptesis de investigacin es x3 > jx2, entonces la hiptesis nula ser < ji2). Por
lo tanto, como ya hemos observado, en la figura 6-5, por ejemplo, para rechazar la hiptesis nula la
muestra deba arrojar un valor que se ubicara dentro del 5% superior, el extremo o cola superior de
la distribucin comparativa. (A los fines de rechazar la hiptesis nula, un valor ubicado en la otra
cola sera considerado del mismo modo que un valor ubicado en el medio d la distribucin). Por
esta razn, la prueba de una hiptesis direccional se denomina prueba de una cola.
Sin embargo, a veces una hiptesis de investigacin implica simplemente que una poblacin ser
diferente de la otra, sin especificar si la diferencia la marcarn valores ms altos o ms bajos. Por
ejemplo, un psiclogo especializado en organizaciones empresariales puede estar interesado en el
impacto provocado en la productividad por un programa de capacitacin en relaciones sociales.
Es posible que el programa mejore la productividad al hacer ms placentero el ambiente de traba
jo. Pero tambin es posible que perjudique la productividad por incentivar a las personas a que
practiquen relaciones sociales en lugar de trabajar. En este caso, la hiptesis de investigacin im
plicara que el programa de relaciones sociales cambie el nivel de productividad. La hiptesis nu
la implicara que el programa no afecte la productividad en ningn sentido. Es decir, expresado en
smbolos, la hiptesis de investigacin sera jj, j ^ p,2, y la hiptesis nula sera p.t - jx2.
Siempre que una hiptesis de .investigacin establezca una diferencia, sin indicar la direccin
de esa diferencia, se la denomina hiptesis no direccional. Para probar la significacin de una hi
ptesis no direccional, uno debe analizar si un valor es extremo en cualquiera de las dos colas de
la distribucin comparativa. Por lo tanto, a esta prueba se la denomina prueba de dos colas.
Las pruebas de dos colas presentan una complicacin especial. Supongamos que el investigador
selecciona un nivel de significacin del 5%. En una prueba de una cola, el investigador rechaza la
hiptesis nula si la oservacin muestral se ubica dentro de uno de los extremos que contiene el 5%
de la distribucin comparativa. En una prueba de dos colas, podra suponerse que el investigador
utilizara el 5% superior cuando el valor es extremo en direccin hacia arriba, y el 5% inferior
cuando el valor es extremo en direccin hacia abajo. Sin embargo, si el investigador hiciera esto,
existira un total del 10% de la distribucin comparativa dentro del cual la hiptesis nula podra
ser rechazada. El nivel de significacin en realidad sera del 10%, porcentaje que la mayora de
los investigadores considerara muy peligroso. (Es decir, con un 10% de nivel de significacin,
uno podra rechazar la hiptesis nula con mucha facilidad aun cuando sta fuera verdadera).
Existe una solucin para este problema. Al realizar una prueba de dos colas, se divide el por
centaje de significacin entre las dos colas. Con un nivel de significacin del 5%, se rechazara la
hiptesis nula slo si la muestra fuera tan extrema que se ubicara dentro del 2 1/2 % superior o
dentro del 2 1/2 % inferior. De este modo, la posibilidad total de que la hiptesis nula sea verda
dera, determinada con anterioridad a la realizacin del estudio, se mantiene en un total del 5%.
Es importante sealar que al utilizar una prueba de dos colas; las puntuaciones Z de corte pa
ra un nivel del 5% son +1,96 y -1,96. En el caso de una prueba de una cola, el corte no era tan ex
tremo, +1,64 y -1,64, pero slo se tem'a en cuenta un lado de la distribucin. La figura 6-6a
representa esas situaciones. Utilizando un nivel de significacin del 1%, una prueba de dos colas.
(0,5% en cada cola) presenta cortes de +2,58 y -2,58, mientras que los cortes en una prueba de
una cola seran de +2,33 -2,33 (vase figura 6~6b).
Cundo u tilizar pruebas de una o dos colas?
Resulta ms fcil rechazar la hiptesis nula con una prueba de una cola que con una prueba de dos
colas, ya que el valor de la muestra no necesita ser tan extremo para que el resultado experimental
sea significativo. Sin embargo, esto tiene su costo, ya que con las pruebas de una cola, si el resul
tado es extremo en la direccin opuesta a la esperada, no puede considerarse significativo y no
importa cun extremo haya sido ese resultado.
En principio, se planifica una prueba de una cola cuando se trabaja con una hiptesis clara
mente direccional, y de dos colas cuando se trabaja con una hiptesis claramente no direccional.
En la prctica, la decisin no resulta tan simple. Incluso cuando una teora predice claramente un
resultado determinado, a veces descubrimos que el resultado es justamente el opuesto de lo que
esperbamos, y en ocasiones ese resultado opuesto puede ser realmente ms interesante. (Qu
hubiera sucedido si, como ocurre en todos los cuentos de hadas sobre genios y peces que conce
den deseos, recibir 1 milln de dlares y cumplir casi todos sus deseos hubiera hecho de ese indi
viduo una persona infeliz? El resultado hubiera sido realmente muy interesante). Utilizando las
pruebas de una cola corremos el riesgo de tener que ignorar resultados posiblemente importantes.
Debido a estas consideraciones, la utilizacin de las pruebas de una cola es discutida, aun
cuando la hiptesis sea claramente direccional. Para mayor seguridad, muchos investigadores uti
lizan pruebas de dos colas tanto para hiptesis direccionales como no direccionales. Si el resulta
do de la prueba de dos colas es significativo, entonces el investigador analiza el patrn de los
datos hallados-para determinar la direccin del resultado, considerando ai estudio significativo en
esa direccin.2 Cabe mencionar que, en la prctica, este es un procedimiento conservador, por el
hecho de que siendo los puntos de corte ms extremos para una prueba de dos colas, es menos ve
rosmil que una prueba de dos colas d un resultado significativo. Por lo tanto, si se obtiene un re
sultado significativo con una prueba de dos colas, uno puede estar ms seguro de sus
conclusiones. De hecho, en la mayora de las publicaciones cientfcas psicolgicas, a menos que
el investigador indique especficamente que utiliz una prueba de una cola, en lneas generales se
supone que utiliz una prueba de dos colas.
No obstante, cabe recordar que, por lo general, la conclusin final no es afectada realmente
por el hecho de que el investigador utilice una prueba de una o dos colas. Segn nuestra experien
cia, usualmente los resultados de las investigaciones o son tan extremos que seran considerados
significativos a travs de cualquier estndar razonable, o estn tan lejos de serlo que no seran
considerados significativos a travs de ningn procedimiento.
Qu sucede cuando un resultado arroja conclusiones menos precisas? La decisin del inves
tigador en cuanto a las pruebas de una o dos colas adquiere mayor importancia. En ese caso, el in
vestigador intentar utilizar el mtodo que arroje la conclusin ms exacta y menos controvertida,
ya que la idea es dejar que hasta donde sea posible, la naturaleza, y no la decisin del investiga
dor, determine la conclusin. Ms an, cuando un resultado no es completamente claro en uno u
otro sentido, la mayora de los investigadores se sentiran incmodos al sacar conclusiones defini
tivas sin realizar otros estudios.
2 Leventhal y Huynh (1996) sostienen que este procedimiento en realidad es incorrecto. S uno est probando una
hiptesis no direccional, slo debera sacar conclusiones no direccionales. Sugieren que un mejor procedimiento sera
utilizar una prueba direccional de dos colas", que en realidad son dos pruebas simultneas de una cola (una en cada
direccin), As, si un investigador quisiera establecer un nivel de significacin total de 0,05, utilizara una prueba direc
cional de dos colas, en la que cada una de las dos subdivisiones de una cola utilizara el nivel 0,025. En cuanto a decidir
si un resultado es significativo o no, el mtodo de Leventhal y Huynh produce un resultado idntico al de la prueba de
uso ms-comn, no direccional de dos colas. El razonamiento de Leventhal y Huynh sobre las pruebas de dos colas
parece ms lgico (adems de tener otras ventajas tcnicas). Sin embargo, debido a que los investigadores an no han
adoptado ese mtodo (y dado que el resultado es el mismo), en este libro utilizamos el mtodo m is tradicional.
Ejem pio de prueba de hiptesis utilizando una prueba de dos colas
Aqu presentamos otro ejemplo ficticio, pero esta vez utilizando una prueba de dos colas. Un gru
po de psiclogos clnicos de un centro residencial de tratamiento psiquitrico creen haber desa
rrollado un nuevo tipo de terapia que aliviar, en mayor grado que la terapia que se est utilizando
en ese momento, la depresin de los pacientes. Sin embargo, como sucede con cualquier trata
miento, no se puede descartar la posibilidad de que provoque peores resultados en algn paciente.
Por lo tanto, los investigadores probarn una hiptesis no direccional.
Los psiclogos procedern de la siguiente manera: seleccionarn al azar un paciente que re
cin ingrese para suministrarle la nueva terapia en lugar de la usual. (Por supuesto que en un estu-
Fgura 6 - 6 . Comparacin de puntos de corte segn el nivel d e Significacin p a r a pruebas de una y dos colas:
(a) nivel de significacin 0,05; (b) nivel de significacin 0,01, (Las pruebas de una cola en estos ejem plos
suponen que se predeca un valor alto).
dio real se seleccionara ms de un paciente, pero supongamos que una sola persona ha sido capa
citada para realizar la nueva terapia y que tiene tiempo para tratar slo a un paciente). La depre
sin del paciente se medir con una escala de depresin estndar que se aplica automticamente a
todos los pacientes despus de 4 semanas. Esa escala ha sido aplicada a los pacientes durante un
largo tiempo en este centro de tratamiento. Por lo tanto, es posible determinar por adelantado en
aquellos pacientes que recibieron la terapia usual la distribucin de los valores del nivel de de
presin a las 4 semanas. En nuestro ejemplo ficticio, esa distribucin sigue una curva normal con
una meda de 69,5 y un desva estndar de 14,1. (Las cifras mencionadas se aproximan a los valo
res de depresin obtenidos en una encuesta nacional de 75,000 pacientes psiquitricos a los que
se Ies suministr el m m p i , una prueba estndar ampliamente utilizada; Dahlstrom, Larbar, &
Dahlstrom, 1986). La figura 6-7 muestra esta distribucin.
El procedimiento de prueba de hiptesis se realiza, entonces, de la siguiente manera:
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de la
poblaciones. Las dos poblaciones de inters son:
Poblacin X: pacientes con diagnstico de depresin que recibieron la nueva terapia.
Poblacin 2: pacientes con diagnstico de depresin que recibieron la terapia estndar.
La hiptesis de investigacin supone que, al medir la depresin 4 semanas despus dei ingre
so, los pacientes que reciben la nueva terapia (poblacin 1) tendrn un valor diferente al de los pa
cientes que reciben la terapia actual (poblacin 2). En smbolos, ia hiptesis de investigacin es
M x ; M2. L o contraro a la hiptesis de investigacin, la hiptesis nula, supone que los pacientes
que reciben la nueva terapia tendrn el mismo nivel de depresin que los pacientes que reciben la
terapia usual. (Es decir, el nivel de depresin medido despus de 4 semanas ser el mismo para la
poblacin 1 y 2). En smbolos, la hiptesis nula es: jl^ = |i.
F ig u r a 6 -7 . D is tr ib u c i n d e io s v a lo r e s d e la e s c a la d e d e p r e s i n m m p i a 4 s e m a n a s d e l in g r e s o , c o r r e s p o n
d ie n t e s a p a c ie n t e s p s iq u i tr ic o s a lo s q u e s e l e s d ia g n o s t ic d e p r e s i n y q u e r e c ib e n la ter a p ia e s t n d a r (d a
to s f ic t i c io s ) .
Nivel de depresin: 4! ,3-' 55,4 69,5 83,6 97,7 <
Pimiiadn Z: -2 *~l .:o + 1-' -VI ,
: ..
::: Depresin de! paciente
que conforma la muestra = 41
. Z jb - 2,02
Figura 6-8. Distribucin de los valores de la escala de depresin m m h con el 2 1 /2 % superior e inferior
sombreado, el cual indica la ubicacin del paciente que conforma la muestra y que recibi la nueva terapia,
(datos ficticios).
Dado que se trata, hasta ahora, de la ms enrgica e importante controversia surgida en aos con res
pecto a la estadstica aplicada a la psicologa, trataremos los distintos temas relacionados con ella al
menos en tres diferentes oportunidades. En este captulo, nos concentraremos en algunos desafos
bsicos para la prueba de hiptesis. En los captulos 7 y 8 tocaremos otros temas relacionados con
aspectos de la prueba de hiptesis que ensearemos en esos captulos.
Antes de exponer esta controversia, queremos asegurar al alumno que no est aprendiendo la
prueba de hiptesis intilmente. No importa lo que suceda en el futuro, ya que es absolutamente
necesario comprender la prueba de hiptesis para poder encontrar el sentido de todas las publica
ciones cientficas publicadas en el pasado. Ms an, a pesar de la vehemente controversia que ha
surgido en los ltimos aos, es sumamente extrao ver nuevas publicaciones que no utilicen la
prueba de significacin, por lo que resulta dudoso que ocurra algn cambio importante en un futu
ro cercano. Finalmente, aun si se abandonara por completo la prueba de hiptesis, las alternativas
(que involcucran procedimientos que ensearemos en los captulos 7 y 8) requieren la compren
sin de prcticamente toda la lgica y de todos los procedimientos que tratamos aqu.
Cul es entonces la gran controversia? Algunos puntos del debate estn relacionados con su
tiles temas de lgica. Por ejemplo, una postura plantea si tiene sentido preocuparse por rechazar
la hiptesis nula cuando es extremadamente improbable que resulte verdadera una hiptesis que
supone que no se produce ningn tipo de efecto. Tratamos este tema brevemente en el cuadro 6-1.
Otro de los temas est relacionado con los fundamentos de la prueba de hiptesis en relacin
con las poblaciones y las muestras, debido a que en la mayora de los experimentos las muestras
que utilizamos de la poblacin definible no son seleccionadas de manera aleatoria. En el captulo
5 tratamos algunos puntos relacionados con este tema. Finalmente, algunos han cuestionado lo
adecuado de llegar a la conclusin de que si la informacin es inconsistente con la hiptesis nula,
esto debe ser considerado como evidencia de la hiptesis de investigacin. Esta controversia es
bastante tcnica, pero nuestra propia opinin es que lo que estamos haciendo es razonable, con
forme a recientes consideraciones sobre estos temas, (vase, p. ej. Cortina & Dunlop, 1997).
De todos modos, la queja ms considerada contraas pruebas de significacin, y que ha obte
nido el acuerdo prcticamente universal, es que las pruebas estn mal utilizadas. De hecho, los
opositores de las pruebas de significacin sostienen que aun si no existieran otros inconvenientes
con respecto a las pruebas, stas deberan ser prohibidas, simplemente por ser utilizadas con tan
ta frecuencia de un modo tan inadecuado. Son dos los casos de pruebas que se utilizan inadecua
damente, Una podemos analizarla ahora, la otra deber esperar hasta que hayamos tratado un
tema que ensearemos en el captulo 8.
Uno de los principales usos inapropiados de las pruebas es la tendencia de los investigadores
a decidir que, si un resultado no es significativo, queda demostrado que la hiptesis nula es verda
dera, Repetidamente hemos subrayado que cuando no se rechaza la hiptesis nula, los resultados
no son concluyentes. El error de llegar a la conclusin de que la hiptesis nula es verdadera, debi
do a la imposibilidad de rechazarla, es extremadamente serio, ya que pueden considerarse falsos
importantes mtodos y teoras slo porque determinado estudio no logr resultados lo suficiente
mente fuertes. (Como veremos en el captulo 8, es bastante fcil que una hiptesis de investiga
cin verdadera no resulte signicativa slo porque el estudio se realiz con pocas personas o
porque las medidas no eran muy precisas. De hecho, Hunter (1997) sostiene que en aproximada
mente el 60% de los estudios psicolgicos es probable que obtengamos resultados no significati
vos aun cuando la hiptesis de investigacin sea realmente verdadera).
Cul es entonces la solucin? El consenso general parece determinar que deberamos man
tener las pruebas de significacin, pero preparando mejor a nuestros alumnos para que no las uti
licen de manera inadecuada (a esto se debe que se haya hecho tanto hincapi en esos temas a lo
largo del libro), es decir que deberamos cuidamos de no perder una herramienta valiosa slo por
que no se a utilice en manera adecuada. Con el fin de tratar esta controversia, la a p a estableci un
comit formado por eminentes psiclogos renombrados por su experiencia en estadstica. En el
informe provisorio del Cuerpo de trabajo sobre inferencia estadstica [Task Force on Statistical
Inference] de la a p a (1996), llegaron a la siguiente conclusin:
Respaldamos una poltica de inclusin que admita en el arsenal del cientfico de investigacin
cualquier procedimiento que apropiadamente arroje algo de luz sobre el fenmeno de inters. En
este sentido, el Cuerpo de Trabajo no respalda ninguna accin que pueda ser interpretada como
prohibicin del uso de la prueba de significacin de la hiptesis nula o de los valores p en investi
gaciones y publicaciones psicolgicas, (p. 2)
RESUMEN
La idea bsica de una prueba de hiptesis es analizar la probabilidad de que el resultado de un es
tudio pudiera haber sucedido aun si a situacin real implicase que el procedimiento experimental
no produjo ninguna diferencia. Si la probabilidad es baja, se rechaza el escenario de la no diferen
cia, y se sostiene la teora a partir de a cual surgi el procedimiento experimental La expectativa
de una diferencia es la hiptesis de investigacin, y la situacin imaginaria en la que no existe
ninguna diferencia se denomina hiptesis nula. Cuando un resultado fuera muy inverosmil, si la
hiptesis nula fuera verdadera; entonces se rechaza la hiptesis nula y se sostiene la hiptesis de
Tabla 6-1.
Valores medios de variables observadas en clase, relacionadas con la motivacin segn la situacin
socioeconmica.
C o n d ic i n P riv ile g ia d o s
so cio e c o n m ica b a ja
investigacin. Si los resultados obtenidos no son muy extremos, se dice que el estudio no fue con
cluyente.
Los psiclogos usuaimente consideran un resultado como muy extremo si presenta menos de
un 5% de posibilidades, aunque algunas veces se utiliza un corte ms riguroso, del 1%. Estos por
centajes pueden aplicarse a la probabilidad de que un resultado sea extremo en una direccin pre
dicha (prueba direccional o de una cola), o a la probabilidad de que sea extremo en cualquiera de
las dos direcciones posibles (prueba no direccional o de dos colas). Para aplicar una poltica ms
conservadora, los psiclogos utilizan con frecuencia las pruebas de dos colas aun cuando ya ten
gan una prediccin especfica.
El proceso de prueba de hiptesis involucra cinco pasos:
1. Replantear el problema en funcin de la hiptesis de investigacin e hiptesis nula de las
poblaciones.
2. Determinar las caractersticas de la distribucin comparativa.
3. Determinar el punto muestra! de corte en la distribucin comparativa, a partir del cual de
bera rechazarse la hiptesis nula.
4. Determinar el valor muestral en la distribucin comparativa.
5. Comparar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nula.
Una gran controversia ha surgido recientemente con respecto a las pruebas de significacin.
Los crticos han planteado cuestiones sobre la lgica bsica de estas pruebas. Sin embargo, la
principal crtica plantea que, con mucha frecuencia, las pruebas son mal utilizadas. Una manera
que tienen ios investigadores para utilizar inadecuadamente las pruebas es interpretando que el no
rechazo de la hiptesis nula implica sostenerla.
En general, las publicaciones cientficas informan los resultados de la prueba de hiptesis in
dicando si fueron o no significativas y mostrando el nivel de corte de la probabilidad (general
mente del 5% 1%) segn el cual fue tomada la decisin.
Trminos Clave
Distribucin comparativa. - Hiptesis direccional. - Prueba de una cola.
Niveles convencionales de - Prueba de hiptesis. - Hiptesis de investigacin.
significacin (p<O,O5,.p<O,01). - Hiptesis no direccional. - Estadsticamente significativo.
Punto muestral de corte . - hiptesis nula. - Prueba de dos colas.
Ejercicios
Los ejercicios implican la realizacin de clcu 2. Lea atentamente los tres puntos que
los (con la ayuda de una calculadora). La ma aparecen a continuacin y, a) indique cules
yora de los problemas estadsticos reales se son las dos poblaciones que se comparan, b)
resuelven por computadora, pero aunque exis establezca la hiptesis de investigacin, c) es
ta la posibilidad de utilizarla, es conveniente tablezca la hiptesis nula y d) determine si se
realizar estos ejercicios manualmente para in debera utilizar una prueba de una o dos colas y
corporar el mtodo de trabajo. por qu.
Para adquirir prctica en la utilizacin de i) Los nios canadienses hijos de bibliot
una computadora, para resolver problemas es carios tienen una mayor habilidad para la lec
tadsticos, se puede utilizar la seccin de com tura que los nios canadienses en general?
putacin de cada captulo, publicada en la n) El nivel de ingreso de los residentes de
Gua de estudio y libro de tareas de computa determinada ciudad es diferente del nivel
cin para el alumno [Student's Study Guide de ingresos de los habitantes de la regin?
and Computer WorkbookJ que acompaa este m) Las personas que han sufrido la expe
libro. riencia de un terremoto tienen ms o menos
Todos los datos de esta seccin son ficti
confianza en s mismas que la poblacin en ge
cios (a menos que se especifique lo contrario).
neral?
Las respuestas a los ejercicios de la serie I
3. Basndose en ia informacin obtenida
se encuentran al final del libro.
de cada uno de los siguientes estudios, deter
mine si se rechaza o no ia hiptesis nula. En
SERIE I cada caso, determine: a) la puntuacin Z de cor
1, te en la distribucin comparativa, a partir de
Defina ios siguientes trminos utilizan
do sus propias palabras: a) hiptesis de investi la que debera rechazarse la hiptesis nula; b) la
gacin, b) hiptesis nula, c) procedimiento de puntuacin Z muestral en la distribucin compa
prueba de hiptesis, d) distribucin comparati rativa, y c) su conclusin. (Suponga que to
va, e) nivel de significacin 0,05, y f) prueba das las poblaciones estn normalmente dis
de una cola. tribuidas).
mayor. El psiclogo propone la teora de que
Registro Colas una persona se recuperar ms rpido de la
Estudio Poblacin muestra! p de la prueba operacin si los amigos y la familia estn en
M' CF
la habitacin con el paciente durante las prime
A 10 2 14 0,05 1 (prediccin alta) ras 48 horas siguientes a la operacin. Se sabe
B 10 2 14 0,05 2 (en este ejemplo ficticio) que el tiempo de re
C 10 2 14 0,01 1 ( prediccin alta) cuperacin est distribuido normalmente con
D 10 2 14 0,01 2
4
una media de 12 das y un desvo estndar de 5
E 10 14 0,05 1 ( prediccin alta)
F 10 1 14 0,01 2 das. El procedimiento se prueba con un pa
G 10 2 16 0,01 2 ciente seleccionado al azar, que se recupera en
H 12 2 16 0,01 2 18 das. Utilizando el nivel de significacin
I 12 2 8 0,05 1 { prediccin baja) 0,01, qu conclusin debera sacar el investi
gador? Resuelva este problema utilizando ex
plcitamente los cinco pasos de la prueba de
4, Una psicloga interesada en ios sentidos hiptesis. Luego explique su respuesta a al
del gusto y del olfato ha realizado una serie ex guien que nunca ha asistido a un curso de esta
tensiva de estudios en los que hace probar a dstica (pero que est familiarizado con los
alumnos universitarios 20 tipos de alimentos conceptos de media, desvo estndar y puntua
diferentes (damasco, chocolate, cereza, caf, ciones Z).
ajo, y otros). Cada alimento se suministra en 6. Robins y John (1997) realizaron un es
forma de gota que se vierte spbre la lengua. De tudio sobre el narcisismo (egolatra), en el que
toda la poblacin de alumnos de la universi se comparaban individuos que haban tenido
dad, la cantidad media que los alumnos pueden valores altos con individuos que haban obteni
identificar correctamente entre estos 20 ali do valores bajos (con tems tales como: Si yo
mentos es 14, con un desvo estndar de 4. (Su gobernara el mundo, ste sera un lugar me
pongamos que todos los alumnos de esa jor). Tambin realizaban algunas otras pre
facultad son examinados como parte de una in guntas, incluyendo un tem en el que se
vestigacin mdica al comienzo de cada ao). preguntaba a los participantes cuntas veces se
La psicloga tiene razones para creer que la miraban al espejo en un da tpico. Al informar
precisin de las personas, en esta prueba, est sobre los resultados, los investigadores obser
ms relacionada con el olfato que con el gusto. varon:
Por lo tanto, establece procedimientos especia ... tal c o m o s e hab a predicho, lo s in d ivi
d u o s c o n un a lto grado d e n arcisism o in
les que impiden utilizar el sentido del olfato
form aron q u e s e m iraban a l e sp e jo c o n
durante la prueba. Luego, la psicloga prueba m s fr e cu en cia q u e lo s in d iv id u o s c o n un
el procedimiento en un alumno seleccionado al bajo n iv e l d e n a rcisism o (A is = 5 ,7 vs
azar. El alumno identifica correctamente slo 5 4 ,8 ).., p<Q ,05" (p. 39).
alimentos. Utilizando el nivel de significacin Explique este resultado a una persona que nunca
0,05, qu conclusin debera sacar la investi ha asistido a un curso de estadstica. (Concntre
gadora? Resuelva este problema utilizando ex se en el significado del resultado en cuanto a
plcitamente los cinco pasos de la prueba de la lgica general de la prueba de hiptesis y a la
hiptesis. Luego explique su respuesta a al significacin estadstica).
guien que nunca ha asistido a un curso de esta
dstica (pero que est familiarizado con los
conceptos de media, desvo estndar y puntua SERIE II
ciones Z). L Enumere los pasos del proceso de prue
5. Un psiclogo est trabajando con perso ba de hiptesis y explique el procedimiento y
nas que han tenido un tipo particular de ciruga los.fundamentos de cada uno.
2. Para cada uno de los puntos que se deta 4. Un investigador ha descubierto que cier
llan a continuacin, a) indique cules son las tos sonidos hacen a las ratas mucho ms agre
dos poblaciones que se comparan, b) determine sivas, y predice que los sonidos tambin dis
la hiptesis de investigacin, c) determine la hi minuirn sus desempeos en cuanto a tareas de
ptesis nula y d) explique si se debera utilizar aprendizaje. Supongamos que se sabe que una
una prueba de una o dos colas y por qu. rata promedio, ordinaria, puede aprender a co
0 En un experimento, se dan instruccionesrrer correctamente en un determinado laberin
a los participantes para que resuelvan un pro to en 18 pruebas, con un desvo estndar de 6.
blema concentrndose en los detalles. Es di El investigador, entonces, prueba una rata or
ferente la velocidad con 3a que resuelven el dinaria en el laberinto, pero hacindole escu
problema las personas que han recibido tales char el sonido. La rata necesita 38 intentos
instrucciones, en comparacin con las perso para aprender el laberinto. Utilizando el nivel
nas a las que no se les ha dado ninguna instruc 0,05, qu conclusin debera sacar el investi
gador? Resuelva este problema utilizando ex
cin especial?
plcitamente ios cinco pasos de la prueba de
li) A partir de informes antropolgicos en
hiptesis. Luego explique su respuesta a al
los que se registra la condicin social de la
guien que nunca ha asistido a un curso de es
mujer en una escala de 10 puntos, se conocen
tadstica (pero que est familiarizado con los
la media y el desvo estndar en muchas cultu conceptos de media, desvo estndar y puntua
ras. Se descubre una nueva cultura en la que cin Z).
existe una organizacin familiar inusual. Tam 5. Un psiclogo especializado en temas de
bin se clasifica la condicin social de la mu familia ha desarrollado un elaborado progra
jer en esta cultura. Las culturas con una or- ma de capacitacin para contribuir a la adapta
organizacin familiar inusual brindan a la mujer cin de hombres sin hijos casados con mujeres
una condicin social ms elevada que ia$ cul con hijos adolescentes. Supongamos que se
turas en general? sabe, a partir de investigaciones previas, que
m) Las personas que viven en grandes estos hombres, un mes despus de mudarse,
ciudades sufren ms enfermedades relaciona con la nueva esposa y sus hijos, sufren un ni
das con el estrs que las personas en general? vel de estrs de 85 con un desvo estndar de
3. A partir de la informacin correspon 15. Como experimento piloto, se prueba el
diente a cada uno de ios siguientes estudios, programa de capacitacin en un hombre selec
determine si se rechaza o no la hiptesis nula. cionado al azar de entre todos aquellos en de
En cada caso, establezca a) la puntuacin Z de terminada ciudad que, durante el mes anterior,
corte en la distribucin comparativa a partir de se haban casado con una mujer con un hijo
la cual debera rechazarse la hiptesis nula; b) adolescente. Despus del programa de capaci
la puntuacin Z muestral en la distribucin tacin, el nivel de estrs de ese hombre es 60.
comparativa, y c) su conclusin. (Suponga que Utilizando el nivel 0,05, qu conclusin de
todas las poblaciones estn normalmente dis bera sacar el investigador? Resuelva este pro
tribuidas). blema utilizando explcitamente los cinco
pasos de la prueba de hiptesis. Luego expli
O bservacin C olas que su respuesta a alguien que nunca ha asisti
E studio Poblacin m uestra! p de la p r u e b a do a un curso de estadstica (pero que est
H- cr familiarizado con los conceptos de media,
A 100,0 10,0 8 0 0,05 1 (prediccin baja) desvo estndar y puntuacin Z).
B 74,3 11,8 80 0,01 2 . En una publicacin acerca de las campa
C 1 6 ,9 L2 80 0,0 5 1 (prediccin baja) as en contra del tabaco, realizado en Massa-
D 88,1 12,7 80 0,05 2
chussetts en 1993 y 1995, Siegel y Biener
(1997) exponen los resultados de una encuesta explique qu significa el resultado a una perso
sobre e l consumo de tabaco y las distintas acti na que nunca ha asistido a un curso de estadsti
tudes. La tabla 6-2 muestra ios resultados de ca. (Concntrese en el significado del resultado
esta encuesta. Concentrndose slo en la pri en cuanto a la lgica general de la prueba de hi
mera lnea (porcentaje que fuma > 25 por da), ptesis y a la significacin estadstica).
Tabla 6-2.
Algunos indicadores dei cambio en ei consumo de tabaco, exposicin ai e t s 3 , y actitudes del pblico
hacia las polticas de control de tabaco, Massachussetts, 1993-1995.
1993 1995
C o m p o r ta m ie n to d e fu m a d o res a d u lto s
Porcentaje que fuma > 25 cigarrillos diarios 24 10*
Porcentaje que fum a < 1 5 cigarrillos diarios 31 49*
Porcentaje que fuma antes de tra n scu rrid o s 3 0 m inutos de despertarse 54 41
E x p o sici n a l h u m o d e ta b a co en el a m b ien te
Porcentaje de trabajadores que inform an sobre 53 65*
un lugar de trabajo en e l que no se fuma
M edia de horas de exposicin al ets en el trabajo 4,2 2,3'
durante la sem ana anterior
Porcentaje de hogares en los que est prohibido fumar 41 51*
A c titu d e s h a c ia las p o ltic a s de co n tro l del ta b a co
Porcentaje que apoya un m ayor aum ento de im puestos al tabaco 78 81
asignando lo s fondos al control del tabaco
Porcentaje que cree que la exposicin al ets es perjudicial 90 84
Porcentaje que apoya la prohibicin 54 64*
de las mquinas expendedoras
Porcentaje que apoya la prohibicin del patrocinio de deportes 59 53*
y eventos culturales por parte de las com paas d e tabaco
E
como ejemplos estudios en los que la muestra estaba formada por un slo individuo.
Sin embargo, cmo sealamos anteriormente, en la prctica, la investigacin psico
lgica usualmente utiliza muestras integradas por muchos individuos. En este cap
tulo nos basamos en lo aprendido hasta ahora y analizamos la prueba de hiptesis
con muestras de ms de un individuo, lo cual requiere, principalmente, analizar con cierto detalle
lo que denominamos distribucin de medias.
LA DISTRIBUCIN DE MEDIAS
La prueba de hiptesis en condiciones normales de investigacin, cuando se analiza una muestra
formada por muchos individuos, es exactamente igual a lo que hemos aprendido en el captulo 6,
con una importante excepcin. Cuando hay ms de una persona en la muestra surge un problema
especfico en e paso 2, al determinar las caractersticas de la distribucin comparativa. l proble
ma es que el valor muestral que nos interesa es la media del grupo de valores. Las distribuciones
comparativas que hemos estado analizando hasta ahora han sido distribuciones poblacionales de
valores individuales (por ejemplo, las edades en que cada beb en particular comienza a caminar
o la poblacin de valores individuales a partir de un cuestionario para medir el nivel de felicidad).
Comparar la media de una muestra de, digamos, 50 individuos con una distribucin de valores in
dividuales constituye una comparacin desigual, como comparar manzanas y naranjas. En cam
bio, cuando lo que nos interesa es la media de una muestra de 50, necesitamos una distribucin
comparativa formada por medias de muestras de 50 valores. A esta distribucin comparativa la
denominaremos distribucin de medias.
Para expresarlo ms formalmente, una distribucin de medias es una distribucin formada
por las medias de cada una de las numerosas muestras del mismo tamao seleccionadas al azar
entre la misma poblacin de individuos. (Los estadsticos tambin llaman a esta distribucin de
medias una distribucin en el muestreo de la media; sin embargo, en este libro utilizamos el
trmino distribucin de medias para que quede claro que estamos hablando de poblaciones y no
de muestras o distribuciones de frecuencias de una muestra).
La distribucin de medias es la distribucin comparativa adecuada cuando la muestra est
formada por ms de una persona. Por eso, en la mayora de las investigaciones resulta necesario
determinar las caractersticas de esa distribucin para poder realizar el paso 2 del procedimien
to de prueba de hiptesis.
' -M= 4 ,6 Z .
SD2. - 0,39.
5 0 = 0,62.
' Gr do' , \
0
L 2 '3 .4, .5 6 7 8 .9
' Grado'. F ig u r a 7 -2 . D istrib u cin de m ed ia s d e tres
m uestras aleatorias de lo s grados a lo s qu e
perten ecen dos e sc o la r e s, extradas de una
Figura 7 -1 . D istrib u cin d e l grado d e 9 0 .0 0 0 p o b la ci n conform ad a por lo s grados a los qu e
e sc o la r e s (d atos fic ticio s). concurren 9 0 .0 0 0 e sc o la r e s (d atos fic ticio s).
una. La figura 7~3b representa el histograma de la distribucin de medias despus de seleccionar
20 muestras aleatorias de dos registros cada una. Despus de seleccionar 100 muestras aleatorias,
el histograma de la distribucin de medias podra verse como la figura 7-3c; despus de 1.000, co
mo la figura 7-3d. (En realidad, en lugar de utilizar 90.000 pelotitas de ping pong y un recipiente
gigante, creamos los histogramas de la figura 7-3 por medio de una computadora que realiz las
selecciones aleatorias).
Figura 7-3. Distribuciones de medias de muestras aleatorias de dos pelotitas cada una, extradas de una
poblacin de 90.000 pelotitas, de las cuales, cada 10.000, llevaban uno de los nmeros del 1 al 9. Las casti
dades de medias mustrales que incluye cada distribucin son (a) 10 medias mustrales, (b) 20 medias
mustrales, (c) 100 medias mustrales y (d) 1.000 medias mustrales. (El muestreo real fue simulado por
computadora).
En la prctica, los investigadores casi nunca tienen la oportunidad de seleccionar muchas
muestras diferentes de una poblacin. Lleva mucho trabajo poder lograr una sola muestra y estu
diar a la gente que la conforma. Sin embargo, afortunadamente podemos determinar las caracte
rsticas de una distribucin de muestras en forma directa utilizando algunas reglas simples, sin
necesidad de seleccionar siquiera una sola muestra. La nica informacin que necesitamos es: a)
caractersticas de la distribucin de ia poblacin de individuos y b) tamao de cada muestra. (Por
ahora no nos preocuparemos por cmo podramos conocer las caractersticas de la poblacin de
individuos). El trabajoso mtodo de construir una distribucin de medias en la forma que acaba
mos de hacerlo y el mtodo conciso que aprenderemos muy pronto, tienen el mismo resultado.
Hemos analizado el proceso de ese modo meticuloso slo porque sto ayuda a comprender el
concepto de una distribucin de medias.
(7-1)
: En la frmala anterior, cr2, es la varianza de la distribucin de medias, cr2 es ia varianza de la
poblacin de individuos, y N es ei tamao de cada muestra.
En nuestro ejemplo, la varianza de la poblacin de grados individuales era 6,61, y haba
dos nios de escuela por muestra. La varianza de la distribucin de medias se calcula del si
guiente modo:
6,67
= 3,34
2
Para utilizar un ejemplo diferente, supongamos que una poblacin de individuos tuviera una va
rianza de 400, y quisiramos saber la varianza de una distribucin de medias de 25 valores obser
vados:
400
or = = 16
N 25
El desvo estndar de una distribucin de medias es la raz cuadrada de la varianza de la distri
bucin de medias. Se representa bajo la frmula:
(T (7-2)
7f
En la frmula anterior, o Mes el desvo estndar de la distribucin de medias.
Algunas veces, esta frmula se manipula algebraicamente para destacar la relacin entre el
desvo estndar de la poblacin de individuos y el desvo estndar de la distribucin de medias:
a M = -Jn (7-3)
R e s u m e n d e la s r e g a s p a r a la d e t e r m in a c i n
d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d i a s
Hemos ignorado el hecho de que una curva normal es una distribucin terica ininterrumpida. En la mayora de los
ejemplos de la vida real, los registros se ubican en intervalos especficos, Por lo tanto, una diferencia entre una curva
normal y la distribucin de medias de pelotitas de ping pong de nuestro ejemplo es que la curva normal es ininterrum
pida, Sin embargo, en la investigacin psicolgica, usualmente suponemos que, aun cuando nuestras mediciones se
realicen a travs de intervalos especficos, el objeto implcito que estamos midiendo es continuo,
3Ya hemos analizado en el captulo 5 el principio que establece la tendencia de la distribucin de medias hacia una cur
va normal. Aunque an no habamos estudiado la distribucin de medias, aun as utilizamos ese principio para explicar
por qu ia distribucin de tantos elementos en la naturaleza siguen una curva normal, En ese captulo lo explicamos co
mo consecuencia de las distintas influencias que se equiparan unas a otras para hacer surgir una influencia promedio
con la mayoria de ios registros cerca del centro y, unos pocos, a cada extremo. Ahora hemos explicado el mismo tema
utilizando la terminologa de una distribucin de medias, Pensemos en cualquier distribucin de registros individuales
en la naturaleza como representativa de una situacin en la que cada registro es efectivamente un promedio de una serie
aleatoria de influencias que actan sobre ese registro individual. Analicemos la distribucin del peso del canto rodado.
El peso de cada piedra representa una especie de promedio de todas las diferentes fuerzas que actuaron para que ese
canto rodado tenga un peso determinado.
Figura 7-4. Ilustracin de los principios de la relacin entre la distribucin de medias (curvas en la parte in
ferior) y la distribucin de la poblacin de observaciones individuales (curvas en la parte superior).
E je m p lo d e d e t e r m in a c i n d e la s c a r a c t e r s t ic a s d e u n a d is t r ib u c i n d e m e d ia s
La Lista de Control de Adjetivos [Adjective Check List] (Gough & Heilbrun, 1983) es una prueba
de personalidad ampliamente utilizada. La prueba est formada por una lista de adjetivos tales co
mo capaz, activo, atltico, y as sucesivamente, y aquellos que realizan la prueba controlan la lis
ta para determinar si cada adjetivo puede aplicarse a s mismo. Una de las sub-pruebas de la Lista
de Control de Adjetivos se focaliza en la agresin (adjetivos tales como agresivo, peleador, dog
mtico). La prueba ha sido aplicada a gran cantidad de personas en el pasado, y se sabe que los va
lores en la escala de agresin presentan una distribucin asimtrica con una media de 51 y una
varianza de 93 (redondeando). Cules sern las caractersticas de una distribucin de medias
maestrales de esta poblacin de individuos si cada muestra contiene 10 individuos?
1. La media de la distribucin- de medias ser 51,1a misma que la media poblacional.
2. La varianza de la distribucin de medias ser 93, la varianza poblacional, dividida por 10
(tamao de cada muestra). El resultado es 9,3. Se representa bajo la frmula:
_ O - 93 - 9 j 3
cr;,2
M"
N 10
El desvo estndar de la distribucin de medias es la raz cuadrada de 9,3, lo que es lo mis
mo, 3,05.
3. La distribucin de medias no ser normal porque la distribucin de la poblacin de indivi
duos no es normal, y la cantidad de individuos por muestra es slo 10. Sin embargo, como toda,
distribucin de medias, tendr tendencia a ser unimodal y ms simtrica que la distribucin de la
poblacin de valores individuales.
Figura 7-5. Tres tipos de distribuciones: (a) distribucin de valores de una poblacin de individuos, (b) dis
tribucin de observaciones de una determinada muestra tomada de esa poblacin y (c) distribucin de me
dias de todas las muestras posibles de un determinado tamao, tomadas de esa distribucin.
Tabla 7-1.
Comparacin de tres tipos de distribuciones.
Distribucin
Distribucin de una muestra Distribucin
poblaciona! determinada de medias
Contenido Valores de Valores de Medias de muestras
todos los individuos los individuos de tomadas al azar de la poblacin.
de la poblacin. unasola muestra.
Forma Podra ser Podra ser Normal, si la poblacin
cualquier forma, cualquier es normal. Aproximadamente
a menudo normal. fonna. normal, si las muestras
contienen >: 30 observaciones
cada una.
Media P- M ~ 1X 1N,
Calculado de las
observaciones tomadas
de la muestra
Varianza tr2 S D ^ K X -M f/N , or^-o-VjV
Calculado de las
observaciones tomadas
de la muestra
Desvo cr s d =Vsd?
estndar
Volviendo ai cuadro 5-3, que trata acerca. ; muestra, El tamao de la propia poblacin: ":"
de sondeos y de la encuesta de Gallup, r^- (de individuos), o la relacin del. tipa. '
cordarems que dejamos sin responder una d la muestra con el de- Ja poblacin, :no! ,,
importante cuestin sobre la letra chica que influye en sta frmula, V
aparece cerca de los resultados de una en Aun as, nuestra intuicin podra conti?;
cuesta,y que dice algo, as como: Informa- - : nuar dicndonos que.la antdad/nces'ari . :
cin proveniente de un sondeo telefnico 4 ' . para representar a todo el irimso pblico: ;
1.000 adultos estadounidenses, realizado e l de.los Estados Unidos dbela sr mayf W :;
4 y 5 de junio. Error de muestreo 3%. ; slol-OOindividuos.Sinmb.argo,silopem" ;
Dijimos que tina .duda comn es pregum samos.bien, cuando la muestra es sol una j
tarse cmo se puede utilizar una cntidatj;- pequea parte de una poblacin muy grande^ . ,
tan pequea, como 1.000 individuos (an- . el tamao absoluto de l muestra es el nico: ;'
que rara vez se utiliza una cantidad; mucho determinante de exactitud. se tamao abso-? i.
menor) para predecir la opinin de todq el . luto determina el impacto d los errores aleaA
pblico de los Estados Unidos.. torios de medicin y seleccin. /
Comencemos con el tema del tamao . ' Algunas veces: s influye el tamao t--...
de la muestra. De acuerdo a lo aprendido ' atyp de una muestra con respect a la po-', r
en este captulo, sabemos que cuando las blacin; sto ocurre si. la poblacin es tari;
muestras son de gran tamao, como lo es pequea que,: eliminr mtrrogaf:: l-:,-;.
una. muestra de 1.000 valores, se reduce', gures,, aumenta- las chances de quedos res
mucho el desvo estndar de la distribu tantes seari :entrevistados.' Pero- cuando la
cin de medias. Es decir,, la distribucin' ' .poblacin est formada por millones, eli-
de. medias mustrales se vuelve muy alta minar a mil dos mil tendr un efecto prc- :;
y estrecha,, dispersa alrededor de la media ticamente nulo en las probabilidades de '
poblacionl. ' Por lo tanto, la media de qu sean otros. Iqs entrevistados. Una en-,
cualquier muestra de ese tamao est muy cuesta realizada a i.000 de entre un^'xniflni.'^i:1
cerca de la media poblacional. Para expre .de votantes, o de entre 10 100 millones d
sarlo de otro modo, la varianza de la dis votantes tendr esencialmente el .misino
tribucin de medias, que refleja cunto error casual. Lo importante es reducir des
: tiende a diferir cualquier media muestral vos o : errores sistemticos, lo cual slo .
de la media poblacional, es la varianza de . puede ^lograrse a travs de una- planifica-/ .
la poblacin dividida por el tamao de la cin muy cuidadosa. . y .d d
no es diferente ai modo usual de convertir una puntuacin original en puntuacin Z. Sin embargo,
debemos ser cuidadosos para no confundimos, ya que el proceso involucra a ms de una media.
Es importante recordar que estamos manejando la media muestral como si fuera una simple ob
servacin individual. En otras palabras, la frmula ordinaria (del captulo 2) para convertir un va
lor original en puntuacin Z es Z - (X - M)SD, En la situacin que estamos tratando ahora, en
realidad estamos utilizando la siguiente frmula:
Z (7-4)
vM
Por ejemplo, supongamos que la media muestral es 18 y que la distribucin de medias tiene una
media de 10 y un desvo estndar de 4, La puntuacin Z correspondiente a esta media muestral es
+2. Utilizando la frmula:
(jkf-jxjtf) _ 1 8 -1 0 _ 8
Z=
<*A 4 4
La Figura 7-6 ilustra el clculo anterior.
que hace que sus significados sean un poco ms claros. El objetivo es establecer si el tiempo de
lectura ser ms rpido en estas condiciones. Por supuesto, tambin es posible que al proporcio
nar un contexto se demore la lectura por el hecho de hacer ms complicada la situacin.
Tambin supondremos que los investigadores han realizado muchos estudios previos con es
tas oraciones ambiguas presentadas sin contexto. A partir de esa investigacin supondremos que
los investigadores confan en que los tiempos de lectura de oraciones ambiguas, sin ningn con
texto de la poblacin en general, estn distribuidos de forma aproximadamente normal, con una
media de 2,75 segundos y una varanza de 0,02 segundos (cr = 0,14 segundos). La figura 7-7a
muestra la distribucin poblacional a la que nos referimos.
En el estudio que acabamos de describir se prueba a 40 individuos utilizando oraciones ambi
guas en contexto. El tiempo medio de lectura es de 2,71 segundos, (En el ejemplo que estamos
analizando conocemos la varanza poblacional antes de realizar el estudio. En este tipo de situa
ciones, la varanza muestral no se utiliza para nada en el proceso de prueba de hiptesis). La figu
ra 7-7c muestra la distribucin muestral.3
3En realidad, este estudio sera mucho mejor si los investigadores tuvieran tambin otro grupo de participantes a ios
que se les asignara al azar la realizacin de una prueba de velocidad de lectura de oraciones ambiguas sin contexto.
Confiar en informacin proveniente de estudios previos es unpoco arriesgado, porque las circunstancias en las que se
realizaron las pruebas durante uno y otro estudio pueden no ser idnticas. Sin embargo, nos hemos tomado algunas li
bertades con este ejemplo para ayudamos a introducirel proceso de prueba de hiptesis de aun paso por vez. En este
ejemplo, y en los otros del captulo, utilizamos situaciones en las que se contrasta unasola muestracon una poblacin
conocida. Apartirdel captulo 9, ampliamos el procedimiento depruebade hiptesis para adaptarlo a situaciones de
investigacin ms realistas, es decir, aquellas que involucranms de ungrupo de participantes yque incluyen poblacio
nes cuyas caractersticas se desconocen.
Qu deberan concluir los investigadores? Sigamos los pasos de la prueba de hiptesis.
1. Replantear el problema en funcin de hiptesis de investigacin e hiptesis nula de las
poblaciones. Las dos poblaciones son:
Poblacin 1: participantes que leen oraciones ambiguas en contexto,
Poblacin 2: participantes que leen oraciones ambiguas sin contexto.
La hiptesis de investigacin establece que existe una diferencia en el tiempo de lectura entre
las dos poblaciones, es decir, que l tiempo de lectura en contexto ser diferente al tiempo de lec
tura sin contexto: p., # La hiptesis nula establece que no existe diferencia entre el tiempo de
lectura de las dos poblaciones: pj = p 2. Cabe mencionar que las hiptesis son no direccionales, Si
bien los investigadores esperan que el tiempo de lectura con contexto sea ms rpido, no pueden
descartar la posibilidad de que el contexto retarde el tiempo de lectura, resultado que adems se
ra bastante interesante.
2. Determinar las caractersticas de la distribucin comparativa. Si la hiptesis nula es
verdadera, la poblacin de individuos de la cual proviene nuestra muestra no es diferente de la po
blacin 2, cuya media y varianza conocemos. Lo que necesitamos calcular ahora son las caracte
rsticas de una distribucin de medias de muestras con 40 valores cada una, tomadas de esa
poblacin de individuos que conocemos.
Por lo tanto, seguimos las reglas para determinar las caractersticas de una distribucin de
medias: a) la media es igual a la media poblacional, en este caso 2,75 segundos y b) la varianza
es igual a la varianza poblacional dividida por la cantidad de valores de cada muestra. Aplicando
la frmula:
O02
0,0005
' 40 '
El desvo estndar es la raz cuadrada del resultado anterior, 0,022. Finalmente, c) la forma de la
distribucin ser cercana a una curva normal porque las muestras tienen ms de 30 valores cada
una. La figura 7~7b ilustra la distribucin de medias.
3. Determ inar el punto muestral de corte en la distribucin comparativa, a p artir del
cual debera rechazarse la hiptesis nula. Supongamos qne los investigadores decidieron utili
zar un nivel de significacin del 5%. Como observamos en el paso 1, han propuesto una hiptesis
no direccional, por lo que necesitamos una prueba de dos colas. Acabamos de determinar que la
distribucin comparativa es normal, por lo tanto, podemos consultar a tabla de reas bajo la cur
va normal para encontrar la puntuacin Z que marca el 21/2% inferior y superior. La tabla nos in
dica que para rechazar la hiptesis nula a un nivel del 5%, necesitamos una puntuacin Z de +1,96
mayor, 0 bien, de -1,96 menor. Las dos regiones del 2 1/2%, en las que la hiptesis nula sera
rechazada, son las que sostienen a las pequeas reas sombreadas (son muy difciles de ver) en las
dos colas de la distribucin de medias representada por la figura 7-7b.
4. D eterm inar el valor m uestral en la distribucin comparativa. La media muestral es
de 2,71 (vase figura 7~7c). A partir del paso 2, sabemos que la distribucin comparativa
(nuestra distribucin de medias) tiene una media de 2,75 y un desvo estndar de 0,022, Apli
cando la frmula:
Figura 7-8. C o n resp e c to al estu d io fic tic io b a sa d o e n e l d e sem p e o en una prueba estndar d e n iv el a c a d
m ic o , (a ) distrib u cin p o b ia cio n a l d e va lo res in d ivid u ales, (b ) distribu cin d e m e d ia s (d istrib u cin c o m p a
rativa) y (c ) distrib u cin d e la m uestra.
2.304/64, es decir, 36. El desvo estndar de la distribucin de medias es la raz cuadrada de 36, o
sea, 6. Finalmente, dado que en la muestra hay ms de 30 individuos, la forma de la distribucin
de inedias ser aproximadamente normal. La figura 7-8b muestra la distribucin de medias que
acabamos de describir.
3. Determinar el punto muestral de corte en ia distribucin comparativa, a partir del
cual debera rechazarse la hiptesis nula. Una vez ms, supongamos que los investigadores
adoptan el nivel de significacin usual del 5%. Los investigadores que realizan este estudio tienen
una prediccin claramente direccional, y realmente no estn interesados en ningn efecto en di
reccin contraria. (Si las instrucciones especiales no mejoran las puntuaciones de la prueba, no
sern utilizadas en el futuro. Cualquier posible resultado que muestre un efecto negativo es irrele
vante). Por lo tanto, los investigadores rechazarn la hiptesis nula si el resultado se encuentra
dentro del 5% superior de la distribucin comparativa. La distribucin comparativa (la distribu
cin de medias) es una distribucin normal, por ende, podemos determinar el 5% superior a tra
vs de la tabla de reas bajo la curva normal. La parte que nos interesa bajo la curva normal
comienza en una puntuacin Z de +1,64, y el rea sombreada de la figura 7-8b muestra ese 5% su
perior.
4. Determinar el valor maestral en la distribucin comparativa. Los 64 alumnos de quinto
grado que realizaron la prueba aplicando las instrucciones especiales tenan una puntuacin me
dia de 22G,'(La figura 7-8c grfica la distribucin de esa muestra). Una media de 220 se encuentra
a 3,33 desvos estndar por encima de la media de la distribucin de medias:
5, Com parar los valores de los pasos 3 y 4 para decidir si se rechaza o no la hiptesis nu
la. Establecimos que la puntuacin Z mnima necesaria para rechazar la hiptesis nula es +1,64.
La puntuacin Z correspondiente a la media muestral es de +3,33. Por lo tanto, los psiclogos ex
pertos en educacin pueden rechazar la hiptesis nula y concluir que se sostiene la hiptesis de
investigacin. Para decirlo con otras palabras, el resultado es estadsticamente significativo al ni
vel p<0,05. El resultado puede verse reflejado en la figura 7-8b, donde se observa cun extrema es
la media muestral en la distribucin de medias (la distribucin que se aplicara si la hiptesis nula
fuera verdadera). La conclusin final es que entre alumnos de quinto grado como los analizados,
las instrucciones especiales sin duda mejoran las puntuaciones en las pruebas.
4 Segn }a lgica matemtica de la estadstica inferencia!, debemos considerar la media poblacional com o algo fijo. Los
intervalos de confianza pueden variar, pero la media poblacional es fija. Por lo tanto, podem os decir que estamos 95%
seguros de que nuestro intervalo de confianza incluye la media poblacional. N o deberamos decir que las chances de
que la media poblacional se encuentre dentro de intervalo de confianza son del 95%.
^respondiente a la poblacin que representa la muestra que estamos analizando (lo que hemos
llamado poblacin 1), y o en la distribucin de medias correspondiente a la poblacin con la
cual la estamos comparando (poblacin 2). Se estima entonces que la media de la distribucin
de medias es la media muestral. En cuanto a la varianza, afortunadamente, por lo general supo
nemos que la varianza de las dos poblaciones es la misma. Consecuentemente, podemos utili
zar la varianza conocida de la poblacin dada (poblacin 2) como base para calcular la varianza
de la distribucin de medias de la poblacin en la que estamos interesados (poblacin 1). (La
varianza de la distribucin de medias se basa slo en la varianza de la poblacin y en el tamao
de la muestra. Por lo tanto, la varianza de la distribucin de medias ser igual para ambas po
blaciones).
2. Utilizar la tabla de reas bajo la curva normal para encontrar las puntuaciones Z que coin
ciden con los porcentajes superiores e inferiores que nos interesan. Para un intervalo del 95% de
confianza, debemos buscar la puntuacin Z que coincide con el 2,5% inferior y el 2,5% superior
. Para un intervalo del 99% de confianza, debemos buscar la puntuacin Z que coincide con el
0,5% inferior y el 0,5% superior.
3. Convertir las puntuaciones Z en puntuaciones originales de la distribucin de medias. Esos
son los lmites de confianza superior e inferior.
F ig u r a 7 - 9 . E j e m p lo s d e in t e r v a lo s d e l
9 5 % d e c o n f ia n z a c o m p a r a d o s c o n d i s
tr ib u c io n e s d e m e d ia s b a s a d a s e n (a ) u n a
m e d ia p o b la c i o n a l c o n o c id a , ig u a l a
2 1 0 ; (b ) u n a m e d ia m u e s tr a ! ig u a l a 2 2 0 ,
y ( c ) u n a m e d ia m u e s tr a l d e 1 9 0 .
CONTROVERSIAS Y LIMITACIONES:
INTERVALOS DE CONFIANZA O PRUEBAS DE SIGNIFICACION?
E l a lu m n o r e c o r d a r q u e e n e l c a p t u lo 6 m e n c io n a m o s q u e , e n la a c tu a lid a d , e x i s t e u n e n r g i c o
d e b a te e n tr e lo s p s ic lo g o s a c e r c a d e la p r u e b a d e s ig n if ic a c i n . E n tr e lo s p r in c ip a le s te m a s
d e d e b a t e s e h a p r o p u e s t o q u e l o s p s i c l o g o s u t i l i c e n i o s i n t e r v a l o s d e c o n f i a n z a e n l u g a r d e la s
p r u e b a s d e s ig n ific a c i n .
Aquellos que estn a favor de reemplazar las pruebas de significacin con los intervalos de
confianza (p. ej. Cohn, 1994; Hunter, 1997; Schmidt, 1996) citan varias ventajas importantes.
Primero, como observamos anteriormente, ios intervalos de confianza contienen toda la informa
cin clave de una prueba de significacin,5 pero adems proporcionan informacin adicional; la
estimacin del intervalo de valores dentro del cual podemos estar bastante seguros de que se en
cuentra la verdadera media poblacional. Una segunda ventaja es que concentran la atencin en la
estimacin y no en la prueba de hiptesis. Algunos investigadores argumentan que el objetivo de
la ciencia es proporcionar estimaciones numricas de efectos, no slo decisiones en cuanto a si un
efecto es diferente de cero. Es decir, con las estimaciones (puntuales y por intervalos), tenemos
una idea clara del grado de importancia del efecto y del nivel de precisin de la estimacin. Con
las pruebas de hiptesis, sabemos si el efecto puede suceder en la direccin predicha, pero no el
grado de importancia del efecto en esa direccin.
Los intervalos de confianza son particularmente valiosos cuando los resultados no son signi
ficativos (Frick, 1995), porque conocer el intervalo de confianza otorga una idea de cun lejos de
la ausencia de efecto es probable encontrar la verdadera media. Si todo el intervalo de confianza
se encuentra cerca de la ausencia de efecto, podemos tener la certeza de que si an existe algn
efecto verdadero, ste probablemente sea pequeo. Por ejemplo, supongamos que se estudia un
grupo de personas despus de que son expuestas a un procedimiento que pretende afectar el IC.
La meda del grupo es 102, y el intervalo de confianza abarca desde 99 hasta 105. Esto dara un
resultado no significativo porque el intervalo incluye el valor 100, que es el IC medio.de la pobla
cin que no recibe el procedimiento especial Al mismo tiempo, dado que el intervalo de confian
za incluye otros nmeros diferentes de 100, en realidad es posible que exista un efecto real, Sin
embargo, el punto clave es que si de hecho existiera un efecto real, es probable que sea muy pe
queo, ya que estamos un 95% seguros de que ese efecto no implicara ms que una disminucin
de un punto o un aumento de 5 puntos. Por otro lado, supongamos que el intervalo de confianza
para este mismo estudio era de 89 a 115. Este resultado tambin sera no significativo (porque in
cluye el valor 100). Sin embargo, nos indicara que el estudio es realmente no concluyente: es po
sible que haya muy poco o ningn efecto (que la media poblacional de aquellos que reciben el
procedimiento sea cercana a 100), pero tambin es posible que exista un-efecto substancial (que
la verdadera media poblacional de aquellos que reciben el procedimiento implique una disminu
cin de hasta 11 puntos de IC, o un aumento de hasta 15 puntos de IC).
Una tercera ventaja, sostenida por aquellos que proponen los intervalos de confianza para
reemplazar las pruebas de significacin, es que existe menos probabilidad de que los investigado
res los utilicen errneamente. Como observamos en el captulo 6, un error generalizado en la uti
lizacin de las pruebas de significacin es concluir que un resultado no significativo implica que
5 A lgunos de los que proponen los Intervalos de confianza para reemplazar la prueba de significacin sostienen que de
beramos ignorar el vnculo con la prueba de hiptesis. Esta es la posicin ms radical en contra de la prueba de signifi
cacin. Es decir, estos psiclogos argumentan que todo el enfoque debera concentrarse en la estimacin, y que la
prueba de significacin de cualquier tipo debera ser relevante. En el captulo 8, veremos los fundamentos de esta po
sicin, junto con los argumentos contrarios.
no existe ningn efecto. Con ios intervalos de confianza es ms difcil caer en este tipo de error. Si
bien el intervalo de confianza que arroja un resultado no significativo incluir la media esperada
correspondiente a la ausencia de efecto, tambin incluir otros valores posibles. As, nos recuerda
que la verdadera meda poblacional podra muy bien ser diferente de la media correspondiente a
la ausencia de efecto.
A pesar de estas aparentes ventajas, es extremadamente raro encontrar intervalos de confian
za en la mayora de los diferentes tipos de publicaciones cientficas psicolgicas. En parte, esto
probablemente se debe a la tradicin y a que la mayora de los psiclogos han sido capacitados
para utilizar las pruebas de significacin, por lo que estn mucho ms acostumbrados a ellas. En
una publicacin cientfica, los intervalos de confianza tambin requieren una mayor descripcin.
Por ejemplo, qu sucedera en el caso de que tuviramos una tabla de resultados ms amplia. Se
ra sencillo agregar un asterisco en cada nmero para mostrar su significacin, por lo cual una ta
bla diseada de ese modo es fcil de leer. Con los intervalos de confianza, en lugar de un
asterisco, necesitaramos dos nmeros extra para cada resultado (los lmites de confianza superior
e inferior).
Otros psiclogos (p. ej. Abelson, 1997; Harris, 1997) indican dos razones para no abandonar
por completo las pruebas de significacin a favor de los intervalos de confianza. Primero, en algu
nos procedimientos estadsticos avanzados es posible realizar pruebas de significacin, pero no es
posible calcular intervalos de confianza. Segundo, del mismo modo que es posible cometer erro
res con las pruebas de significacin, tambin es posible cometer otros tipos de errores con los in
tervalos de confianza, especialmente debido a que la mayora de los psiclogos que realizan
investigaciones tienen menos experiencia en la utilizacin de estos ltimos.
Finalmente, la cuestin de los intervalos de confianza, en contraposicin con la significa
cin, tiene sus races en una mayor controversia entre estimacin y prueba de hiptesis, contro
versia que trataremos en el captulo 8. Sin embargo, para anticipar esa exposicin, podemos
sealar aqu que los intervalos de confianza, por lo general, tienen mucho ms sentido en situa
ciones de investigacin aplicada, mientras que las pruebas de significacin, con frecuencia, tie
nen mucho ms sentido n investigaciones con una orientacin ms terica.
Cualquiera sea el resultado de esta controversia sobre intervalos de confianza, es importante
comprenderlos, ya que podremos encontrarlos ocasionalmente al leer material relacionado con la
investigacin, y es posible que en el futuro aparezcan con ms asiduidad. No obstante, en la ac
tualidad no aparecen con frecuencia. Por eso, y para que la cantidad de material a aprender sea
manejable, decidimos no hacer hincapi en el tema de los intervalos de confianza en los prximos
captulos de este libro que tratan principalmente sobre pruebas de significacin en distintos tipos
de investigaciones..
Figura 7-10. E fe c to s d el tip o d e an teced en te (m a scu lin o , fe m e n in o , neutro o in d efin id o) y d el pronom bre
(l, e lla o e llo s ) en TL (T ie m p o de lectura por carcter), cu a n d o las ora cio n es se utilizaron sin referencia,
(E xp erim en to 1). {F u en te; F oertsch , J., & G em sb a ch er, M . A . (1 9 9 7 ), fig. 1, E n busca d e la neutralidad
d el gnero; E s e l e llo s sin g u la r un sustituto co g n iiv a m en te e fic ie n te d el l gen rico?" , C ie n c ia P s i
c o l g i c a [ P s y c h o l o g i c a l S c ie n c e ], 8, 108. C opyright, 1 9 9 7 , por la S o c ie d a d A m erican a de P sic o lo g a
[A m erican P s y c h o lo g ic a l S o c ie ty ]. R eim p reso c o n a u torizacin .]
en la que una persona se comportaba de forma ms amistosa que otra, y luego les preguntaron qu
persona sera ms propensa a ser amistosa en el futuro.
As informaron Chiu et al. uno de sus descubrimientos acerca de los tericos de entidades:
"Para ellos, si una persona result ser ms amistosa que otra en una determinada situacin, es ms
probable que la misma relacin se generalice a otras situaciones totalmente diferentes" (p. 23). El
sustento estadstico de esta conclusin fue descripto de la siguiente manera: La prediccin glo
bal de los tericos de entidades [acerca de la probabilidad de que la persona fuera amistosa] fue
significativamente mayor a 0,50 (95% IC - 0,5583 0,0348) (p. 23). Es decir que podemos te
ner un 95% de confianza de que, en la poblacin, la probabilidad real estara entre 0,5235 y
0,5931, todos nmeros superiores al 0,50 que esperaramos si los tericos de entidades hubieran
elegido al azar. Por el contrario, Chiu et al. descubrieron que los individuos que no eran tericos
de entidades tuvieron un nivel de prediccin significativamente menor al 0,50, con un intervalo
de confianza de 0,3648 a 0,4902.
RESUMEN*6
Al estudiar una muestra de ms de un individuo, la distribucin comparativa en el proceso de
prueba de hiptesis es una distribucin de medias de todas las muestras posibles de tamao igual
a la cantidad de casos que se estn estudiando. Podemos considerar que esa distribucin descri
be cul sera el resultado de a) tomar una gran cantidad de muestras, cada una con la misma can
tidad de unidades seleccionadas al azar de la poblacin de individuos y, luego b) crear una
distribucin de las medias de esas muestras.
La distribucin de medias tiene la misma media que la poblacin de observaciones. Sin em
bargo, tiene una varianza menor porque las medias mustrales tienen menos probabilidad de ser
extremas que las observaciones individuales. (Los extremos de cualquier muestra tienden a
equiparse con los valores centrales o los valores extremos en direccin opuesta). Especficamen
te, la varianza de ia distribucin de medias es la varianza de la poblacin de observaciones indi
viduales dividida por la cantidad de individuos que forma cada muestra (el desvo estndar es la
raz cuadrada de la varianza). La forma de la distribucin de medias se aproxima a la curva nor
mal si a) la poblacin de individuos sigue una curva normal o b) las muestras tienen 30 registros
cada una, o ms.
Las pruebas de hiptesis que involucran una sola muestra de ms de un individuo y una pobla
cin conocida se realizan de la misma forma que las pruebas de hiptesis presentadas en el captulo
6 (donde los estudios se realizaban con un slo individuo comparado con una poblacin de indivi
duos). La excepcin principal es que la distribucin comparativa es una distribucin de medias.
La mejor estimacin puntual de la media poblacional es la media maestral. Podemos deter
minar una estimacin por intervalo de la media poblacional basndonos en la distribucin de me
dias. Cuando la distribucin de medias sigue una curva normal, el intervalo del 95% de confianza
incluye todos los nmeros, desde 1,96 desvos estndar por debajo de la media maestral (lmite
de confianza inferior) hasta 1,96 desvos estndar por encima de la media maestral (lmite supe
rior de confianza). El intervalo del 95% de confianza es un intervalo de valores acerca del cual te
nemos un 95% de seguridad de que incluye la verdadera media poblacional.
Uno de ios aspectos del debate actual acerca de las pruebas de significacin plantea si los in
vestigadores deberan reemplazarlas por los intervalos de confianza. Aquellos que proponen los
intervalos de confianza sostienen que stos brindan informacin adicional, se concentran en la es
timacin y reducen la utilizacin incorrecta propia de las pruebas de significacin. Sin embargo,
los intervalos de c'rifianza rara vez se utilizan en las publicaciones cientficas psicolgicas, en
parte, debido a la costumbre y a la falta de familiaridad coa ellos, as como tambin a la incomo
didad que presenta su descripcin. Adems, aquellos que se oponen a basarse exclusivamente en
los intervalos de confianza sostienen que ios intervalos no pueden utilizarse en algunos procedi
mientos avanzados, que la estimacin no siempre es el objetivo deseado y que tambin los inter
valos pueden utilizarse de formas incorrectas propias de ellos.
El tipo de prueba de hiptesis descripfa en este captulo rara vez se utiliza en la investigacin
prctica (la hemos aprendido como escaln hacia otros temas). El desvo estndar de la distribu
cin de medias, con frecuencia denominado error estndar (SE), en ocasiones se utiliza para
describir la variabilidad esperada de las medias, particularmente en grficos de barra en los que el
error estndar puede representarse por la longitud de un segmento ubicado sobre o debajo de la
parte superior de cada barra.
Trminos clave
- intervalo de confianza (.IQ . Intervalo del 95% - Desvo estndar de una
- Lhmtes.de confianza. de confianza. distribucin de medias (aM).
- Distribucin de medias. Intervalo del 99% - Error estndar de la media (SE).
- Estimacin por intervalos. de confianza. - Varianza de una distribucin
- Media de una distribucin Estimacin puntual. de medas (o2^).
de medias (mM). Forma de la distribucin - Prueba Z.
de medias.