Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
5- '700 2-- 1 0
O '/...F WuV . /2 S ljs_
? 1¡0
SvV:..
INVESTIGACIÓN CUANTITATIVA
,
EN PSICOLOGIA
Del diseño experimental al reporte de investigación
Traducción
Eloy Pineda Rojas
Yazmín Juárez Parra
Revisión técnica
Florente López Rodríguez
Profesor titular de tiempo completo
Facultad de Psicología
División de Estudios de Posgrado
- UNAM
OXFORD
UNIVERSITY PRESS
?-
1
UXFORD
VNIVERSITY P R ESS
Antonio Caso 142, San Rafael,
Delegación Cuauhtémoc, C.P. 06470, México, D.F.
Tel.: 5592 4 277, Fax: 5705 3738, e-mail: oxford@oupmcx.co m.mx
Oxford University Press es un departamento de la Universidad de Oxford.
Promuev~ 1 objetivo de la Uni\·ersidad relativo a la excelencia en la in,·estigación, erudición
.- Y educación mediante publicaciones en todo el mundo en
~ Oxford México
Auckland Bangko k Buenos Aires Calcuta C hcnnai
~hciad del Cabo Dar-es-Salaam Delhi Estambul Hong Kong
J(l,, ·'' Kuala Lumpur Madrid Melboume Mumbai Nairobi Nueva York
~o Paulo Shanghai Singapur Taipei Tokio Toronto
Con compañías afiliadas en Bcrifn
O xford es una marca registrada de O xford Univcrsity Press en el Reino U nido y otros países.
Publicado en México por O xford U nivcrsity Press México, S.A. de C.V.
División: Profesional
Area: Psicología y Educación
Sp1msor editor: Diana Scrv!n Chávcz
Edici611: Ester Ali1.cri Fernández
Sergio Gerardo Lópcz Hernández
Prodtteci611: Claudia Celia Martínez An1igón
Portada: Perla Alejandra López Romo
INVESTIGACIÓN CUANTITATIVA EN PSI COLOGÍA
Del diseno experimental al repo rte de investigación
Todos los derechos reservados © 2002, respecto a la primera edición e n español por
Oxford University Prcss México, S.A. de C.V.
Ninguna parte de esta publicación puede reproducirse, almacenarse en un sistema
de recuperación o transmitirse, en ninguna forma ni por ningún medio,
~-
sin la autorización previa y por escrito de
O xford University Press México, S.A. de C. V.
Las consultas relativas a la reproducción deben enviarse al Departamento de Pc_rmisos
y Derechos de Oxford Univcrsity Press México, S.A. de C.V.,
al domicilio que se señala en la parte superior de esta página.
Miembro de la Cámara Nacional de la Industria
Editorial Mexicana, registro número 723
ISBN 9 70 -ó13·701 ·7
All Rights Rcserved. Authorized translation from English language edition published by Psychology Prcss,
a member of the Taylor & Francis Group.
Prefacio xxv
Glosario de símbolos xx1x
Introducción
l. Los métodos utilizados en la investigación psicológica 1
Métodos
5. Planteamiento de preguntas 1: entrevistas y encuestas 72
6. Planteamiento de preguntas II: medición de actitudes y significado 87
. 7. Observación y análisis de contenido 99
Datos y análisis
8. Escalas de medición 108
9. Resumen y descripción de datos 115
10. Más allá de la descripción 146
vii
~L________________________c_o_n t_e_ni_d_o____________________________
Apéndices
l. Estadísticas descriptivas 394
TI. Muestreo e intervalos de confianza para proporciones 405
III. Comparación de la muestra con la población 4 11
IV. Poder de la prueba z en un solo grupo 416
V. Transformación de datos y pruebas de bondad del ajuste 420
VI. Búsqueda de diferencias entre dos niveles de una variable independiente 428
VII. Búsqueda de diferencias entre más de dos niveles de una variable independiente 445
VIII. Análisis de diseños con más de una variable independiente 467
IX. Análisis posterior al ANOVA o a x_2 483
X. Correlación y confiabilidad 504
XI. Regresión 522
XII. Análisis de reactivos y discriminativo con las escalas de Likert 533
XIII. Metaanálisis 535
XIV. Tablas de probabilidad 548
XV. Tablas de poder 583
XVI. Tablas diversas 618
Bibliografía 627
Índice onomástico 631
Índice analítico 633
,
1ndice de .contenido
Prefacio xxv
Glosario de símbolos xxix
.- ix
~ Índice de contenido
X ~~---------------------------------------------
Elección de un tema 18
Revisión de la bibliografía 19
Concentración en un área específica de investigación 22
Elección del método 23
Elección de una hipótesis 24
Elección del diseño de investigación 24
Medición en psicología 24
Conducta no verbal abierta 24
Conducta verbal 25
Conducta encubierta 25
La elección del sistema de medición 25
Confiabilidad 26
Validez 27
Efectos de piso y de techo 29
Elección del análisis 30
Elección de los participantes: la muestra 30
El procedimiento 31
Estudios piloto 32
Resumen 33
-
~~--------------------ín_d_ic_e_d_e_c_o_nt_e_nl_'d_o__________________________
Dimensiones 88
Escalas de actitud 89
Escala de Thurstone 89
Escala de Guttman 90
Escala de Likert 91
Técnicas para medir significado 94
Metodología Q 94
El diferencial semántico 96
Cuadrículas de repertorio 97
Resumen 98
-
~~----------------------Ín_d_ic_e_d_e_c_o_n_te_n_id_o___________________________
12. Análisis de diferencias entre una sola muestra y una población 168
Introducción 168
Pruebas z 168
Lectura de tablas z 172
Prueba de la significación de una sola puntuación cuando se conocen la media y la
desviación estándar de la población 173
Búsqueda de la significación estadística de una puntuación z 174
Examen de la diferencia entre la media de una muestra y la de una población 175
Pruebas t de un grupo 176
Evaluación de la media de una sola muestra cuando se conoce la media de la
población, pero no la desviación estándar de la población 176
Intervalos de confianza para medias 181
Gráficas adicionales 181
Gráficas de línea con medias y error estándar de la media 181
Gráficas de línea con medias e intervalos de confianza 182
Diagramas de caja con muescas 183
Identificación de extremos con puntuaciones estandarizadas 184
Resumen 185
16. Análisis preliminar de diseños con una VI de más de dos niveles 229
•
Introducción 229
Pruebas paramétricas 229
Diseños entre sujetos · 232
Diseños intrasujetos 236
Los supuestos del ANO VA 241
La robustez del ANO VA 242
Diseños intrasujetos 243
Tamaño del efecto y ANO VA 246
-
~L--------------------~Ín~d_ic~e_d~e~c~o~n~te~n~id~o~-------------------------
Cálculo del poder de un ANO VA paramétrico de una vía 246
La relación entre t y F 247
Equivalentes no paramétricos del ANOVA 247
Por lo menos datos ordinales -247
Datos nominales 250
Resumen 252
-
~L--------------------~fn~d~ic~e~d~e~c~o~nt=e~n~~-d~o__________________________
Apéndices
l. Estadísticas descri ptivas 394
Cálculo de la media (X) 394
Cálculo de la varianza (s2) 394
Cálculo de la desviación estándar (s) 395
Cálculo de la media y la mediana a partir de distribuciones de frecuencia 396
Medias 396
Medianas 397
Creación de una gráfica de pastel 398
Creación de un diagrama de caja 399
La mediana 400
Lugar de la bisagra 400
Rango H 400
Bardas interiores 400
Bardas exteriores 401
Índices de sesgo y curtosis 402
Sesgo 403
Curtosis 403
•
~xx fndice de contenido
~ IL--------------~~~~==-------------------
XI . Regresión 522
Regresión lineal simple 522
Cálculo de la significación estadística de un análisis de regresión 524
Vínculos adicionales entre la correlación y la regresión lineal simple 526
R2 ajustada 528
Error estándar de un coeficiente de regresión 528
Prueba de la significación estadística de un coeficiente de regresión 531
Cálculo de un intervalo de confianza para un coeficiente de regresión 531
--------------------------~Ín~d~ic=e~d=e~c=o~nt=e~n~id~o__________________~JXXifi
El presente libro está diseñado para Uevar al lector a recorrer todas las etapas de la inves-
tigación: desde la elección del método por emplear hasta el reporte de los resultados co-
rrespondientes, pasando por los aspectos del diseño, la realización y el análisis. Aunque la
obra ofrece una revisión general de todos los métodos que los psicólogos aplican en su es-
tudio, se centra en la práctica de los cuantitativos.
Sin embargo, lo anterior no significa que el texto rebose de ecuaciones. Su objetivo es
explicar la manera de investigar, no de estimar a mano o con una simple calculadora técni-
cas estadísticas. Se supone que el lector tendrá acceso a una computadora y a programas
estadísticos apropiados para realizar los cálculos necesarios. De acuerdo con ello, las ecua-
ciones se presentan a fin de mejorar la comprensión de la técnica que se describe. No obstan-
te, en los apéndices se incluyen las ecuaciones y los ejemplos desarrollados para técnicas
específicas para los lectores con más inclinación matemática que deseen comprobar los
cálculos y para las ocasiones en que no se dispone de computadora con la cual llevar a cabo
los análisis. Además, en los apéndices se abordan algunas de las ideas más complejas.
XXV
~~--------------------------Pr_e_fa_c_io_______________________________
El libro se estructura de manera tal, que quienes no están familiarizados con el tema
pueden leer ciertas partes de capítulos específicos. Por tanto, los universitarios de niveles
iniciales precisan una reseña general de los métodos utilizados en la psicología, de los prin-
cipios de su uso y de los aspectos éticos de tal investigación. Observarán después las eta-
pas de la investigación, seguidas por un análisis de las variables y una explicación general
de los diseños de investigación y su validez interna. Luego, según los métodos por aplicar,
leerán partes selectas de los capítulos acerca de métodos de investigación específicos. A fin
de analizar los datos, deben estudiar temas relacionados con escalas de medición y cómo
explorar y resumir información. A continuación, intentarán extraer inferencias a partir de
los datos: cuán probable es que sus resultados se hayan debido al azar. Estarán conscientes
acerca de la manera en que pueden elegirse muestras para que participen en un estudio y
de cómo se comparan los resultados de una muestra con los de una población.
Reviste importancia que, además de averiguar cuán probable es que sus resultados se
deban al azar, sepan cómo establecer el tamaño de cualquier efecto que detecten y cómo
quizá detectarían un efecto real, si existe. Han de conocer las limitaciones del tipo de da-
tos que ciertas pruebas estadísticas pueden manejar y de otras pruebas disponibles sin tales
limitaciones. Pueden restringir el análisis a situaciones relacionadas con la observación de
diferencias entre dos condiciones y el simple análisis de los vínculos entre dos medidas.
Por último, deben aprender a informar sobre su investigación como un reporte de labora-
torio. Por tanto, un curso de nivel introductorio incluiría los capítulos y partes de capítulos
siguientes:
l. Los métodos utilizados en la investigación psicológica.
2. Las etapas preliminares de la investigación.
3. Las variables y la validez de los diseños de investigación.
La sección sobre tipos de diseño y terminologia en
4. Diseños de investigación y su validez interna.
Uno o más acerca de
5. Planteamiento de preguntas I: entrevistas y encuestas.
6. Planteamiento de preguntas II: medición de actitudes y significado.
7. Observación y análisis de contenido.
Luego
8. Escalas de medición.
9. Resumen y descripción de datos.
1O. Más allá de la descripción.
Las secciones sobre estadística, parámetros y elección de una muestra a partir de
11. Muestras y poblaciones.
\
_________________________________P_re_f_ac_io________________________~~
Los estudiantes de segundo nivel deben aprender diseños más complejos. Por ello necesi-
tan ahondar en los métodos, el diseño y su análisis. Han de estudiar con detenimiento el
análisis de relaciones y estar conscientes de otras formas de reporte de ~vestígaciones. En
consecuencia, es probable que consideren:
La sección sobre ejemplos específicos de diseños de investigación en
4. Diseños de investigación y su validez interna.
Algo que no hayan leído en
5. Planteamiento de preguntas 1: entrevistas y encuestas.
6. Planteamiento de preguntas 11: medición de actitudes y significado.
7. Observación y análisis de contenido.
La sección sobre intervalos de confianza en
11. Muestras y poblaciones.
16. Análisis preliminar de diseños con una VI de más de dos niveles.
17. Análisis de diseños con más de una VI.
Por lo menos, la sección sobre contrastes en
18. Análisis subsecuente después del ANOVA.
El material restante en
19. Análisis de relaciones I: correlación.
En niveles posteriores cabe esperar que los estudiantes aprendan otras maneras de analizar
los datos -tras realizar un análisis de varianza- , que estudien la de regresión múltiple y
el metaanálisis y que conozcan los diversos tipos de análisis de multivarianza.
~~------------------------P_re_f_a_ci_o_______________________________
Como psicólogos, tenemos que considerar los métodos como herramientas que nos
ayudan a realizar nuestra investigación, no como fines en sí mismos. Sin embargo, debe-
mos estar conscientes respecto al uso correcto de los métodos y a sus limitaciones. Sobre
todas las cosas que espero que los lectores obtengan tras llevar a cabo y analizar la inves-
tigación se encuentra el entusiasmo de tomar una idea, de diseñar una manera de probarla
empíricamente y de ver si los hechos son congruentes con la idea original.
Agradecimientos
Quisiera dar las gracias a las personas que me iniciaron en la carrera de investigador y, en
particular, a Jobn Valentine, Ray Meddis ·y Jobn Wilding, quienes me introdujeron en el di-
seño de investigación y en la estadística. He aprendido mucho de gran número de personas
en años recientes, sin dejar de mencionar a todos los colegas y estudiantes cuyas pregun-
tas me han obligado a aclarar mis propios pensamientos. También me gustaría agradecer a
Marian Pitts, que me estimuló cuando empecé a considerar la idea dy 'escribir este libro.
Con frecuencia, lan Watts y Julie Adams, de los Servicios de Tecnologta de la Información
de la Universidad de Staffordshire, me aconsejaron sobre cómo usar las numerosas gene-
raciones de mi paquete de procesamiento de palabras para lograr lo que quería. Rache!
Windwood, Rohays Perry, Paul Dukes, Kathryn James y Kirsten Buchanan, de Psychology
Press, me apoyaron y aconsejaron a medida que el libro pasaba de lá' idea original al texto
listo para la impresión.
Paul Kinnear, Sandy Lovie y John Valentine me hicieron comentarios muy útiles en
una versión preliminar del libro. Tess y Steve Moore me iniciaron en algunos de los mis-
terios de la impresión en color. Anne Clark-Carter me indicó cuándo tomaba la explicación
ininteligible. Este esfuerzo resultó especialmente heroico por su aversión a la estadística.
Además, ella, Tim y Rebecca toleraron, con distintos grados de ecuanimidad, que estuviera
con frecuencia pegado a una computadora. A pesar de los esfuerzos de otros, cualquier
error cometido en el libro es responsabilidad mía.
Glosario de simbolos
----------------------------------------------------------------~xxix
~L_____________________G~l~o~sa~r~io~d~e~s~ím~bo~l~os~-------------------------
Con el alfabeto griego
a alfa probabilidad de cometer un error tipo 1
~ beta probabilidad de cometer un error tipo II
ll2 eta cuadrada tamaño del efecto en el ANOVA
x2 chi cuadrada estadística para datos nominales
!.l. mi media de una variable en la población
3t pi proporción de la población (por ejemplo, la proporción de
fumadores)
p rho coeficiente de correlación de una relación en la población
o sigma desviación estándar de una variable en la población
o2 sigma cuadrada varianza de una variable en la población
INVESTIGACIÓN CUANTITATIVA EN PSICOLOGÍA
pz
1
Los métodos utilizados
en la investigación psicológica
Introducción
En este capítulo se tratan los propósitos de la investigación psicológica. Se explica por qué
quienes la realizan emplean en ella un método determinado y se describe la diversidad de
los procedimientos que utilizan. Se responde la pregunta de si la psicología es una ciencia.
Por último, se abordan las cuestiones éticas relacionadas con dicha investigación.
¿Qué es un método?"
Un método es una aproximación sistemática a un segmento de investigación. Los psicólo-
gos utilizan una gran diversidad de métodos, los cuales se clasifican de varias maneras. Se
establece una distinción común entre los cuantitativos y los cualitativos: como el nombre
lo sugiere, los primeros incluyen cierto tipo de medición numérica, mientras que los segun-
dos se relacionan con la descripción verbal.
Métodos cuantitativos
Una manera de clasificar los métodos cuantitativos consiste en designarlos con los rótulos
de experimentación, planteamiento de preguntas y observación. La distinción principal en-
tre ellos es que, en el método experimental, los investigadores manipulan ciertos aspectos
ir:ll:·· de la situación y miden los efectos supuestos de tales manipulaciones. Los métodos de pre-
gunta y observación se relacionan con mediciones sin manipulación. El planteamiento de
¡------,
~
Investigación cuantitativa en psicología
'~------------~--------~~~---------------
preguntas requiere inquirir a la gente sobre detalles como su comportamiento, sus creencias
y sus actitudes. Los métodos de observación atañen a la observación del comportamiento
humano, lo cual no resulta sorprendente.
Por tanto, en un experimento para investigar la relación entre la ingestión de café y las
pautas de sueño podría hacer que un grupo se abstenga de beberlo, mientras que a otro con-
junto le daría una taza de café común y a un tercero, descafeinado; luego mediría cuánto
durmió cada grupo. Como alternativa, podría preguntar a un conjunto acerca de sus pautas
de sueño y de consumo de café; en un estudio de observación me quedaría con un grupo de
personas durante una semana, anotaría el consumo de café de cada cual y luego, con un sis-
tema de televisión de circuito cerrado, observaría cómo durmieron cada noche.
Una vez más, la distinción entre los tres métodos es artificial porque las medidas uti-
lizadas en un experimento podrían implicar el planteamiento de preguntas o la realización
de observaciones. Antes de que explique los tres descritos, quiero mencionar un método
que a menudo se pasa por alto y que confiere al investigador mayor control: la modelación.
El expedmento
Los experimentos cobran muchas formas, como se verá en el capítulo 4, "Diseños de in-
vestigación y su validez interna". Por el momento, sólo quiero recalcar una vez más que
e]_experimentador manipula un aspecto de la situación y mide lo que se supone son las con-
secuencias de tales manipulaciones. Uso el término supone porque un tema importante en
la investigación es el intento de identificar las relaciones causales entre los fenómenos. Co-
mo ya se explicó, puedo tener problemas de sueño cuando bebo café, pero tal vez éste no
sea la causa de mi insomnio; más bien podría ocurrir cuando también se hallan presentes
otros aspectos de la situación que perturban mi sueño. Se tiene la idea de que el experimen-
to diseñado apropiadamente es la mejor manera de identificar las relaciones causales.
Con experimento diseñado apropiadamente me refiero a uno en que todos los aspec-
tos relevantes de la simulación se controlan de alguna forma. En el capítulo 4 se explican
los diferentes medios de control que los investigadores pueden utilizar.
El cuasiexperimento
El cuasiexperimento puede considerarse una versión menos rigurosa del experimento. Por
ejemplo, donde el investigador no manipula un aspecto de la situación, como el consumo de
café, pero asigna sujetos a distintos grupos con base en su consumo o en la falta de él, y lue-
go compara las pautas de sueño de los grupos. El cuasiexperimento es menos controlado
que un experimento, por lo cual la identificación de las relaciones causales llega a resul-
tar más problemática. No obstante, este método se utiliza por al menos dos buenas razones:
primera, cuando no es posible manipular la situación; segunda, cuando tiene mejor validez
ecológica que el equivalente experimental.
Planteamiento de preguntas
Hay por lo menos tres formatos para plantear preguntas: entrevistas no estructuradas (o li-
bres), entrevistas semiestructuradas y cuestionarios estructurados; y por lo menos tres ma-
neras en que pueden presentarse y responderse: personalmente, por teléfono o mediante
cuestionario escrito. Las entrevistas a personas emplean en general algún método de plan-
teamiento de preguntas.
6
o
'~~------------~--------~--~--------------
Investigación cuantitativa en psicología
Hay varias ventajas en ese método de plantear preguntas. En primer lugar, los entrevistados
podrían resolver por sí mismos el cuestionario, lo cual significa que ahorrarán tiempo al in-
vestigador tanto en la entrevista como en el traslado al lugar donde viven. En segundo sitio,
un formato estándar reduce al máximo el efecto que la manera de plantear las preguntas
tiene en el entrevistado y en sus respuestas. Sin tal verificación, cualquier diferencia encon-
trada entre las respuestas de las personas podría deberse a cómo se formuló la pregunta más
que a cualquier diferencia inherente entre los entrevistados. Una tercera ventaja radica en que
las respuestas pueden cuantificarse de inmediato. En el ejemplo anterior. se diría al entrevista-
do que alcanzó una puntuación de 1 si dijo que estaba muy de acuerdo y de 5 si afirmó estar
muy en desacuerdo.
Los cuestionarios estructurados se aplican principalmente en psicología de salud y so-
cial; recurren a e!Jos los investigadores de mercado y quienes levantan encuestas de opi-
nión. Las entrevistas y las encuestas se estudian en los capítulos 5 y 6.
Los métodos utilizados en la investigación psicológica ¡-----¡
----------------------------~~~~~----~' 1
Métodos de observación
A menudo se supone que la observación no es en realidad un método porque un investiga-
dor puede simplemente observar a una persona o un grupo de individuos y anotar lo que
sucedió. Sin embargo, si una observación empezó con ese procedimiento, pronto resultará
evidente para el observador que, a menos que se presente poco comportamiento, será difi-
cil apuntar todo.
Hay por lo menos tres opciones para tratar ese problema. La primera consiste en de-
pender de la memoria y anotar después lo observado, pero presenta el problema evidente
de la selectividad y la mala retención nemotécnica. Un segundo método estriba en utilizar
algún aparato de grabación perma~ente, como audio o vídeo, que permita escuchar y ob-
servar de manera repetida. Si ello no es posible, la tercera posibilidad radicaría en decidir
de antemano en cuál aspecto de la situación concentrarse. A tal efecto, será de ayuda ela-
borar un sistema de codificación para el comportamiento y preparar anticipadamente una
lista de puntos por revisar.
Usted podría decir que ello sería prejuzgar lo que observará. Sin embargo, advierta que,
aun cuando no prepara una observación, lo que se anote será a costa de otros aspectos que
se omitan. Está siendo selectivo y esa selectividad se determina por cierta noción implíci-
ta suya sobre lo que resulta relevante. Como etapa preliminar, puede observar sin la lista de
puntos por revisar y luego diseñarla como resultado de la observación inicial, mas no pue-
de escapar del proceso selectivo, ni siquiera durante la etapa inicial, a menos que utilice un
medio de grabación permanente de los hechos. Eme_ero, recuerde que incluso una videocá-
mara se apuntará en una dirección determinada y así podrían pasarse por alto algunas cosas.
Los métodos que suponen el planteamiento de preguntas y los métodos de observación
abarcan la división cuantitativa-cualitativa (consulte etnografía y etogénica, más adelante).
Observación estructurada. La observación estructurada comprende un conjunto de cla-
sificaciones del comportamiento y el uso de una lista de puntos por revisar a fin de regis-
trar éste. Una versión inicial, aún utilizada para observar grupos pequeños, es el análisis
de proceso de interacción (API), diseñado por Bales - 1950- (véase Hewstone, Stroebe
y Stephenson, 1996).
Con dicha técnica, el comportamiento verbal se clasifica según ciertas categorías, como
"Ofrece sugerencias e instrucciones, lo cual implica autonomía" . Los observadores regis-
tran en su lista de puntos por revisar, con sólo marcar la casilla apropiada cada vez que se
dice algo, la naturaleza del comportamiento y hacia quién va dirigido. El API pierde gran
parte de la información ·original, pues se diseñó a partir de una teoría particular de compor-
tamiento grupal. En este caso, los grupos crean líderes, quienes pueden ser de dos tipos;
ambos pueden coexistir en el mismo grupo y las interacciones con ellos serán de un tipo
concreto. Un sistema más complejo se relaciona con símbolos para tipos específicos de com-
portamientos, incluido alguno de índole no verbal.
~
o
Investigación cuantitativa en psicología
IL----------~~~~----~~~---------------
Análisis de contenido
El análisis de contenido es una técnica empleada para cuantificar aspectos de discursos, de
textos o de algún tipo de representación visual. El papel del analista consiste en decidir so-
bre la unidad de medición y luego en aplicarla al texto u otra forma de representación. Por
ejemplo, Pitts y Jackson (1989) observaron la presencia de artículos sobre el tema del sida
en periódicos de Zimbabwe a fm de descubrir si había cambios con una campaña guberna-
mental diseñada para crear conciencia y si alguno de éstos resultó sostenido. En otro estu-
dio, Manstead y McCulloch ( 1981) observaron cómo se representaba a hombres y mujeres
en los anuncios televisivos. El análisis de contenido se aborda en el capítulo 7.
Metaanálisis
El metaanálisis es un medio para revisar cuantitativamente los resultados de la investiga-
ción en cierta área provenientes de varios investigadores. Permite al revisor aprovechar el
hecho de que estudiosos individuales hayan usado muestras pequeñas en su investigación
para basar su revisión general en varias de éstas. Por tanto, si distintas partes de la investi-
gación llegan a conclusiones diferentes, la revisión general mostrará la dirección en que
apunta la tendencia general de la investigación relevante. Se han diseñado técnicas que per-
miten al revisor sobreponerse al hecho de que las piezas individuales de investigación tal
vez hayan empleado diferentes procedimientos estadísticos al crear el resumen. Un examen
más completo se encontrará en el capítulo 22.
___________________
Lo_s_m_e_
' t_od
__ os__ in_v_e_st~ig~a_c_ió_n~p_s_ic_o_ló~g~ic_a___ ~
ut_íl_iz_a_d_o_s_e_n_la__
Estudios de caso
Los estudios de caso son análisis profundos acerca de un individuo o, posiblemente, de una
institución u organización. En sentido estricto, no representan un método distinto sino que
emplean otros métodos para investigar lo individual. Por tanto, un estudio de caso puede
implicar entrevistas y experimentos. Por lo general se utilizan cuando un sujeto resulta poco
típico; por ejemplo, si alguno tiene una habilidad particular, digamos una memoria fenome-
nal (véase Luria, 1975a). Como opción, se usan cuando un individuo tiene un déficit, como
un tipo de afasia, que es un deterioro de la memoria (véase Luria, 1975b). Con frecuencia
los neuropsicólogos cognitivos emplean estudios de caso con discapacitados para ayudar a
comprender el funcionamiento de la cognición normal (véase Humphreys y Riddoch, 1987).
Métodos cualitativos
Existen dos interpretaciones erróneas del enfoque cualitativo de investigación: en primer
lugar, que carece de un método; en segundo, que reviste mayor facilidad que el cuantitati-
vo. Si bien esto $ería cierto en una investigación deficiente, la cualitativa adecuada será tan
rigurosa como la buena investigación cuantitativa. Muchos tipos de investigación cualita-
tiva parten del punto de vista de que el comportamiento de quienes realizan las med1cio.1es
y sus conceptos no pueden llegar a la esen.c!a de lo humano. Restringir aspectos de la psi ..
colegía humana a números es, do.:: acuerdo con esta noción, adoptar un enfoque reduccio-
nista y positivista para entender a las personas.
El reduccionismo supone la reducción - valga la taut0logía-- del objeto de estudio a
su forma más simple. Los críticos del reduccionismo sostendrían, por ejc111plo, que usted
no puede comprender la memoria humana dando a los participantes listas de palatras sin
relación, midiendo las que recuerdan y buscando un desempeño pn)medio. En cambio, ha
de comprender la naturaleza de la memoria en el contexto más amplío de la experiencia de
los individuos, incluida su interacción con otros. El positivismo se funda en un concepto
mecánico de los seres humanos que busca la comprensión a partir de relaciones causa-efec-
to, en lugar de considerar los significados para los individuos. Lo impo1tante radica en que la
misma pieza de compo1tamiento s ignifica cosas diferentes para personas distintas e inclu-
so para una misma en diversos contextos. Por tanto, un apretón de manos puede representar
un saludo, una despedida, la conclusión de un concurso o el cierre de un trato. Para entender
l -:- que el significado de cierta pieza de comportamiento el investigador debe conocer qué signifi-
~ per ca para los participantes. La manera más extrema de positivismo aplicado en psicología es
::: tal el enfoque conductista.
[ !1:..-nen
~~----------------ln_v_e_st_ig~a_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
Reseña narrativa
La reseiia narrativa es una manera de resumir el trabajo en un área de investigación espe-
c ífica. Desempeña un papel s imilar a un ensayo o a la introducción de un informe de inves-
tigación, pues compara )os hallazgos de diferentes piezas de investigación para producir una
resei1a general de un ámbito. Como la introducción de un infonne de investigación, puede
identificar dónde debe concentrarse la investigación para obtener mayor conocimiento en
cierta área. Por lo menos una revista (Psychological Review) está dedicada a los artículos
de reseña.
Se ha desarrollado metaanális is a parti r del deseo de cuantificar los resultados de va-
rias piezas relacionadas de investigación en lugar de depender de la reseña narrativa.
Etnografia
La etnografia es, como su ctro nombre lo indica (observación participante), un método en
que el investigador efectúa observaciOnes mientras forma parle de un grupo u organización.
Por ejemplo, guíen desee aprender acerca de una empresa podría un irse a ella y lleyar a cabo
su investigación desde e l interior. Se ha sugerido que si son parte de la organización, en lu-
gar de observadores externos, resulta más probable que los investigadores aprendan qué
significan comportamientos específicos prora los pa1ticipaotes. Un observador externo podría
c::.tar limitado a describir el comp011amiento sin comprender cabalmente lo que significa
para Jos participamc~.
Asimismo, la etnografta puede emprendersc de diferentes maneras. P uede ser totalmen-
te ~:m: ub i erta, de modo que nadie en el gmpo sepa que se realiza la investigación. Como
op..:ión, una 1:amiJG~~ lim 1tada de personas puede gozar de la confianza del estudioso o todos
los participantes pueden estar conscientes del papel de dicha persona. La elección tiene un
lado élico: ¿es lcgíti!no observar a la gente sin su permiso-:> Consulte más adelante el exa-
men acerca de !n ética en la realización de investigaciones. Un argumento e n contra de re-
velar sus intenciones mdica en que tal conocimiento puede alterar el comportamiento de la
gente, con lo cual se perdería la validez ecológica del método. Además, es un asunto de prác-
tica. Si resulta poco probabie que obtenga el permiso, podría sentir la necesidad de efectuar
la investigación clandestinamente. No recomiendo a los estudiantes realizar ese tipo de in-
vestigación encub ierta. Antes de considerar ese método, analice los temas con el supervisor
de su investigación. ·
Para una explicación clara sobre la etnografia, consulte Hammcrsley y Atkinson (1983).
Et ogénica
Diseñada por Rom Hané y sus colegas, la etogénica combina formas de observación y en-
trevista para explorar los significados y las intenciones que los individuos tienen acerca de
su comportamiento.
__________________L_os_m
__ét_o_d_
os_u_t_il_iz_a_do_s_e_n_l_a_i_nv_e_st_ig~a_c_ió_n~p_s_
ic_o_
ló~g_ic_a________~¡-11
Obligaciones
Planeación
Como investigadores, debemos valorar la relación entre riesgos y beneficios, es decir, he-
mos de revisar si los beneficios que el estudio podría mostrar superan cualquier riesgo psi-
cológico al que pretendamos exponer a los participantes. Por tanto, si fuéramos a explorar
un posible medio pára aliviar el sufrimiento psicológico, estaríamos dispuestos a poner a
nuestros participantes en un riesgo mayor que si tratáramos de satisfacer la curiosidad in-
telectual sobre un tema sin beneficios evidentes para la población.
La noción de lo que constituye un riesgo se relaciona con lo anterior. E1 término riesgo
mínimo describe el nivel de riesgo que cierto participante podría tener en su vida cotidia-
na. Por consiguiente, si la investigación no requiere más que este mínimo de riesgo, lo más
probable es que se considere éticamente aceptable que si excede tal mínimo.
Siempre es una práctica atinada conocer, antes de conducir una pieza de investigación, lo
que otros estudiosos han hecho en el área. Ello nos evitará realizar una que constituya una ré-
plica innecesaria de un trabajo previo y podría revelar otras técnicas que resultarían menos
cuestionables éticamente. También es una buena idea, sobre todo como investigador novato,
buscar el consejo de colegas más experimentados. Esto s.erá más importante aún si propone
la práctica de una investigación con personas de un grupo especial, como las que padecen
una incapacidad sensorial. Esto lo alertaría sobre temas éticos particulares para el grupo.
Además, evitaría que usted cometiera errores básicos que darían al estudio un aspecto me-
nos profesional y que quizá propiciaría que los sujetos se mostraran menos cooperativos.
~~--------------~ln~v~e~st~ig~a~c_io~·n_c~u~a~n~ti~ta~t~iv~a_e_n_p~s~ic~o~lo~g~ía~--------------------
La determinación de lo que constituye un riesgo que vale la pena correr también depen-
de del investigador. Es probable que uno experimentado obtenga mayores beneficios que un
novato.
Si están implicados riesgos que superan el mínimo, los investigadores deben poner sal-
vaguardas, como tener consejo a la mano.
Ejecudón
Trabaje en su propio ámbito de competencia; es decir, si no está clínicamente capacitado y
busca investigar en ese campo, tenga en su equipo a quien sí lo esté.
Acérquese a los posibles participantes sin olvidar que tienen derecho pleno a rehusar-
se; aproxímeseles de manera cortés y acepte con gracia el rechazo. En segundo lugar, siem-
pre trate con respeto a sus participantes, quienes se han mostrado dispuestos a tomar parte
en su trabajo y usted les debe la cortesía común de no tratarlos como materia de estudio,
precipitándose a incluirlos y desechándolos cuando haya terminado con ellos. Tal vez esté
aburrido de seguir innumerables veces el mismo procedimiento, pero piense en cómo se
siente cuando se le trata como a un objeto en la banda de montaje.
Los pat1icipantes pueden sentirse ansiosos acerca de su desempeño y verse a sí mis-
mos como sujetos de prueba. Si es apropiado, garanticeles que no observará el desempeño
individual sino el de la gente en general.
Resista la tentación de comentar su desempeño mientras participan en el estudio; ello
puede ser un peligro, sobre todo cuando hay más de un investigador. Recuerdo con horror
el trabajo con un colega que había invertido mucho en un resultado en particular y que ha-
blaba en voz alta sobre los participantes que no estaban desempeñándose bien con relación
a la hipótesis.
Obtenga un consentimiento informado. En otras palabras: cuando sea posible, obtenga el
acuerdo de cada participante para tomar parte, con el conocimiento pleno acerca del mayor
riesgo posible que el investigador podría suponer. En algunos casos se necesitada la
aquiescencia del padre, del tutor o incluso de quien estuviere actuando in loco parentis (en
el papel de padre; por ejemplo, un maestro).
Evidentemente, en ciertas situaciones será dificil, acaso contraproducente, obtener
tal consentimiento. Por ejemplo, si realiza una observación en un ambiente natural. Si el
comportamiento se da en un lugar público, la investigación resultaría menos cuestionable
desde el punto de vista ético que si tuviera que utilizar equipo de especialistas para obtener
los datos.
Aunque sería idóneo que obtuviera un consentimiento informado, no revele por anticipa-
do la hipótesis a sus participantes, ni explícitamente al decirla de manera directa al princi-
pio ni implícitamente mediante su comportamiento durante el experimento. Esto afectaría su
comportamiento de una de dos maneras. Por una parte, podrían tratar de ser amables con
--------~---------
Lo_s_m_e_'t_o_d_os__ut_il_iz_a_d_o_s _e_n _la__in_v_es_t~ig~a_cJ_ó._n~p_s_ic_o_ló~g-ic_a________~¡--15
_u sted y de darle los resultados predichos. Por otra, podrían mostrarse determinados a no
comportarse como usted lo predijo; ello resulta cierto sobre todo si investiga un aspecto de
la debilidad humana como el conformismo.
Si no está utilizando una historia para encubrimiento, basta ofrecer una descripción ge-
neral del área de la investigación, como la de un experimento sobre la memoria. Evite que
su propio comportamiento señale .inadvertidamente el comportamiento esperado. Recuerde
la historia del caballo El inteligente Hans, que parecía tener la capacidad de realizar cálculos
matemáticos porque daba la respuesta al golpear con su pezuña; se descubrió que sólo reac-
cionaba a las señales inconscientes que su entrenador le enviaba (Pfungst, 1911). Una ma-
nera de evitar dicho peligro estriba en hacer que conduzca la investigación alguien que no
conozca la hipótesis o el tratamiento particular que ha recibido un grupo determinado y, por
tanto, desconoce la respuesta esperada (una condición de ciego).
No aplique presión indebida a la gente para que participe. Ello representaría un proble-
ma, sobre todo si los individuos a quienes estudia se encuentran en algún tipo de institu-
ción, digamos una prisión o un hospital psiquiátrico. No deben tener la impresión de que
se les sancionará de cierta manera si no colaboran en la investigación. Por otra parte, ningu-
no de ustedes ha de ofrecer alicientes innecesariamente grandes, como cantidades de dinero
desproporcionadas. He visto participantes que sólo. estaban interesados en el dinero que se
ofreció y que completaban una tarea de manera artificial nada más para terminarla y obte-
ner la recompensa.
Asegure a los sujetos que habrá confidencialidad, que no revelará a otros lo aprendido
sobre sus participantes individuales. Si es menester dar a la gente seguimiento posterior, tal
vez deba identificar a quién corresponde cada dato. Si éste es el caso, utilice un código para
identificar a las personas y luego, en un lugar separado de los datos, tradúzcalo a su mane-
ra para encontrar quién proporcionó los datos específicos. De esta forma, si alguien llega a
toparse con, digamos, un cuestionario confidencial, no podrá identificar al individuo cuyas
respuestas se muestran.
Si no necesita dar seguimiento a sus participantes, éstos pueden permanecer anónimos.
Ello cabe, por ejemplo, si·realiza una encuesta de opinión y recopila la información de con-
sultados que reunió en las afueras de un supermercado.
Aclare a los participantes que tienen derecho a retirarse de la investigación en cual-
quier momento y, además, a decir que usted no puede utilizar información recopilada hasta
ese punto.
Si en la investigación advierte algo relacionado con un participante que pudiera reves-
tir importancia para él, está obligado a informárselo. Por ejemplo, si mientras la realiza en-
cuentra que alguien parece sufrir de ceguera al color, debe decírselo. Evidentemente, dará
de manera cortés tales noticias. Además, manténgase en su ámbito de competencia. En el
ejemplo anterior, recomiende que vea a un oftalmólogo. No realice diagnósticos en un área
donde no tenga capacitación.
~L--------------~'~"v~e~s~ti~ga~c~io~·n~c~u~a~nt~it~a~ti~v~a~e~n~p~si~co~l~og~í~a____________________
Hay un detalle relacionado con las pruebas psicométricas (como pruebas de perso-
nalidad): sólo alguien capacitado plenamente debe utilizarlas para diagnóstico. Sin embar-
go, un investigador puede usarlas si no habla a los demás acerca de los resultados de casos
individuales.
En estudios donde participa más de un investigador es responsabilidad colectiva garan-
tizar que se conduzcan dentro de directrices éticas. Por tanto, si sospecha que alguien del
equipo no se comporta éticamente, es su responsabilidad alinearlo.
Debe recapitular la investigación con los participantes, es decir, tras terminar su parti-
cipación, ha de comentarla con ellos. Tal vez no quiera realizar esto de manera completa ni
de inmediato, pues no desea que otros conozcan sus intenciones; sin embargo, en tales cir-
cunstancias, ofrezca que se hablará de manera más completa una vez recolectados los da-
tos de todos los participantes.
Reporte
Sea honesto con lo que encontró. Si altera los datos - por ejemplo, si elimina las califica-
ciones de algunos parti~ipantes-, explique lo que hizo y por qué.
Mantenga la confidencialidad. Si está reportando sólo estadísticas de resumen, como
promedios de un grupo, y no detalles individuales, ello ayudará a evitar que se identifique
a participantes. Sin embargo, -si trabaja con grupos especiales -por ejemplo, una escuela úni-
ca o personas con memoria prodigiosa- o incluso con estudio de casos individuales, tal vez
la confidencialidad se dificulte. Donde sea posible, el uso de nombres o iniciales falsos la me-
jorará. Sin embargo, en algunos casos los sujetos necesitarán conocer la posibilidad de que
se les identifique; aquí ha de dárseles la oportunidad de vetar la publicación.
Hay muchas obligaciones con los colegas psicólogos.
Si, después de reportar los resultados de la investigación, encuentra que ha cometido
errores importantes, debe darlos a conocer a quienes tengan acceso a ella. En el caso de un
artículo publicado en una revista, es preciso escribir al editor.
No utilice el trabajo de otros como propio; evite los plagios. De igual manera, si cono-
ció los resultados de otro investigador antes de que se hayan publicado, repórtelos sólo si .
recibió el permiso correspondiente. Una vez publicados, son de dominio público y pueden
discutirse con libertad, pero ha de darse el crédito adecuado. También dará el debido cré-
dito a quienes trabajaron con usted en el estudio. Ello puede incluir la autoría conjunta, si
la contribución fue suficientemente importante. Como alternativa, un reconocimiento sería
lo apropiado.
Una vez que publicó su investigación y ya no espera analizar más los datos, deberá es-
tar dispuesto a compartirlos con otros psicólogos. Tal vez desearán examinarlos desde otro
ángulo.
... ___________________
Lo_s_m_e_'t_o_d_os__ in_v_es_t~ig~a_ct_
ut_i_ln_a_d_o_s_e_n_La__ .ó_n~p_s_
ic_
o_ _J¡--17
ló~g~ic_a________
1 Beneficios
Además de todas las obligaciones, una actuación ética puede producir beneficios para el in-
vestigador.
De tratar a los participantes como seres humanos que están a su nivel y que sostienen
opiniones de importancia, quizá reciba mayor cooperación. Asimismo, si se muestra por
demás abierto, dentro de las restricciones de no divulgar sus expectativas antes de que los
participantes hayan finalizado su actuación, el trabajo tendrá más significado para ellos y
esto podría evitar que busquen alguna motivación oculta en el trasfondo. Así, su compor-
tamiento se vería menos afectado por una sospecha sobre el tema de la investigación y los
resultados tendrían más validez.
Si empleó una historia para encubrimiento, puede utilizar la oportunidad a fin de reve-
lar las verdaderas intenciones de la investigación, de descubrir cuán convincente fue dicha
historia y de analizar cómo se sintieron los participantes. Ello reviste importancia especial
si requirió que se comportaran de una manera que pudo preocupados. Por ejemplo, en ex-
perimentos de Milgram (1974) donde los participant..:s pensaban que se aplicaban choques
eléctricos a otros, se dio a Jos primeros una larga explicación retrospectiva.
Otro aspecto útil de la explicación retrospectiva es que Jos participantes pueden revelar
estrategias que emplearon para realizar tareas, como una técnica nemotécnica particular en
una investigación relacionada con la memoria. Tal información puede ayudar a explicar la
variación entre participantes en sus resultados y proporcionar mayor conocimiento acerca
del comportamiento humano en el área que estudia.
Resumen
El propósito de la investigación psicológica es avanzar en el conocimiento acerca de los se-
res humanos porque describe, predice y permite a la postre la intervención para ayudar a
las personas. La psicología puede verse de manera legítima como una ciencia, pues emplea
métodos rigurosos en su investigación, a fin de evitar las meras conjeturas y de permitir
que los colegas psicólogos evalúen la investigación. Sin embargo, en común con las cien-
cias naturales, como la física, los psicólogos emplean un amplio conjunto de métodos en
su trabajo. Éstos varían en el grado de control que el estudioso tiene sobre la situación y en la
medida en que el contexto se relaciona con la vida diaria de las personas. Esta investigación
se clasifica a menudo como si fuera cuantitativa (relacionada con la recolección de datos
numéricos) o cualitativa (afma las cualidades de la situación).
En todo el proceso de investigación, los psicólogos han de tener en cuenta que deben
comportarse de manera ética con los participantes y con sus colegas.
En el capítulo siguiente se defmen las etapas preliminares de la investigación.
- --
2
Las etapas preliminares
d,é la investigación
1
Introducción
En el presente capítulo- se describen las etapas preliminares que los investigadores deben
recoJTer antes de llevar a cabo su estudio con participantes. Además, se resaltan las deci-
siones que han de tomar en cada fase y se recalca la necesidad de verificar, mediante una
prueba (un estudio piloto), que la investigación esté bien diseñada.
Es necesario recoJTer varias etapas antes de recolectar los datos. Usted debe elegir un
tema, leer acerca de él, centrarse en uno de sus aspectos particulares y optar por un método.
Donde resulte apropiado, elegirá su hipótesis. También ha de escoger un diseño, su sistema
(o sistemas) de medición y cómo analizará los resultados. Además, seleccionará a las per-
sonas a las que va a estudiar.
Elección de un tema
Lo primero que debe guiar su elección del tema de estudio es su interés. Si el tema no le
atrae, no disfrutará la experiencia de investigar. Un segundo elemento de su selección será
la ética al realizar el trabajo. El relacionado con seres humanos o con animales debe seguir
un minucioso análisis de costos y de beneficios. Es decir, ha de tener claro que si los par-
ticipantes pagan un costo, como ser engañados o enfrentar una experiencia poco placentera,
los beneficios derivados de la indagación deben sobrepasar los costos. La observancia de tal
18
______________________La~s~e~ta~p~a=s~p~re=l~im=l=·n=a~re=s~d~e_l~a_in=v~e=s=ti~ga=a=·o~·n~----------~~
·•
criterio significa que la investigación no diseñada para aumentar el conocimiento del ser
humano, incluida la mayor parte de los proyectos estudiantiles, debe mostrar la máxima
consideración por los participantes. En el capítulo 1 se brinda una explicación más com-
pleta de los temas éticos.
Un tercer punto debe ser la factibilidad de im·estigar en el área elegida. En cíertos cam-
pos, las dificultades para efectuar investigación empírica. como estudiante, son evidentes. Por
ejemplo. tal vez le interese de manera particular la elaboración de un perfil de delincuen-
tes a partir de la psicología forense. pero resulta improbable. a menos que tenga contactos
especiales, que realice algo más que una inYestigación bibliográfica en ese ámbito. Sin em-
bargo, antes de que decida si sería práctico conducir una im·estigación en un área determi-
nada, tendrá que leer el trabajo de otros y concentrarse luego en un aspecto específico del
campo que le atrae.
Revisión de la bibliografía
Antes de lleYar a cabo cualquier investigación necesita estar al tanto de lo que otros han
hecho en el área. Aunque trate de replicar cierta parte de un estudio para comprobar sus re-
sultados, habrá de conocer cómo se realizaron trabajos previos. Además. tal vez piense que
un método es original en un área, en cuyo caso aconsejaría comprobar que lo es.
Hay dos maneras rápidas de conocer cuáles investigaciones se han realizado en el área:
preguntar a un experto en el campo o usar alg(m tipo de base de datos de trabajos anteriores.
no se han publicado, por lo cual tienden a constituir las fuentes más actualiz.adas de inves-
tigación. Sin embargo, cuando los estudiosos se vuelven más preeminentes, se les invita a
presentar en las conferencias reseñas de sus hallazgos.
Las conferencias son de dos tipos: genéricas, como las anuales de la British Psycbolo-
gical Society o la American Psychological Association, donde psicólogos de muchos tipos
presentan trabajos; y de especialistas, dedicadas a un área más específica de la disciplina,
como la psicología cognitiva o la del desarrollo. Sin embargo, aun en las conferencias más
generales suele haber simposios que contienen varios artículos sobre un mismo tema.
Hay problemas con el uso de conferencias como fuente de información. En primer lugar,
tienden a ser anuales y, por tanto, tal vez no coincidan con el momento én que necesita los
datos. Un inconveniente mayor estriba en que quizá no tengan artículos sobre el área de in-
terés. Sin embargo, los extractos de las conferencias anteriores resultan útiles para identificar
quiénes son los investigadores activos en un área determinada. Una tercera contra_!iedad: a
menudo, otros psicólogos expertos en el área no han evaluado el trabajo que se reporta en
una conferencia; por lo mismo, debe tratarse con mayor cuidado.
De acuerdo con lo expuesto, es más probable que encuentre información acerca de in-
vestigaciones previas en artículos de revistas académicas o en libros. Los psicólogos tienden
a seguir lo que se realiza en otras ciencias y publican primero su estudio como artículos.
Por lo general, otros investigadores revisan los artículos y se publican solamente los que se
consideran bien hechos y de interés.
Una vez que se han vuelto suficientemente reconocidos, los investigadores pueden ser
invitados a contribuir con el capítulo de un libro sobre el tema. Cuando han realizado inves-
tigación suficiente, pueden producir un libro dedicado a su propio trabajo (a lo cual suele
llamarse monografia de investigación). Otra posibilidad consiste en que escriban una obra
general que presente su estudio y el de otros colegas en su área de interés. La fuente más ge-
neral será un libro de texto dedicado a un campo más amplio de la disciplina, como la psico-
logía social, o incluso uno de texto general atinente a todas las áreas de la psicología.
Casi todos los libros requieren cierto tiempo para publicarse y, en consecuencia, tienden
a presentar investigación ligeramente anacrónica. Si bien hay un periodo entre la remisión
de un artículo a una revista y su publicación, las revistas son la mejor fuente para los estu-
dios más actualizados.
Las revistas, igual que las conferencias, pueden ser generales --como la Brltish Jour-
nal of Psychology o el Psychological Bulletin- o más específicas -por ejemplo, Cog-
nition y Memory and Language. Algunos artículos están disponibles en Internet, lo cual
quizá sea un fenómeno creciente una vez que se resuelvan los problemas sobre derechos .
de autor.
Es posible identificar la investigación relevante si se busca en ejemplares de revistas,
pero una estrategia más eficiente consiste en utilizar algún tipo de base de datos de inves-
tigaciones.
. --
_____________________L_a_s_e_ta~p_a_s~p_re_li_m_in_a_r_
es_d_e__
la_i_nv_e_s_
ti~ga_c_ió_n____________~¡-21
1
- -
~L--------------~'~nv~e~s~ti~ga~c~io~
·n~c~u=a~nt~it~a~ti~v~a~e~n~p~si~co~t=og~í=a____________________
Social Science Citation Jndex. Social Science Citation lnde.r: (SSCI) se publica mensual-
mente y permite hallar referencias como en Psychological Abstracrs (salvo que no propor-
ciona extractos, sólo las fuentes del material). Sin embargo. tiene el beneficio adicional de
que usted puede encontrar quién ha citado un trabajo en particular en sus referencias. De esa
manera, si localizó un estudio y desea ide,ntificar quién ha trabajado también en el área,
puede utilizar tal estudio a fin de dar con otros trabajos en el mismo campo.
Como Psychological Abstracts, hay versiones impresas y en disco compacto del SSCI.
También se tiene Science Citation lndex (SCI), que podría resultar útil.
Curren! Contents. Hay varias versiones de Curren! Contents para diferentes grupos de disci-
plinas. La más relevante para los psicólogos es la de ciencias sociales y del comportamiento,
que incluye ámbitos como psicología, educación, psiquiatría, sociología y antr?pología.
Curren/ Contents se publica semanalmente y es una lista de las páginas de los índices de
contenido de las revistas académicas y algunos libros recién publicados.
Hay una versión para computadora disponible para Macintosh y computadoras compa-
tibles con IBM. La primera le permite buscar por palabras clave y le proporciona la dirección
de la persona de quien se obtuvo el artículo. La opción adicional (Request-a-print) !e per-
mite imprimir una trujeta posta} para el autor donde le pide una reimpresión del artículo.
1
Préstamos interbibUotecarios
. En ocasiones identificará un artículo o un libro que su biblioteca no tiene. En algunas bi-
bliotecas es posible pedir prestado un ejemplar de dicho texto mediante lo que se denomi-
na préstamo interbibliotecario. Consulte con el bibliotecario si la opción está disponible y
cuáles restricciones existen con relación al número que puede tener. si debe pagar por ellos
y, de ser así, cuánto le costarán.
Concentración en un área
especifica de investigación
Quizá en el proceso de búsqueda de investigación previa deba ampliar su conocimiento de
un área. no sólo del asunto de interés sino también de los tipos de métodos y diseños emplea-
dos. Ello ha de ayudarle a centrarse en un aspecto específico del ámbito que le atrae y que
juzga preciso explorar. Además, ahora se encuentra en mejor posición para considerar la fac-
tibilidad de investigar en el área. Habrá \'isto \'arios aspectos del estudio que podrían restrin-
girlo: la posible necesidad de equipo especializado. como un registrador de movimientos
oculares, y el número de participantes que se considera imprescindible para cierta pieza de
investigación. Además. tendrá una idea del tiempo que se requerirá para llevarla a cabo.
______________________L_a_s_e_ta~p_a_s~p_
re_l_
im_i_n_
ar_e_s_d_e_l_
a _in_v_e_st~ig~a_c_ió_n____________~¡-:23
Una consideración adicional que debe motivarlo a estrechar su atención radica en que,
si busca incluir demasiados aspectos de un área en una parte de una investigación, estará co-
metiendo un error de novatos. Si pretende abarcar mucho, dificultará la interpretación de
los resultados. Por lo general, un proyecto de investigación de gran escala requiere varias pie-
zas de pequeña escala que, al integrarse, comprenden un ámbito mayor. Por ello, le sugie-
ro que no se tome demasiado ambicioso; vale más una pieza de investigación simple, bien
hecha y fácil de interpretar que una muy ambiciosa que no arroje resultados claros; el co-
nocimiento científico crece en incrementos pequeños.
Medición en psicología
Podría considerarse que los fenómenos que mide el psicólogo se agrupan en tres catego-
rías: conducta no verbal abierta, verbal y no verbal encubierta.
Conducta verbal
La conducta verbal puede tener diversas formas. Los investigadores pueden grabar el lengua-
je que se da de modo natural. Como opción, pueden obtenerlo en forma oral de una entre-
vista o escrita mediante un cuestionario o una prueba de personalidad.
Conducta encubierta
Conducta encubierta se refiere a la no observable directamente; por ejemplo, respuestas
psicológicas (como el ritmo cardiaco).
Como psicólogos, nos interesa toda la diversidad de la experiencia humana: conduc-
ta, pensamiento y emoción. Sin embargo. las mediciones que he delineado se hallan des-
provistas de pensamiento y emoción. Podemos inferir la existencia y la naturaleza de tales
factores sólo a partir de nuestras mediciones. Por ejemplo, podríamos utilizar el ritmo cardia-
co para medir la tensión psicológica de nuestros participantes. Empero, no estaremos seguros
de que hayamos medido en realidad las entidades de nuestro interés, pues no hay una
relación perfecta, uno a uno, entre tales sistemas de medición y la emoción o los pensa-
mientos. Por ejemplo, el ritmo cardiaco también indica el nivel del ejercicio fisico de una
persona.
Podria considerarse que al medir la conducta verbal nos acercamos al pensamiento y a la
emoción. Sin embargo, dicha conducta ha de tratarse con cuidado. Aun cuando la gente trate
de ser honesta, hay por lo menos dos tipos de conducta verbal sospechosos. En primer lugar,
si pedimos a los participantes que confíen en su memoria, la información que proporcionen
podría provenir de recuerdos no claros. En segundo sitio, hay formas de conocimiento, lla-
mado a veces conocimiento de procedimientos, a las que no tenemos acceso directo.
Por citar un caso, como ciclista no puedo decirle cómo andar en bicicleta. Cuando qui-
se enseñar a mis hijos no les di una plática ilustrada y luego esperé que subieran a sus ve-
hículos y supieran conducirlos. La única manera en que aprendieron fue que yo corriera
junto a ellos, los soltara por un momento y permitiera que trataran de mantener el equili-
brio. A medida que los periodos se prolongaban, sus cuerpos empezaron a aprender a andar
en bicicleta. Por ello, disponer de un aceptable sistema de medición de conducta verbal se
relaciona por lo general con el presente y con el conocimiento a qu e los participantes tie-
nen acceso (consulte Nisbett y Wilson, 1977; y Ericsson y Simon, 1980).
personalidad. Como alternativa, tal vez desee medir algo que no se ha medido antes o no co-
-
mo usted lo pretende, en cuyo caso diseñará sus propios sistemas de medición.
Sea cual fuere el sistema de medición que considere, hay dos cuestiones por atender:
¿los sistemas de medición son confiables?, ¿resultan válidos? Para responder de manera
más completa ambas preguntas se requiere un grado de detalle estadístico que aún be de
proporcionar. Por lo mismo, en esta etapa daré una explicación breve de los dos conceptos
y pospondré la exposición más íntegra hasta el capítulo 19.
Confiabilidad
Por confiabilidad entendemos el grado en que el sistema de medición produciría el mismo
resultado de una ocasión a otra. Hay por lo menos dos tipos de confiabilidad. En primer lu-
gar, si se toma la medición de un pa1ticipante dos veces, un sistema de medición confiable
producirá un resultado similar. Por tanto, quien en dos ocasiones toma una prueba de cocien-
te intelectual (IQ) con gran confiabilidad debe lograr la misma puntuación, dentro de ciertos
límites. ingún sistema de medición psicológico es del todo confiable y, por tanto, necesita
conocer la confiabilidad del que use para acceder al grado de error que le es inherente. Si
la persona logra un lQ algo mayor en la segunda oportunidad que toma la prueba, querrá
saber si ésta representa una mejora real o pudo deberse a la falta de confiabilidad de la
prueba.
Si desarrolla un sistema de medición, ha de buscar su confiabilidad utilizando uno de
los métodos descritos en el capítulo 19. Si aplica un sistema de medición psicométrico exis-
tente, como una prueba de IQ o una de personalidad. el manual de la prueba debe informar
sobre su confiabilidad.
Un segundo tipo de confiabilidad tiene que ver con los sistemas de medición que su-
ponen cierta cantidad de juicio de los investigadores. Por ejemplo, si le interesara clasifi-
car la conducta no verbal de los participantes, tal vez querría asegurarse de que usted y sus
colegas son congruentes al aplicar su clasificación. Este tipo puede denominarse conjiabi-
lidad intrajuez, si comprueba la congruencia de una persona en la clasificación del mismo
comportamiento en dos ocasiones. Se denomina conjiabilidad interjuez si en la comproba-
ción dos o más jueces clasifican el mismo comportamiento de igual manera.
Si elige ese tipo de sistema de medición subjetiva, debe verificar las confiabilidades
intra e interjuez antes de emplearlo. Es común que los jueces necesiten estar capacitados y
que el sistema clasificatorio precise de refinación a la luz de desacuerdos no resueltos. Ello
tiene la ventaja de hacer explícita cualquier clasificación, en lugar de confiar en "una co-
razonada".
Desde luego, hay sistemas de medición diseñados para recoger cambios y, por tanto, no
querrá una calificación consistente de una ocasión a otra. Por ejemplo, en el área de la ansie-
dad se reconocen dos tipos: ansiedad específica del estado y ansiedad de rasgo. La primera
______________________L_a_s_e_ta~p~a~s~p~re~l~im~l~
·n~a~re~s~d~e_l~a_i_nv_e~s_ti~ga~c~io~'n____________~¡-:27
debe modificarse según el estado de la persona. Por tanto, el sistema de medición produ-
ci,.á una calificación similar cuando el sujeto atraviesa por el mismo estado, pero debe
mostrarse sensible para identificar cambios en la ansiedad entre estados. Por otra parte, la
ansiedad de rasgo será relativamente constante.
Validez
Hay varios tipos interrelacionados de validez dP- un sistema de medición que deben revi-
sarse. Sin embargo, todos atienden el mismo punto: si se mide lo que los investigadores
pretendían.
Validez de constructo
Si un sistema de medición tiene una validez de constructo elevada, evalúa bien algún cons-
tructo teórico. En realidad, muchos sistemas que utilizan los psicólogos evalúan entidades
teóricas, como la inteligencia o la extraversión. A fm de verificar la validez de constructo de
un sistema de medición es necesario hacer explícito el constructo. Éste suele ser el punto
en que una definición psicológica empieza a diferir de una definición de lego sobre el mis-
mo término, pues el uso que le da quien no es psicólogo resulta demasiado impreciso. Ello
no significa que los psicólogos estarán de acuerdo con la definición. Por ejemplo, según cier-
tos psicólogos, las pruebas de IQ prueban la inteligencia, mientras que otros aseveran sim-
plemente que las pruebas de IQ prueban lo que las pruebas de IQ prueban.
Es posible proporcionar hechos adicionales sobre la validez de constructo si el sistema
de medición muestra tanto vínculos con pruebas de constructos relacionados -que conver-
gen con ellos (validez de constructo convergente)- como una diferencia con los sistemas
de medición de constructos no relacionados -divergente de ellos (validez de constructo
divergente).
Convergencia. Por ejemplo, si creemos que la inteligencia es una habilidad general y he-
mos diseñado un sistema de medición numérico de ella, nuestras mediciones deben producir
un patrón similar al de las pruebas de inteligencia verbal.
Validez de contenido
Validez de contenido se refiere al grado en que una medida abarca toda la gama de com-
portamiento de la habilidad que se mide. Por ejemplo, si diseñamos un sistema de medición
de destreza matemática, tendría baja validez de contenido si comprendiera sólo medicio-
nes de la capacidad para sumar. Una forma de comprobar la validez de contenido de un siste-
ma de medición estriba en preguntar a los expertos del campo si cubre todo lo que esperan. No
obstante, vale la pena comprobar si ciertos aspectos de un sistema de medición son redun-
dantes y pueden omitirse porque miden lo mismo. Siguiendo con el ejemplo de las mate-
máticas, si pudiera mostrarse que la habilidad para sumar indica la pericia para realizar con
éxito formas más elevadas de matemática, entonces no hay necesidad de incluir el conte-
nido completo de los cálculos matemáticos en el sistema de medición de la destreza mate-
mática. Por tanto, podría idearse un sistema de medición más corto y rápido.
_j¡--29
.. __s_e_ta~p_a_s~p_re_l_im_,_·n_a_re_s_d_e_l_a_in_v_e_s_
______________________La ti~
ga_c_io_
·n____________
Validez de cr;terio
La validez de criterio aborda la cuestión de si un sistema de medición satisface ciertos prin-
cipios. En general, esto significa que debe producir una pauta similar a la de otro sistema
de medición. Hay dos tipos de criterios que pueden considerarse: concurrente y predictivo.
Validez concurrente. Un sistema de medición tiene validez concurrente si produce un re-
sultado similar al de un sistema existente que se toma más o menos al mismo tiempo. Por
tanto, si diseño una prueba de inteligencia, puedo comprobar su validez concurrente si ad-
ministro una prueba establecida de inteligencia al mismo tiempo.
Este procedimiento depende evidentemente de un sistema de medición preexistente y
válido contra el cual puede comprobarse la validez del nuevo sistema. Ello plantea la pregun-
ta de por qué se desearía otra prueba de lo mismo. En varias situaciones se requeriría una
prueba diferente. Una razón común es el deseo de producir un sistema de medición cuya
administración precise de menos tiempo y que resulte menos oneroso para los participan-
tes; es más probable que la gente permita que se le mida si la tarea se realiza más rápido.
Otra razón para diseñar un sistema de medición adicional al existente es que habrá de ad-
ministrarse de manera distinta de la originaL Supóngase que el sistema preexistente se uti-
lizaba en entrevista personal, como -la efectuada por un psiquiatra, y ahora se pretende usarlo
cuando el investigador no está presente (como en un cuestionario). Como alternativa, -se
tiene la necesidad común de un sistema de medición que pueda aplicarse a un grupo de ma-
nera simultánea, en lugar de hacerlo de modo individuaL
Validez predictiva. Un sistema de medición tiene validez predictiva si vaticina correcta-
mente algún estado de las cosas. Por tanto, si se ideó un sistema de medición de aptitud aca-
démica, podria utilizarse para seleccionar aspirantes a la universidad. El sistema tendria
buena validez predictiva si las calificaciones que proporciona pronostican el grado alcanza-
do por los estudiantes.
Con ambos tipos de validez se necesita comprobar que no existe contaminación del
criterio, lo cual significa que quienes proporcionan los criterios deben desconocer los re-
sultados de las mediciones. Si un psiquiatra o un maestro conocen los resultados de la me-
dición, ello podría afectar la manera en que tratan a las personas cuando toman sus propias
mediciones. Tal efecto sugeriría que el sistema de medición tiene validez de criterio mejor
que la real.
estaban más disponibles para los investigadores. lo cual suele significar estudiantes universi-
tarios de psicología. Sin embargo, aun en esa muestra restringida hay casi siempre el intento
de asegurarse de que los hombres y las mujeres estén representados de manera equitativa.
El número de participantes que utilice en un estudio depende del diseño que emplee al
menos por tres razones. La primera probablemente consista en la naturaleza de sus sujetos,
la cual es una directriz práctica. Si estudia una población especial, digamos, personas con
un tipo especial de daño cerebraL el tamaño de la muestra estará restringido a su disponi-
•• bilidad. Un segundo aspecto práctico estriba en el deseo de los participantes de tomar parte
en el trabajo; cuanto más onerosa sea la tarea, menores colaboradores obtendrá. Una terce-
ra guía puede hallarse en las estadísticas que empleará para el análisis respectivo. Como se
verá en el capítulo 13, es posible calcular cuántos participantes necesita para un diseño deter-
mmado con el propósito de dar a la investigación la oportunidad de respaldar su hipótesis si
resu lta correcta. No hay razón para reducir la probabilidad de dar sustento a una hipótesis
correcta si usa muy pocos sujetos. De igual forma. utilizaría una muestra innecesariamen-
te grande si no calcula cuántos de ellos requiere su diseño.
El procedimiento
El procedimiento es la manera en que se lleva a cabo el estudio; cómo se toman las deci-
siones de diseño. Ello incluye lo que se dice a los participantes. lo que éstos realizan, en
qué orden lo hacen y si se practica un análisis posterior con ellos (consulte el capítulo 1).
Cuando hay más de un investigador o si quien realiza el estudio no lo diseñó, es me-
nester que las personas que tratan con Jos participantes tengan claro el diseño y las necesi-
dades de ejecutarlo de la misma manera. Al efecto, ayudaría que se tuvieran instrucciones
estandarizadas para los investigadores y los sujetos.
Con frecuencia, los investigadores neófitos se preocupan porque tener varios colegas
en un proyecto puede invalidar los resultados, debido, en primer lugar, a que son diferen-
tes personas y, en segundo, a que cada investigador puede probar a los sujetos en un lugar dis-
tinto. Si tales variaciones no cambian sistemáticamente con los aspectos del diseño, esto no
supondrá un problema; si acaso, fortalecerá el trabajo. Un ejemplo de variación sistemá-
tica sería que un investigador sólo probara gente en una condición del estudio o un tipo de
persona, como nada más varones. En esas circunstancias, cualquier resultado sería una con-
secuencia de tales limitaciones. Sin embargo, si se erradicaron los problemas potenciales,
habrá resultados más generalizables a otras situaciones que lo conducido por un investiga-
dor en un lugar.
Por último, independientemente del método que se emplee en la investigación es im-
portante realizar un estudio piloto.
~L---------------'~n_ve~s_ti~ga~c~io~·n_c~u~a_n~ti~ta~tl_·v~a~e~n~p~si~c~ol~o~gí~a____________________
-
Estudios piloto
Un estudio piloto es cierto ensayo del estudio que debe efectuarse en una muestra más pe-
queña de la que se utilizará en la versión final de la investigación. Independientemente del
método que adopte, resulta esencial un estudio piloto previo, cuyo propósito estriba en
comprobar que los aspectos básicos del diseño y el procedimiento funcionen. Por tanto, de-
seará saber si los participantes comprenden las instrucciones que se les dictan y si su sistema
de medición tiene validez patente o, en su caso, si la historia para encubrimiento que utili-
za parece plausible. En un experimento estará comprobando que los aparatos funcionen co-
mo se pretendía y que los sujetos puedan utilizarlos. Por último, puede formarse una idea
de cuánto tiempo tarda el procedimiento con cada participante de modo que puede indicar
a las personas el tiempo que se les requerirá, cuando les pida que tomen parte, y permitir
tiempo suficiente entre uno y otro. Resulta muy útil un análisis posterior con la gente que par-
ticipe en el estudio piloto, pues sus ideas acerca de éste contribuirán a revelar cualquier falla,
incluidas posibles características de demanda.
Sin la información obtenida de un estudio piloto, podría presentársele un dilema si des-
cubre fal las durante la investigación: modificar el diseño a media tarea o seguir adelante
sin importar la deficiencia. El cambio del diseño durante el proyecto significa desde luego
que quizá no se trate igual a los participantes en las mismas condiciones. Ello representa la
adición de una fuente extra de variación en los resultados, lo cual plantea un problema para
la interpretación. Por otra parte, continuar con un diseño que sabe presenta inconsistencias
es simplemente una pérdida de tiempo para usted y los sujetos. Evítese dicho dilema: efec-
túe un estudio piloto.
Resulta particularmente importante practicar un estudio piloto cuando utiliza un siste-
ma de medición que ha diseñado, como en un cuestionario o en diseños donde se precisa
capacitación en la toma de mediciones. En los capítulos 5 y 7, dedicados al planteamiento
de preguntas y a observaciones, describiré cómo efectuar los estudios piloto requeridos para
esos métodos.
El estudio piloto debe emprenderse en un número pequeño de personas de la población
objetivo. No tiene mucho caso comprobar si el diseño funciona con individuos de una po-
blación distinta de la correspondiente a la muestra. Como en la mayoría de los casos, no
debe utilizar a tales sujetos otra vez en su estudio principal. El número que use estará de-
terminado por la disponibilidad de participantes de su población. Por tanto, si la población es
pequeña o si tiene acceso limitado a miembros de ella (por ejemplo, gente que nació con
ceguera total), podría elegir sólo a dos o tres en el estudio piloto. No obstante, se preferirá
que pruebe cada condición requerida por el estudio.
En el capítulo 13 se describe también una ventaja adicional del estudio piloto: le ayu-
dará a decidir el tamaño apropiado de la muestra para su estudio principal.
Después de completar dicho estudio puede introducir cualquier modificación indispen-
sable en el diseño y luego emprender la versión final del estudio.
_____ r~
______________________L_a_s_e_ta~p_a_s~p_re_l_im_T_·n_a_re_s_d_e_l_a_in_v_e_st_i~ga_c_io_'n____________~¡-:33
Resumen
Antes de emprender un proyecto de investigación estrechará su campo a un aspecto espe-
cífico del área elegida. Puede apoyarse leyendo trabajos anteriores de ese ámbito y tal vez
mediante charlas con expertos en la materia. Tiene que elegir uno de los métodos descritos
en el capítulo 1, un diseño de los referidos en el capítulo 4 y el sistema o los sistemas de
medición por aplicar durante la tarea, así como comprobar que éstos son confiables y váli-
dos. Ha de seleccionar a quién estudiará. lo cual depende en parte del método que emplee.
Por último, debe practicar un estudio piloto de su diseño. Una vez que haya tomado esas
decisiones y completado el estudio piloto, estará listo para llevar a cabo la versión final de
su investigación.
En los dos capítulos siguientes se considerarán aspectos de las variables participantes
en la investigación psicológica y los diseños más comunes empleados al respecto. Además,
se explicará la importancia de comprobar si cualquier hallazgo de un proyecto de investi-
gación que emplea un diseño específico puede generalizarse a personas y ambientes distintos
de los usados en el estudio y si puede afirmarse que ciertos diseños identifican las relacio-
nes de causa y efecto en él.
••
*
--
3
Las variables y la validez
de los diseños de investigación
Introducción
En el presente capítulo se describirán los tipos de variables que intervienen en una investi-
gación. Luego se explicará por qué los psicólogos necesitan considerar los factores de su
estudio que determinan si es posible generalizar los hallazgos a situaciones que rebasan el al-
cance de su trabajo original. Se explorarán entonces los aspectos de la investigación por
considerar cuando se abordan las causas de la conducta humana. Por último, se analizará có-
mo se formulan hipótesis.
Variables
Las variables son entidades que pueden tener más de un valor. Los valores no tienen que
ser forzosamente numéricos. Por ejemplo, la variable género puede tener el valor masculi-
no o femenino.
Variables independientes
Una variable independiente (VI) es la que se considera que puede afectar a otra. Por ejem-
plo, si creo que la edad influye en la inteligencia, la trataré como una VI con efectos so-
bre la variable inteligencia.
En experimentos, una VI es la que los investigadores han manipulado para ver sus efec-
tos sobre otra variable. Por ejemplo, en un estudio que compara tres métodos para enseñar
34
_________________L_as_v_a_r_ia_
b_le_s~y_la__va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s _d e__in_v_es_t~ig~a_ci_ó_
n ______~¡-35
a leer se instruye a los niños a reconocer palabras de vista (el método de palabra comple-
ta), a aprender a reconocer el sonido de partes de una palabra común a varias de ellas (el
método fonético) o por una combinación de ambos métodos. En el caso de referencia, se
ha manipulado la VI (método de enseñanza) que tiene tres valores posibles en el estudio:
palabra completa, fonético o mixto. A los investigadores les interesa saber si la enseñanza
del método tiene algún efecto en la variable habilidad de lectura, es decir, si diferentes mé-
todos de enseñanza producen desempeños distintos en la lectura.
El término nivel se utiliza para describir uno de los valores que una VI toma en un estu-
dio concreto. Por tanto, en el estudio anterior, la VI (método de enseñanza) tiene tres nive-
les: palabra completa, fonético o mixto. Por otra parte, en un estudio que compara hombres
y mujeres. la VI (género) cuenta con dos niveles: masculino y femenino.
Con el término condición se describe cierto nivel de una VI. El estudio anterior de mé-
todos de enseñanza tiene una condición de palabra completa, una fonética y una mixta.
Las VI son de dos tipos básicos, fijas o aleatorias, según la manera en que se seleccio-
nan los niveles de la variable.
Variables fjjas
En una variable fija, el investigador ha elegido los niveles específicos por utilizar en el estu-
dio. Por consiguiente, en el experimento sobre la lectura la variable (métodos de enseñan-
za) es fija.
Variables aleatorias
Una variable aleatoria es una donde se han seleccionado aleatoriamente sus niveles entre
un conjunto mayor de niveles posibles. Por tanto, si tuviera una lista completa de todos los
métodos posibles para la enseñanza de la lectura y hubiera elegido tres al azar para incluir-
los en el estudio, ahora el método de enseñanza sería una variable aleatoria.
Resulta poco probable que quisiera elegir al azar los métodos de enseñanza; el siguien-
te es un ejemplo más apegado a la realidad. Supongamos que me interesa saber el efecto
de escuchar cintas de relajación de diferente duración sobre los niveles de tensión. En el
estudio, la duración de la cinta sería una VI, cuyos niveles puedo elegir de dos maneras.
Primero, puedo decidir que tengan una duración de 5, 10, 15 y 30 minutos. La duración de
la cinta sería entonces una VI fija. Otra posibilidad es que elija al azar cuatro duraciones
entre 1 y 30 minutos. Esto daría una VI aleatoria.
La decisión de utilizar variables fijas o aleatorias tiene dos consecuencias. En primer
lugar, el uso de una fija evita que los investigadores traten de generalizar a otros niveles
posibles de la VI, mientras que el empleo de una aleatoria permite más generalización. En
segundo lugar, el análisis estadístico puede verse afectado por el uso de una variable fija o
aleatoria.
-
~L_______________I_nv_e_s_
t i~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_
co_l~
og~í_a____________________
Variables dependientes
Una variable dependiente (VD) es aquella donde una independiente puede tener un efecto,
es decir, el valor de la VD depende del nivel de la VI. Por tanto, en el estudio de la lectu-
ra, una medida de la habilidad para leer sería la variable dependiente, mientras que en el
experimento de las cintas de relajación, una medida de la tensión sería la dependiente. Ob-
serve que en cada uno de estos ejemplos la VD es la medición proporcionada por los par-
ticipantes en el estudio: una calificación de lectura o una de tensión.
Variables de confusión
Algunas variables afectan la relación entre las VI y las VD que se buscan; se denominan
de confusión. Por ejemplo, en el estudio de métodos de enseñanza, tal vez diferentes pro-
fesores han tomado gmpos distintos. Si los instmctores tienen diversos niveles de habili-
dad en la enseñanza de la lectura, entonces cualquier diferencia en la habilidad de lectura
entre los niños en los tres procedimientos referidos puede obedecer a las habilidades del
personal docente y no a éstos.....Por tanto, la habilidad de los profesores es una variable de
confusión. En el estudio de relajación podría suceder que quienes reciben la cinta de ma-
yor duración estén inherentemente menos relajados que los que reciben la más corta y es-
to enmascararía cualquier mejora debida al hecho de escuchar una cinta más larga. En tal
caso, el nivel de tensión inicial del participante es una variable de confusión.
Hay maneras de tratar de reducir los efectos de las \'ariables de confusión; muchos de
los diseños descritos en el capítulo siguiente se desarrollaron con tal objetivo.
_________________L_as_v_a_r_ia_b_Le_s~y_la__ in_v_es_t~ig~a_ci_ó_n______~¡-37
va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s_de__
Validez externa
Por valide=externa se entiende la posibilidad de generalizar los hallazgos de una investi-
gación. Hay similitudes entre este tipo de validez y la ecológica. En dos áreas importantes
la posibilidad de generalización podría ser cuestionable. En primer lugar, puede haber du-
da sobre el grado en que las condiciones concretas del estudio permiten generalizar sus re-
sultados a otras circunstancias (las tareas requeridas de los participantes, el ambiente en
que tuvo lugar el trabajo o el tiempo en que se llevó a cabo éste). En segundo sitio, podemos
poner en duda si aspectos de los participantes permiten que los resultados de un estudio se
generalicen a otras personas (si son representativos tanto del grupo de que provienen como
de un conjunto más amplio).
Tiempo. Algunos fenómenos pueden verse afectados por la hora del día; por ejemplo, jus-
to después de comer. En tal caso, si se condujo el estudio sólo a esa hora, los resultados no
se generalizarían a otros horarios. Una posibilidad más estriba en que un estudio previo podría
producir resultados válidos en su momento, pero que dejan de ser generalizables debido a
los acontecimientos subsecuentes. Por ejemplo, las primeras investigaciones donde se some-
tía a la gente a privación sensorial revelaron que ésta se hallaba demasiado perturbada. Sin
embargo, con el advenimiento de la exploración de experiencias místicas, los participantes
empezaron a disfrutar la práctica, que se ha utilizado desde entonces con fines terapéuticos
(véase Suedfeld, 1980).
Réplica
Réplica es el término utilizado para describir la repetición de una pieza de investigación.
Las réplicas, que pueden realizarse en el mayor número de condiciones originales, ayudan
a saber si los hallazgos originales fueron únicos y resultado de sucesos aleatorios, pero sir-
ven de poco para mejorar la validez externa. Esto se apoya por réplicas que varían del estu-
dio original en algún aspecto. Por ejemplo, si se incluyen participantes de edad distinta o
si se usa un nuevo ambiente. De obtenerse resultados similares. aumentarán las posibilida-
des de generalización .
•
Selección de participantes
Hay varias formas de seleccionar participantes; se tratan con m~or detalle en el capítulo
11. Por el momento, baste apuntar que la selección aleatoria de participantes del grupo más
amplio que representan ofrece el mejor caso para la generalización al conjunto más amplio.
Así disminuye la probabilidad de que se tenga una muestra sesgada, pues cada elemento de
un grupo más vasto tiene la misma probabilidad de ser elegido. Definiré el azar de mane-
ra más completa en el capítulo referido, pero vale la pena mencionar ahora lo que no es el
azar. Si selecciono a las primeras 20 personas que encuentro en el comedor de la universi-
dad, no he conseguido una muestra aleatoria sino una de oportunidad (mi muestra es repre-
sentativa sólo de quienes van al comedor, a esa hora en particular y en ese día).
Validez interna
La validez interna es el grado en que un diseño demuestra con éxito que los cambios de
una VD obedecen a Jos de una VI. Por ejemplo, tal vez encuentre un vínculo entre ver te-
levisión y exhibir un comportamiento violento, de modo que quienes pasan mayor tiempo
frente a ella son más agresivos, y desea descubrir si mirar programas violentos toma violen-
ta a la gente. La validez interna tiende a ser más problemática en la investigación cuasiex-
lil-
perimental, donde no cabe asignar al azar participantes a diferentes condiciones, o en la no
a:.:
'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st_i~ga_c_io_
experimental, donde no se ha manipulado una VI sino que sólo se observó cómo se rela-
cionan dos variables (como ver televisión y exhibir comportamiento violento).
Maduración
Estudios que buscan un cambio con el tiempo en la VD, en los mismos participantes, en-
trañan el peligro de que haya ocurrido alguna otra modificación para éstos que también influ-
ya en dicha variable. Imagine que los psicólogos han establecido que hay un vínculo entre
la observación de la televisión y la violencia. Idean un programa de capacitación para re-
ducir la agresividad, lo implantan y luego valoran los niveles de violencia entre su muestra.
Encuentran que tal conducta se ha reducido con el tiempo. Sin embargo, han fallado en notar
que otros cambios ocurridos quizá influyeron en la reducción. Por ejemplo, varios partici-
pantes han encontrado amigos y. aunque ahora miran tanta televisión como antes, se hallan
en menos situaciones en las que podrían ser violentos. Por tanto, se han enmascarado los
posibles efectos prolongados de la televisión y se sostiene falsamente que el programa de
capacitación tuvo éxito.
H;stor;a
Tal vez un evento fuera del control de los investigadores produjo un cambio en la VD. A
consecuencia de la inquietud pública por el nexo entre televisión y violencia, es posible que
los ejecutivos de dicho medio hayan decidido modificar la programación y censurar los seg-
mentos agresivos. Una vez más. cualquier cambio del comportamiento violento se debería
p 0:
_________________L_as_v_a_n_·a_b_le_
s ~y_la__
va_l_id_e_z_d_e_lo_s_d_is_e_ñ_os__ in_v_es_t~ig~ac_i_ón________~¡-41
de__
a tales alteraciones, más que a cualquier manipulación de los investigadores. David Duo-
can (comunicación personal) encontró un ejemplo de los efectos de la historia cuando una
organización lo llamó para reducir el número de personas que abandonaban su empleo.
Ideó un programa que se implantó y descubrió que la rotación de personal se redujo. Sin
embargo, se dio cuenta de que durante el mismo tiempo la tasa de desempleo había aumen-
tado y que quizá ello afectaba los deseos de la gente de dejar el trabajo o su capacidad para
encontrar otro empleo.
Instrumentación
Si Jos investigadores miden las variables más de una ocasión, los cambios de los resultados
de cada medición pueden deberse a los de los sistemas de medición, más que al fenómeno
que se mide. Éste es un riesgo particular si se usó un sistema de medición diferente (por
ejemplo, tal vez se haya empleado otro sistema de medición de la violencia porque se con-
sideró que era mejor que uno anterior).
Pruebas repetidas
Las respuestas de los participantes al mismo sistema de medición pueden cambiar con el
tiempo; por ejemplo, con la práctica pueden volverse exper.tos en la realización de una tarea.
También cambiarían su actitud ante el sistema de medición. Por ejemplo, quizá se vuelvan
más honestos acerca de los niveles de violencia en que participan. Por tanto, los cambios
percibidos entre dos ocasiones cuando se toman las mediciones tal vez no se deban a ma-
nipulaciones de los investigadores sino a la manera en que los participantes han reaccionado
al sistema de medición utilizado.
Mortalidad o mortandad
El del título es un término poco afortunado y se refiere a la pérdida de participantes en el
estudio. En un estudio, algunos de los sujetos originales no toman parte en etapas posterio-
res. Es posible que quienes lo dejaron compartan cietta característica relevante para la jnves-
tigación. En tal caso, puede crearse una impresión falsa de la relación entre las variables
independientes y las dependientes, o es posible que una real se enmascare. Por ejemplo, si
los miembros más violentos de una muestra abandonan el experimento, se crearía una falsa
impresión de decremento de la violencia en la muestra. De acuerdo con esto, siempre debe-
mos examinar las características de quienes abandonaron un estudio para ver si comparten
alguna de relevancia para éste.
~L_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_
Compensación
Quienes tratan con los participantes pueden socavar el estudio, sobre todo si no son los psi-
cólogos, por la manera en que tratan a los participantes de diferentes grupos. Por ejemplo,
tal vez los investigadores busquen comparar un grupo que recibe cierta capacitación con
otro que no la obtiene. Los profesores que trabajan con este último tal vez lo traten, porque
no se le está dando el programa de capacitación de forma que mejore de algún modo su de-
sempeño. Ello presentaría la tendencia a reducir cualquier diferencia entre los grupos debida
a la capacitación.
Rivalidad compensatoria
Esto ocurre si un grupo realiza un esfuerzo adicional para ser mejor que el otro (por ejem-
plo, en un estudio donde se comparan los efectos de diferentes condiciones de trabajo en la
productividad).
_________________L_as_v_a_n_·a_b_le_s~y_la__ in_v_es_t~ig~a-ci_ó_n______~¡-43
va_l_id_e_z_d_e_lo_s_d_i_se_ñ_o_s_de__
Desmoralización
Lo inverso de la rivalidad compensatoria sería si un grupo sintiera que está perdiendo y se
esforzara menos de lo que haría habitualmente. Ello disminuiría de modo artificial los re-
sultados de tales personas.
Regresión a la media
Como expliqué en el capítulo 2, la mayor parte de los sistemas de medición son imperfec-
tos, están sujetos a cierta cantidad de error y, por tanto, no son confiables del todo. En otras
palabras, es poco probable que produzca idéntico resultado dos veces; por ejemplo, si el IQ
de alguien se mide dos veces y la prueba de IQ no es perfectamente confiable, entonces es
probable que la persona produzca una calificación algo diferente en ambas. El fenómeno
estadístico llamado regresión a la media se refiere al hecho de que, si el sujeto obtiene una
puntuación superior a la promedio de su población, cuando se le mida la siguiente vez es
probable que sus puntuaciones se aproximen más a la promedio, mientras que quienes ob-
tienen puntuaciones inferiores a éste la primera ocasión también tenderán a obtener unas
más cercanas al promedio en la segunda. En consecuencia, quienes obtienen puntuacio-
nes superiores al promedio tenderán a mostrar una caída entre las dos mediciones; quienes
las obtienen inferiores al promedio tenderán a mostrar un aumento en la puntuación.
Si se seleccionan participantes para asignarlos a diferentes niveles de una VI a partir
de su puntuación en algún sistema de medición, los resultados del estudio pueden sufrir la in-
fluencia de la regresión de la media. Imagine un estudio sobre los efectos de impartir clases
extra a gente con bajo IQ. En ese estudio, los sujetos se seleccionan entre una población con
un rango nom1al de puntuaciones de JQ y de otra con un rango bajo. A una muestra de cada
población se le aplica una prueba de IQ y a partir de los resultados se forman dos grupos
con IQ similares, uno que incluye individuos con IQ bajos de la población de IQ normal y
otro que incluye personas con los IQ más altos entre la población de IQ bajos. Las mues-
tras se han igualado de acuerdo con el IQ de modo que los que se encuentran en el grupo
de IQ normal actúen como grupo control, que no recibe tratamiento; en tanto, quienes se
encuentran en la población de IQ bajo reciben clases extra. Luego se mide otra vez el IQ
de ambos grupos. Por la regresión a la media, el IQ promedio de la muestra de la pobla-
ción de IQ normal habrá crecido hacia la media de esa población, mientras que el de la
muestra de la población de IQ bajo habrá disminuido hacia la media de su población. Por
tanto, aunque las clases adicionales tienen efectos benéficos, la calificación promedio de
los grupos se habrá acercado más y podría sugerir al investigador incauto que las clases no
han sido provechosas.
~L--------------~I~nv~e=s~ti~ga~c~io~
·n~c~u=a~nt~it=a~ti~v~a~e~n~p~si~co~l~og~í~a____________________
-
Mejoramiento de la validez interna
Muchas de las amenazas a la validez interna pueden reducirse con un grupo control que
no recibe tratamiento alguno. De esta manera, cualquier cambio con el tiempo de una VD
ocurrirá en un grupo de tratamiento sólo si la VI afecta la dependiente. Las amenazas que
incluyen cierto tipo de contaminac~ón entre grupos necesitan un análisis posterior más mi-
nucioso entre los participantes y quienes realizan el estudio (como los maestros que implan-
tan un p2.qucte de capacitación). Donde sea posible, la asignación aleatoria de participantes
a condiciones distintas disminuirá Jos riesgos de que la selección y la selección por madu-
ración constituyan una amenaza a la validez interna.
La elección de la hi pótesis
Una hipótesis explícita o un conjunto de hipótesis suele probarse en experimentos y a me-
nudo en estudios que emplean otros métodos de investigación. Cuando las hipótesis se eva-
luarán estadísticamente, hay un modo formal de expresarlas y probarlas. El procedimiento
consiste en formar lo que se denomina hipótesis nula e hipótesis alterna. La hipótesis nu-
la se establece de forma que la manipulación de la variable independiente no tenga efecto
sobre la dependiente. Imagine que los investigadores comparan los efectos de dos técriicas
terapéuticas en el nivel de tensión de los participantes (escuchar una cinta de relajación y
hacer ejercicio). La hipótesis nula, a menudo simbolizada como H 0, probablemente será de
la forma: "No hay diferencia, después de la terapia, en los niveles de tensión de Jos parti-
cipantes que escucharon una cinta de relajación y los que hicieron ejercicio". La hipótesis
alterna (HA), el resultado predicho por los investigadores, se conoce también como hipóte-
sis del investigador, hipótesis e.'!:perimental (en un experimento) o incluso H 1, si hay más
de una predicción.
Los investigadores propondrán sólo una hipótesis alterna por cada nula, pero pueden
elegirla entre tres versiones posibles. La distinción básica entre nipótesis alternas radica en
si son direccionales o no direccionales. Una no direccional (o bidireccional) es la que no
predice la dirección del resultado. En el ejemplo anterior, la alterna no direccional cobra-
ría la forma: "Habrá una diferencia entre los niveles de tensión de los participantes que expe-
rimentaron los dos regímenes terapéuticos". Por tanto, esa hipótesis predice una diferencia
entre ambas terapias, pero no la que resultará más benéfica.
Una hipótesis direccional (o unidireccional). en este ejemplo, puede ser de dos tipos.
Por una parte, puede establecer que •·tos participantes que recibieron la terapia de relaja-
ción estarán menos tensos que quienes practicaron ejercicio". Por la otra, puede establecer
que "los participantes que practicaron ejercicio estarán menos tensos que quienes recibie-
ron la terapia de relajación". Dicho de otro modo. una hipótesis direccional no sólo esta-
blece que habrá una diferencia entre los niveles de la VI sino que predice la dirección de la
diferencia.
__________________ La_s v_an_·ab_les~y_la_va_lid_ez_de
__ in_ve_st~
lo_s_d_is_e_ño_s_d_e__ ~ a_ció_n . ~¡- 45
______
Parece extraño que, para probar una predicción, los investigadores tengan ·que estable-
cer no sólo la predicción sino también una hipótesis nula que va contra ella. La razón estriba
en que resulta lógicamente imposible probar que algo es verdadero si puede probarse que
es falso. Por ejemplo, si mi hipótesis consiste en que me gustan todos los sabores de whisky,
entonces sin importar la cantidad de los que haya degustado, aunque los haya probado to-
dos a la fecha, siempre existe la posibilidad de que el siguiente que beba no me agrade; y
el ejemplo bastará para desaprobar mi hipótesis. De acuerdo con esto, si las pruebas no res-
paldan la hipótesis nula, se tomarán como soporte de nuestra hipótesis alterna; no como
prueba de la hipótesis alterna, porque ésa nunca se habría obtenido; sólo la apoyaría.
En el capítulo 1O mostraremos cómo se utiliza la estadística para decidir si la hipóte-
sis nula o la alterna es lo más cercano a la verdad.
Resumen
A menudo, los investigadores manipulan las variables independientes en su estudio y ob-
servan las consecuencias de ello sobre las dependientes. Así, deben tener en cuenta otros
aspectos del experimento que pudieran inte1ferir los resultados obtenidos. Además, si desean
que sus hallazgos sean generalizables, considerarán la validez externa de sus diseños. Si
quieren explorar la relación causal entre la VI y la VD en su proyecto, tendrán en cuenta la
validez interna del diseño de su investigación. Quienes prueban una hipótesis explícita esta-
dísticamente tienen que formularla como hipótesis alterna y proponer una nula opuesta. La
investigación proporcionará entonces pruebas de que permitirá a los psicólogos elegir en-
tre las hipótesis.
En el capítulo siguiente se presentarán varios diseños de investigación y se señalará cómo
cada uno de ellos podría fallar en la satisfacción de los requisitos de validez interna. Sin
embargo, recuerde que ésta será un problema sólo si trata de establecer un vínculo causal en-
tre variables independientes y dependientes.
4
Diseños de investigación
y su validez interna
Introducción
En el presente capítulo se describirán diversos diseños empleados en investigación psico-
lógica y se definirán varios términos que se utiljzan para distinguirlos. Además, se porme-
norizarán versiones específicas de diseños y se evaluarán los problemas que evitan que cada
uno de ellos se utilice para responder si una variable dependiente recibe la influencia de las
independientes.
Las tres secciones del capítulo exigen un trato diferente. Debe leerse el resumen ini-
cial de los tipos de diseño y la terminología utilizada para distinguirlos antes de avanzar en
la obra. Sin embargo, el resto del capítulo, donde se dan ejemplos específicos de los illse-
ños, ha de tratarse más como referencia o en caso de que tenga mayor experiencia en in-
vestigación.
Tipos de diseños
Los diseños se clasifican de diversas maneras. Una consideración que debe guiar su elec-
ción del diseño y el sistema de medición será el análisis estadístico que empleará en los
datos. Es mejor tener claro esto antes de realizar el estudio, en lugar de descubrir más ade-
lante que tiene que hacer lo mejor que pueda con un mal diseño y con mediciones que no
le permiten probar sus hipótesis.
De acuerdo con lo anterior, elegí clasificar los diseños con base en los posibles objeti-
vos de la investigación y en el tipo de análisis que podría aplicarse a los datos derivados de
46
___________Dl_
·s_
eñ_o_s_d_e_i_n_ve_s_tl~
·g~a_
ci_ó_
n~y_s_u_v_a_li_
de_z_l_
·n_te_r_n_a_ _ _ _ _~¡--47
ellos. Así, habrá un vínculo entre los tipos de diseño y los capítulos dedicados a su expli-
cación. Los diseños presentan siete tipos básicos:
1. LSe toman mediciones de una sola variable en un individuo o en un grupo 'Por ejem-
plo, se mide el IQ de una persona o de un grupo. [ ales diseños deben utilizarse con
propósitos descriptivo~ la estadística desc1iptiva se aborda en el capítulo 9. Como al-
temativa,!!_ales diseños han de utilizarse para comparar a un individuo o grupo con
otros, como una población, para ver si son inusualesj En el capítulo 12 se trata este
tipo de análisis.
2. § e emplea una sola variable independiente (VI) con dos niveles y una dependiente
(VD)$ Estos diseños se utilizan para buscar 'diferencias en la VD entre los niveles
de la VI ~ Por ejemplo, cuando los investigadores comparan las habilidades de lec-
tura de niños a quienes se enseña con dos técnicas. En el capítulo 15 se presenta el
análisis de tal diseño.
3. ¡1e emplea una sola VI con más de dos niveles y una VD_,_: Se trata de una extensión
del tipo de diseño anterior, que podría incluir la comparación ·de las habilidades de
lectura de niños a quiénes se enseñó con tres técnicas. El análisis de tales diseños obra
en el capítulo 17.
4. ~terviene más de una VI y una so1a VQ~ Por ejemplo, cuando una VI es una espe-
cie de problema de razonamiento con tres niveles (verbal, numérico y espacial) y
una segunda VI es el género, con el número de-problemas resueltos como la VD.
-
Igual que con los diseños 2 y 3,@ s investigadores buscarían diferencias en la VD
entre los niveles de las VI.•En el capítulo 17 se explican tales diseños.
5. Una versión del diseño anterior se presenta cuandcU.?s investigadores tienen inte-
rés en descubrir cuán apropiado sería utilizar mediciones (tratadas como VI \como
desempeño escolar y motivación de los estudiantes, l.Para predecir el grado univer-
sitario (tratado como una VD) que alcanzarán ésto . El análisis de esta versión del
diseño se incluye en la segunda mitad del capítulo 20.
Los primeros cinco tipos de diseño suelen describirse como univariables porque contienen
una sola VD.
6. Los diseños utilizados para evaluar una relación entre dos variables.
6a. este diseño se describe como bivariable porque - evidentemente- incluye dos va-
riables, pero ninguna de ellas puede clasificarse necesariamente como VI o ~Por
ejemplo, cuando los investigadores buscan la relación entre el desempeño en el ba-
chillerato y en la universidad. El análisis del diseño está en el capítulo 19.
6b. §e trata fundamentalmente del mismo diseño, pero una de las variables se conside-
ra independiente (aunque no necesariamente se haya manipulado) y se utiliza para
'
~L________________In_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
enseña a los ruños con más de un método de lectura y los investigadores miden
un conjunto de habilidades, como las de leer, deletrear y completar frases. En el ca-
pítulo 21 se ofrecen descripciones breves de tales diseños y las técnicas usadas pa-
ra analizarlos.
Los diseños de los tipos 5, 6 y 7 se describen con pormenores en los capítulos relaciona-
dos con su análisis. Todos los diseños por describir en el resto del capítulo se utilizan para
ver si un individuo difiere de un grupo o si los grupos difieren entre sí. Típicamente, ~on
los diseños se busca determinar si el grupo tratado de cierta manera es distinto de uno al
que se trata de otra roanera_:_lor lo general,los miembros de un grupo proporcionan una so-
la estadística de resumen (a menudo, un promedio para el grupo) que se usa para compa-
rar con otros grupos.,_, Este enfoque considera las variaciones entre individuos del mismo
grupo un tipo de error. 1 Varios f~ctores contribuyen a que los individuos del mismo grupo
obtengan calificaciones diferentes:
l. Diferencias individuales (por ejemplo, en habilidad o en motivación).
2. La confiabilidad del sistema de medición que se utiliza.
3. Diferencias en cómo se ha tratado a los individuos en la investigación .
._Cuanto mayor variación de las puntuaciones presentadas en los grupos, tanto menor proba-
bilidad de que se detecten diferencias entre ésto~ Por tanto, donde sea posible, tales fuentes
de variación se reducirán al máximo en los diseños. \Jn diseño eficiente es aquel donde
pueden detectarse diferencias genuinas entre grupos~ o obstante, los investigadores de-
sean evitar la introducción de variables de confusión que produzcan diferencias falsas entre
diversos tratamientos o que enmascaren las genuinas entre éstos. Algunos intentos por con-
trarrestar las variables de confusión en diseños pueden aumentar las diferencias individua-
les dentro de grupos, lo cual lleva a producir diseños menos eficientes.
Terminología
Como en muchas áreas de los métodos de investigación, proliferan los términos útiles para
describir diseños. Lo que complica las cosas al novato es que diseños similares se detallan
1 Véase en Danziger ( 1990) una explicación acerca de cómo los psicólogos llegan a adoptar ese enfoque.
p
_____________________D_is_e_
ño_s_d_e_i_n_ve_s_ti~
ga_c_io_·n~y~su_v_a_h_.d_
ez__
in_te_r_n_a__________~¡-49
de maneras diferentes en ciertos casos y que distintos autores se refieren de varias formas
a los mismos diseños. Pormenorizaré los términos comunes y luego trataré de apegarme a
un conjunto consistente.
Réplica
En el capítulo 3 mencioné que la réplica, utilizada por lo menos en dos sentidos en la in-
vestigación, puede significar una nueva práctica de un estudio. Sin embargo, con el término
también ~describen diseños donde se trata de la misma manera a más de un participant~.
En consecuencia, quizá en un estudio de diferentes enfoques de enseñanza se tenga a más
de un niño en cada grupo. De otra manera, los resultados de la investigación dependerían
excesivamente de las características particulares de la muy limitada muestra que se empleó.
La mayoría de los estudios supone algún tipo de réplica, pues ésta tieneJa ventaja de
que permite utilizar en un análisis la puntuación promedio de los participantes para esa con-
dició~Ello disminuye el efecto de la variación entre puntuaciones que se presenta por di-
ferencias entre personas que se encuentran en la misma condición. No obstante, en ciertas
situaciones la réplica puede mantenerse al mínimo porque la tarea para los sujetos resulta
onerosa o lenta o porque hay muy pocos participantes disponibles (por ejemplo, en un es-
tudio de pacientes con un tipo raro de lesión cerebral).
Asignación de participantes
La mayor variación en la terminología se da en las descripciones de cómo se ha empleado
a los participantes en una pieza de investigación. Como punto de partida utilizaré, a guisa
de ejemplo, un diseño con VI con dos niveles.
ventaja que mejora su desempeño en la V.Q.1Por citar un caso, si los niños de un grupo
pertenecen de manera predominante a familias de clase media que estimulan la lectura,
podría significar que ese grupo tendrá una mejor actuación en una prueba de lectura, sin
importar el método de enseñanza empleado.
Las diversas maneras de evitar el peligro de confundir algún aspecto de los participantes
con la condición a que se asignan incluyen..._
el empleo de una base aleatoria para asignarlos a
grupo~Ello se preferiría si los investigadores desconocieran las habilidades de los sujetos,
pues les ahorraría aplicar una prueba antes de asignarlos. Con frecuencia, cuando se sabe
de características más evidentes, se opta por controlar de cierta forma el factor.
~n método de control no recomendable consiste en seleccionar sólo a personas con
cierto antecedente (por ejemplo, niños de clase media) para que participen en la investiga-
-'
ción. Un estudio de ese tipo tendría claramente limitada capacidad de generalización a otros
grupos; carecería de validez extern1J
Un enfoque más útil viene con el encabezado siguiente.
Bloques
La formación de bloques requierc\!_a identificación de los participantes con similitudes en
algún aspecto relevante y su integración en un subgrupo o bloque. Debe cerciorarse des-
pués que los miembros de un bloque se asignen aleatoriamente a cada uno de los niveles
de la VI en estudi2,¡ Los investigadores garantizan así que el mismo número de niños de los
grupos socioeconómicos experimentan todos los métodos de lectura.
~n modelo de la formación de bloques se presenta cuando individuos específicos se
igualan en un grupo a partir de una característic~ Por ejemplo, si se utiliza una puntuación
de edad de lectura para formar bloques de niños. La igualación se clasifica por lo menos en
dos tipos. ~ igualación de precisión requiere que se tengan subbloques de infantes con las
mismas edades de lectura, en un bloque, mientras que la igualación de rango supone que
los menores incluidos en cada bloque tengan edades de lectura similare~Los diseños de
bloque poseen mayor eficacia que los simples diseños entre sujetos porqueceuscan elimi-
nar la variabilidad debida al factor de formación,. Sin embargo, ~ecesitan un análisis algo
más complejo porque introducen una segunda VI: el bloque..:.)
Un problema con la igualación es que muchos factores pueden resultar significativos
para el estudio, de modo que1la igualación perfecta se vuelve dificil. Además, puede intro-
~ ~
ducir una etapa extra en la investigación: {hay que evaluar a los participantes en las variables
relevantes si aún no se cuenta con esa información,...Una manera de sortear este problema
consiste en aplicar la igualación extrema, donde la misma persona actúa como su propio
par. Se trata entonces de un diseño intrasujetos.
D_
______________________ is_en_
-o_s_d_e_l_
· n_ve_s_tl~
·g~a_
ci_ó_
n ~y_s_u_v_a_li_
d e_z_l_
·n_te_r_n_a__________~¡--51
Diseños intrasujetos
L§i._cada participante toma parte en ambos niveles de la VI, el diseño puede describirse co-
mo relacionado, pareado, de mediciones repetidas, intrasujetos o, según he llegado a oír
(y para mayor confusión), dependient:JSi se utiliza una VI con más de dos niveles, los tér-
minos preferidos tienden a ser intrasujetos o mediciones repetidas. Utilizaré intrasujetos
para describir tales diseños.
~e tipo de diseño plantea sus propios problemas, dos de los cuales son los efectos de
orden y los de acarreo ~
Observe que cada participante ha estado en todos los tratamientos y que cada uno de éstos
ha estado una vez en cada orden.
Hay 12 posibles cuadrados latinos para una tabla como la anterior, de tres por tres; de-
jaré a los escépticos que los descubran por sí mismos. De ser menester réplicas adiciona-
les, puede asignarse un orden a participantes extra para completar los niveles de la VI al
obtener un cuadrado latino nuevo para cada trío de sujetos. Por ello, cuando hay tres trata-
mientos, se precisa de más de 36 personas antes que haya que usar de nuevo cualquier cua-
drado latino. Quienes deseen leer más acerca de tales cuadrados pueden consultar a Myers
y Well (1991), quienes dedican un capítulo completo al tema.
-
-~- - -· - o zzd
..
------~ ~--
~~-~--
______________________
D_is_e_ in_v_es_t~ig~a_ci_ó_n~y_s_u_v_a_li_d_ez__
ño_s_d_e__ _r_n_a ____________~¡--53
in_te
Diseños cruzados
Los diseños cru=ados son aquellos donde cada nivel de una VI se combina con cada nivel
de los de otra. Por ejemplo, en un experimento sobre velocidad de reconocimiento de ros-
tros se tendría tal diseño de incluir éste todas las combinaciones posibles de los niveles de
las VI, orientación y familiaridad: caras conocidas puestas de cabeza, desconocidas de ca-
beza, conocidas orientadas correctamente y desconocidas colocadas correctamente. Estos
diseños permiten investigar interacciones entre las VI; es decir, cómo se combinan ambas
variables para afectar la VD. (Las interacciones se explican en el capítulo 17.)
Un ejemplo de diseño cruzado es el diseño intrasujetos estándar: se cruza a los parti-
cipantes con la o las VI; cada uno de éstos toma parte de cada condición.
Diseños anidados
Una desventaja de los diseños cruzados puede estribar en que necesiten una prueba exhaus-
tiva de cada combinación posible de los niveles de las VI, lo cual significa que la tarea to-
mará más tiempo a los participantes en un diseño intrasujetos o que el estudio requerirá más
participantes en un diseño intersujetos. Un enfoque alterno consiste en incluir el anidamiento
de una variable en otra, es decir, evitar que se cruce cada nivel de una variable independiente
con los de otra. En realidad, los diseños entre sujetos tienen pa1ticipantes anidados en los ni-
veles de la o las VI.
Algunos cuasiexperimentos pueden forzar el uso de diseños anidados. Por ejemplo, si
los investigadores desean comparar dos enfoques de enseñanza de las matemáticas (fonnal
y nuevo), quizá deban probar niños en escuelas que han adoptado uno de esos enfoques.
Por tanto, los colegios se anidarán en los enfoques. Los diseños que incluyen el anidado de
una variable en otra se denominanjerárquicos. Una desventaja de estos diseños radica en
que no permiten valorar la interacción entre VI (en este caso, la escuela y el enfoque de en-
señanza). Por consiguiente, el anidamiento jerárquico debe adoptarse sólo cuando el inves-
tigador está obligado a hacerlo o si no se sospecha interacción alguna.
- ·
~L_______________I_n_
ve_s_ti~ga_c_io_·n_c_u_a_n_ti_
ta_tl_·v_a_e_n~p_si_c_ol_o~gí_a____________________
Diseños equilibrados
Siempre que se usen diseños entre sujetos o mixtos, es aconsejable tener números iguales
de participantes en cada nivel de cada VL Ello produce lo que se denomina diseño bien
equilibrado y resulta mucho más fácil analizarlo e interpretarlo que uno mal equilibrado.
En el resto del capitulo se describen versiones específicas de los primeros cuatro dise-
ños identificados unas páginas antes. Como menciono en la introducción, recomiendo más
tratar este apartado como referencia que leerlo en una sentada.
Figura 4. 1. Estudio de caso de una sola vez que incluye medición única de una persona.
Figura 4.2. Estudio de caso de una sola vez con estadística de resumen de una persona.
• zC
D_is_en_-o_s_d_e_l_
______________________ ·n_ve_s_t~ig~a_ci_ó_n~y_s_u_v_a_li_de_z_l_·n_te_r_n_a__________~¡--55
1.2b: Estudio de caso de una sola vez con estadística de resumen de un grupo. Puede ser
una versión replicada del diseño 1.1, donde se anota el IQ promedio de un grupo, o del
1.2a, en el cual se apunta para un grupo el tiempo promedio tomado para resolver los
rompecabezas lógicos.
Figura 4.3. Estudio de caso de una sola vez con estadística de resumen de un grupo.
Los diseños referidos son útiles sobre todo para describir a un individuo o a un grupo. Por
ejemplo, en una encuesta entre estudiantes se pregunta si fuman y se anotan los porcenta-
jes de los que sí lo hacen y de los que no. Como alternativa, tales diseños pueden utilizar-
se para detectar si un individuo o un grupo difiere de la población general. Por ejemplo, los
investigadores pueden comparar los IQ de un conjunto de estudiantes maduros con las pun-
tuaciones que otros investigadores han encontrado para la población general a fin de ver si
aquéllos tienen IQ inusualmente altos o bajos.
1.2c: Sólo posprueba, con un grupo. Este tipo de diseño puede suponer la intervención o
manipulación de los investigadores; por ejemplo, si a un grupo de delincuentes se diera un
programa diseñado para evitar que reincidan.
No hay problema de validez interna con este tipo de diseño porque no tiene sentido usarlo
para tratar de establecer relaciones causales. Incluso en el ejemplo del programa para delin-
cuentes, como un estudio en sí mismo, no hay base para valorar su eficacia. Aunque encon-
tremos que el grupo comete menos actos ilícitos que los delincuentes en general, no sabemos
si habría reincidido menos sin la intervención. Para responder a ello, los investigadores ten-
drían que comparar los resultados del programa con los de otros y con un grupo control. Al
hacerlo, emplearían otro tipo de diseño.
El diseño de referencia puede incluir tiempo como variable presupuesta al tomar diferen-
tes participantes en distintas etapas de un proceso, pero medido simultáneamente. Por
ejemplo, si los investigadores quieren estudiar diferencias en IQ con la edad, podrían pro-
bar los IQ de dos grupos de edad distintos (a los 20 y a los 50 años). Tal diseño padece de
los problemas de la historia: si los criterios educativos cambiaron con el tiempo, las dife-
rencias de IQ entre los grupos podrían ser consecuencia de éste, más que un cambio en los
individuos. Una manera de sortear el inconveniente consiste en utilizar un diseño longitu- ·
dinal donde la misma gente se mide en varias edades, Jo cual representaría un ejemplo del
diseño de panel que se ofrece más adelante en este capítulo.
_______________________D_is_e_ño_s_d_e__in_v_e_st_ig~a_c_io_'n~y_s_u_v_a_li_de_z__in_t_e_rn_a____________~¡--57
2.1 b: Dos grupos, sólo posprueba. Se forman dos grupos y cada uno se trata de manera
diferente; luego se toma una medición. Como alternativa, uno de ellos podría ser un grupo
. control. Un ejemplo de un estudio que utiliza tal diseño es cuando se comparan dos méto-
dos de capacitación para que los radiólogos reconozcan tumores con rayos X. La ventaja de
un grupo control estriba en que ayuda a establecer una línea base para comparar los méto-
dos de capacitación. Si no se encuentran diferencias entre los grupos que han recibido ca-
pacitación, sin un grupo control no podría saberse si alguna de las capacitaciones resultó
benéfica; quizá ambas redituaron las mismas ventaj as, o ninguna las ofreció. Sin embargo,
si quienes están en Jos grupos de capacitación no son mejores que Jos controles, se habrá
fracasado en demostrar algún beneficio de aquélla.
Grupo Grupo
1 2
Intervención Intervención
1 2
2.1 e: Cuasipanel. Un propósito de diseño es medir a los sujetos antes de un evento y Juego
tratar de evaluar el efecto de éste. Por ejemplo, podría tomarse una muestra de estudiantes de
teatro previa a su asistencia a un curso en esa materia y medir su extraversión. Después
del primer año de curso, se tomaría otra muestra de la misma población, que podría incluir
algunas de las personas probadas originalmente, y medir su extraversión. Además de la se-
lección, la maduración y la selección por maduración representan amenazas posibles a la
validez interna, como lo sería la instrumentación.
58
Investigación cuantitativa en psicología
Tiempo 1
Tiempo 2
Participantes igualados
2.2a: Dos grupos igualados, sólo posprueba.
Este diseño compara dos niveles de una VI
o un tratamiento con un grupo control.
Grupo igualado
Grupo igualado
1 1
Diseños intrasujetos
2.2b: Diseño de panel simple. Por ejemplo, se da a los participantes dos tipos de rompe-
cabezas lógicos para que los armen y luego se anota el tiempo utilizado para cada tipo. Aquí,
el tipo de rompecabezas lógico es la VI con dos niveles; el tiempo tomado, la VD.
j
~
Figura 4.9. Diseño de panel simple.
Hay diversas variantes de este diseño. Si se midió a los participantes en una ocasión y éstos
recibieron luego un tratamiento tras el cual se les midió de nuevo, esto podría denominar-
se diseño preprueba, posprueba de un grupo; por ejemplo, las mediciones pueden tomarse
antes de una capacitación en alguna habilidad y después de ella. Como alternativa, podría
ocurrir un solo tratamiento (como pedir que se aprenda una lista, tras lo que se prueba a los
participantes luego de una duración inicial y tras un periodo más largo).
El diseño de referencia podría estar sujeto a varias críticas. Primera, como no se inclu-
yó grupo control alguno no tenemos protección contra la maduración y la historia, sobre
todo si hay una pausa notoria entre los tiempos en que se tomaron ambas mediciones; no
sabemos si cualquier diferencia entre las dos ocasiones podría darse incluso sin capacita-
ción. Segunda, debemos tener cuidado de que cualquier diferencia que se detecte no se de-
ba a efectos de instrumentación, mortalidad, orden o acarreo.
Otra variante de este diseño es cuando el tiempo se introduce como una variable, re-
trospectivamente, al medir a los participantes después de un evento y luego hacer que
recuerden cómo eran antes (diseño de panel retrospectivo) . Por ejemplo, podría pedirse a
estudiantes que califiquen su pericia con las computadoras tras asistir a un curso de compu-
tación y luego indicárseles que califiquen cómo eran sus habilidades antes del curso. Un
problema con los diseños retrospectivos radica en que dependen de la memoria falible de
la gente.
¡ p&
·v_a_e_n~p_si_co_l_og~í_a____________________
~~---------------l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_
1 Grupo 2
1
•
3.1b: Varios grupos, sólo posprueba. Se da a cada grupo un tratamiento diferente y lue-
go se toma una medición. Por ejemplo, se coloca a los niños en tres grupos. Su tarea con-
siste en seleccionar una pieza de arcilla tan grande como una barra de chocolate que se les
ha mostrado. Antes de formular el juicio se evita que un grupo coma durante seis horas. Se
procura que otro no coma durante tres horas, mientras que al grupo final se alimenta justo
antes de la prueba. Aquí, el tiempo sin bocado alguno es la VI, con tres niveles; el peso de
la arcilla, la VD. La ventaja de este diseño sobre el equivalente con sólo dos niveles de una
VI consiste en que uno de los niveles de la VI podría ser un grupo control. Así, es posible
comparar dos tratamientos entre sí y con un grupo control.
3.1 e: Varios gmpos, cuasipanel. Es una extensión del diseño del cuasipanel de dos grupos
(2.lc) donde se toman tres muestras de una población en diferentes momentos para saber
si han ocurrido cambios. Imagine que se miden los niveles de extraversión de una tercera
muestra de estudiantes de teatro después del segundo año del curso.
Diseños de investigación y su validez interna 61
Grupo
1
Tiempo 1
Grupo
2
Tiempo 2
Grupo
3
Tiempo 3
Diseños íntrasujetos
3.2b: El panel con más de dos niveles de una VI Cada participante proporciona una medi-
ción de tres condiciones. Por ejemplo, se pide a cada sujeto de un grupo calificar la fisica, la
sociología y la psicología en una escala que va de "muy científica" a "no muy científica".
S
de__in_v_e_st_i~ga_c_io_·n~y_s_u_v_a_li_d_ez__in_t_e _rn_a____________~¡--63
_______________________D_is_e_ño_s__
3.2c: Serie de tiempo interrumpida. Se trata de una extensión del diseño de un grupo, pre-
prueba, posprueba que puede ayudar a proteger de la instrumentación y, en cierta medida,
la maduración y la historia. Una serie de tiempo interrumpida es un diseño donde las me-
diciones se toman en varios puntos. Por ejemplo, podría llevarse a cabo un estudio de ca-
pacitación diseñado para ayudar a quienes padecen Alzheimer a realizar mejor las tareas
básicas.
Grupo
Observación 1
Observación 3
Observación 4
Los efectos graduales de la historia y la maduración deben mostrarse como tendencia; los
de la intervención, como un cambio de ésta. Una ventaja adicional de tomar mediciones en
varias ocasiones después de la intervención es que ayudan a monitorear los efectos de lar-
go plazo de ésta. El diseño puede realizarse retrospectivamente cuando se mantengan re-
gistros apropiados. Sin embargo, si la intervención no se encuentra sujeta af control de los
investigadores y no se toman registros con regularidad, los investigadores habrán de saber
desde luego acerca del cambio inminente, con anticipación, para empezar a tomar las me -
diciones.
ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st_i~
4.lb: Dos vías conformación de bloques en una VI. Por ejemplo, en un estudio sobre los
efeCtos de la nemotecnia puede considerarse que la edad es un factor por controlar. Se co-
loca a los participantes en tres bloques según su edad. Los sujetos de cada bloque se forman
en dos subgrupos; a uno de éstos simplemente se dice que repita una lista de pares de nú-
meros, mientras que al ot.u .,e le pide formar una imagen de una fecha relacionada con cada
par de números (por ejemplo, 45 produce una imagen del final de la Segunda Guerra Mun-
dial). Así, las VI son la edad (con tres niveles) y la nemotecnia (con dos). La VD corres-
ponde al número de pares recordado de manera correcta.
Los cuasiexperimentos y las encuestas o experimentos que suponen varios niveles de
las VI, pero tienen un número limitado de participantes , pueden obligar a los investigado-
res a usar un diseño menos exhau..;tivo. Uno jerárquico con una variable anidada constitu-
ye otro tipo de tales diseños.
VI 2
Nivel4
Grupo 1 Grupo 2
4.3b: Mixto o mezclado de dos vías. Una variación del diseño mixto supone dos VI, pe-
ro una como variable intrasujetos y la otra entre sujetos. Por ejemplo, cuando en el estudio
de reconocimiento de rostros se mide a ciertos participantes con fotografías (familiares y
no familiares) puestas de cabeza, y a otros, sólo con caras presentadas de manera conven-
cional.
Grupo 1 Grupo 2
..
Otro caso de lo anterior ocurre cuando una VI es un bloque, y los bloques se han formado
en orden para contrarrestar los efectos del orden. Por ejemplo, cuando en un experimento
relacionado con la memoria una VI es la pausa antes de recordar, con dos niveles (después
de 5 y de 20 segundos), un bloque de participantes hará los niveles en el orden de 5 segun-
dos y luego en el de 20, mientras que el otro bloque lo hará en el orden de 20 segundos y
luego en el de 5.
Una variante más es el diseño de cuadrados latinos con diferente orden de tratamiento
entre participantes.
El tiempo puede integrarse en el diseño de la misma manera que en los diseños con una
sola VI, retrospectivamente o como parte de una serie de tiempo; de nuevo, la inclusión de
un grupo control mejorará la validez interna. Sin embargo, una vez más , si los participan-
tes no están asignados de modo aleatorio a los grupos (grupos no equivalentes), podrían
ocurrir problemas de selección.
11
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
4.4: Cuatro grupos de Solomon. Un diseño que trata de controlar varias amenazas para la
validez interna es el de cuatro grupos de Solomon. Combina dos diseños ya mencionados.
Como con el diseño 2.lb, se utiliza en situaciones donde se comparan dos niveles de una
VI o donde se emplean un grupo control y uno experimental. Sin embargo, como con el di-
seño 4.3a, a alguno de los grupos se realizan pruebas previas y posteriores. Ello permite a
los investigadores identificar efectos de prueba.
Un ejemplo de dicho diseño es cuando los investigadores desean probar el efecto del
condicionamiento en el gusto de pequeños por cierta comida. Se probaría el gusto por la co-
mida de dos grupos, uno experimental y otro control, y luego el primero experimentaría una
intervención donde los encargados tratarían de condicionar a los niños para que asocien
tal ingestión con una experiencia placentera; durante esta fase los grupos control ingerirían el
alimento en condiciones neutrales. Más adelante, a todos se aplicaría una posprueba para
medir su gusto por la comida.
Ese diseño es particularmente gravoso en cuanto al número de participantes, el doble
de los necesarios en los diseños 2.lb o 4.3a para realizar las mismas comparaciones.
0
l
Figura 4.20. Diseño de cuatro grupos de Solomon en que se comparan dos tratamientos.
Diseños de investigación y su validez interna 69
4.5: Una serie de tiempo replicada, interrumpida. El diseño del título es una modifica-
ción de la serie de tiempo interrumpida ya mencionada. Aquélla requiere un grupo de com-
paración adicional; puede ser un grupo control o uno en que la intervención ocurre en un
punto diferente de donde lo hace en el grupo original.
Observación 3
Hay que repetirlo: el estudio puede ser una capacitación diseñada para ayudar a quienes su-
fren de Alzheimer.
El diseño debe ser incluso mejor que el de la serie de tiempo interrumpida para detec-
tar cambios ocasionados por la maduración o por la historia como los que han de mostrar-
se en ambos grupos, mientras que los efectos de una intervención aparecerán sólo como
una discontinuidad del punto relevante.
~L--------------~'n~v~e~st~ig~a~c~ió~n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Diseños intrasujetos
4.6. Diseño multivías intrasujetos. Si el ejemplo de velocidad de reconocimiento requirió
que a cada participante se presentaran rostros conocidos y desconocidos, de cabeza o en
posición convencional, éste sería un diseño de dos vías intrasujetos.
Grupo
Para obtener más detalles acerca de los diseños, consulte Myers y Well ( 1991 ), Cochran y
Cox (1957) o Winer, Brown y Mícbels (1991).
Resumen
Los diseños pueden clasificarse de acuerdo con su número de VI y de VD, así como con el
objetivo de la investigación. Pueden incluir los mismos participantes en más de una condi-
ción o emplear sujetos distintos en diferentes condiciones. Los diseños también se distinguen
por el grado en que miden a los participantes en varias etapas de un proceso. Si bien resulta
factible elevar al máximo la validez interna de un diseño en experimentos de laboratorio,
gran parte de la investigación se realiza fuera de éste. En tal caso, los investigadores ele-
girán el diseño con mayor validez interna a su disposición en esas circunstancias. Ningún
diseño es perfecto, pero algunos se antojan más apropiados que otros para responder una
pregunta de investigación concreta.
Diseños de investigación y su validez interna 71
Los detalles para usar un método experimental se encuentran en los primeros cuatro ca-
pítulos del libro. Otros métodos cuantitativos necesitan explicación adicional. En los tres
capítulos siguientes se describe cómo los investigadores utilizan diferentes métodos: los re-
lacionados con el planteamiento de preguntas y los métodos de observación.
5
Planteamiento de preguntas 1:
entrevistas y encuestas
Introducción
En el presente capítulo se describen los temas que pueden abarcarse en preguntas y los for-
matos de éstas, los cuales van de lo informal a lo formal. Luego se abordan los modelos más
sobrios de cuestionamiento y se estudian los medios en que pueden realizarse las entrevis-
tas y las encuestas. Se consideran tanto la redacción y el orden de las preguntas como el di-
seño del cuestionario. Por último, se remarca la importancia de efectuar un estudio piloto
al diseñar un cuestionario.
Preguntas demográficas
Son preguntas para obtener descripciones de personas, como su edad, género, ingresos y
lugar de residencia.
72
'
__________________P_l_a n_t_e_a_m_ie_n_to__d_
e ~p_re~g~u_n_ta_s_l_:_e_nt_r_ev_i_st_a_s~y_e_n_c_
ue_s_ta_s________~~
Entrevistas semiestructuradas
La entrevista semiestructurada es menos formal que el cuestionario. Aquí, éste tiene una
agenda (un tema específico sobre el que se inquiere y un conjunto de preguntas por respon-
der). Sin embargo, la redacción exacta de las interrogantes no se considera critica y el orden
en que se plantean no es fijo. Ello permite que la entrevista fluya de manera más parecida
a la conversación. No obstante, el investigador encauzará la charla al tema respectivo y ve-
rificará que se contesten las preguntas.
Cuestionarios autoadministrados
El participante lee el cuestionario autoadministrado y luego registra sus respuestas. Tales
encuestas pueden cobrar varias formas y transcurrir en distintos lugares.
Entrevistador presen t e
Como en la entrevista personal, el investigador puede estar presente. Ello supone la venta-
ja de que si alguien quiere plantear una pregunta puede respondérsele rápidamente. Igual
que las entrevistas personales, puede efectuarse en el territorio del investigador, en el del
participante o en un lugar neutral. Puede organizarse de tal modo que a cada sujeto se le
trate de manera individual. Como alternativa, se presenta el cuestionario a un grupo de par-
ticipantes y luego cada cual completa la copia respectiva.
•
__________________P_l_an_t_e_a_
m_ie_n_t_
o _d_e~p_re~g~u_n_ta_s_l_:_e_n_tr_e_vi_st_a_s~y_e_n_c_ue_s_ta_s________~¡--75
Entrevistas postales
Los participantes reciben el cuestionario para completarlo por cuenta propia. Luego lo de-
vuelven a los investigadores.
Entrevistas telefónicas
El entrevistador plantea las preguntas y anota las respuestas de los participantes .
Tasa de respuesta
Un problema adicional cuando se intenta obtener una muestra representativa es la propor-
ción de personas que no completan bien los cuestionarios. Quienes no han tomado parte
pueden compartir algunas características que socavan la base original del muestreo. Por
ejemplo, quizá falten en una muestra muchos sujetos de un grupo socioeconómico especí-
fico porque decidieron no intervenir.
Por lo general, la tasa de respuesta de una encuesta postal es la peor de los tres méto-
dos, si bien pueden hacerse recordatorios a la muestra (digamos, por correo o incluso por
teléfono), lo cual la mejora. En un sondeo reciente acerca del alojamiento de estudiantes en
la Universidad de Staffordshire la tasa de respuesta inicial fue de 50%, pero gracias a una
campaña con carteles que recordaban que se devolvieran los cuestionarios, aumentó a 70%.
Las encuestas telefónicas producen una mejor tasa de respuesta porque pueden com-
pletarse en el sitio y en el momento, en lugar de dejarlas y olvidarlas. Puede mejorar la tasa
de respuesta si envía de antemano una carta de presentación y, tal vez, si incluye una copia del
cuestionario. Los participantes tendrán así un aviso , pues algunos reaccionan muy mal a
las "llamadas en frío". Sin embargo, como descubrió uno de mis colegas cuando trató de
interrogar a médicos generales, un grupo muy consultado puede mostrar demasiada resis-
tencia, incluso ante las encuestas telefónicas y aunque haya recibido copia del cuestionario.
Pese a que muchas personas no se rehúsan de manera terminante, quizá dejen sin oportu-
nidad al investigador para una ocasión futura.
Si bien las encuestas cara a cara producen la mejor tasa de respuesta, pueden encontrar
resistencia. Cuando trataba de entrevistar en sus propios hogares a personas con impedi-
mentos visuales, una persona mostró sospechas, pese a que busqué tranquilizarla. de " ~
~L--------------~'~nv~~~ti~ga~c~io~
·n~c~u~a~nt~it~a~ti~v~
a ~e~n~p~si~co~l~og~í~a____________________
Costo
La cuestión del costo depende del objetivo de la encuesta y de quién la realiza. Si la mues-
tra será representativa y la población de que se extrajo está geográficamente extendida. la
~~---------------l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_
·v_a_e_n~p_si_co_l_og~í_a____________________
entrevista personal resultará la más onerosa. La telefónica saldrá cara si no pueden aprove-
charse las llamadas con tarifa reducida. Las encuestas postales serán las más baratas, aun-
que un seguimiento diseñado para mejorar la tasa de respuesta aumentará los costos. Si la
calidad de la muestra posee menor importancia, una entrevista personal resultará relativa-
. mente barata, pues los investigadores pueden permanecer en sitios populares y tratar de
hablar con transeúntes (muestra de oportunidad). Sin embargo, si debe emplearse entrevis-
tadores, el costo se incrementará.
La muestra
La manera de seleccionar la muestra depende de tres condiciones. Primera, si desea hacer
estimaciones acerca de la naturaleza de su población a partir de lo encontrado en la muestra
(por ejemplo, si desea estimar cuántas mujeres fuman de entre los estudiantes). Una segun-
da consideración estriba en el ambiente adoptado para el trabajo. Esto, a su vez, se relacio-
na con el tercer conjunto de factores, los cuales serán hechos como la distancia que separa
a los participantes y el costo del muestreo.
Consulte en el capítulo 11 la descripción de los métodos de muestreo y los detalles de
los procedimientos estadísticos útiles al respecto, incluidas las decisiones acerca de cuán-
tos participantes abarcar en la muestra.
a _m_ie_n_to__d_
__________________P_l_a n_t_e_ e ~p_re~g~u_n_ta_s_l_:_e_nt_r_ev_i_st_a_s~y_e_n_c_
ue_s_ta_s________~¡--81
Un censo
Censo se refiere a una encuesta que pretende incluir a todos los miembros de la población.
En Gran Bretaña, cada 1Oaños hay un censo nacional: se envía un cuestionario a los hoga-
res. Los habitantes están obligados legalmente a llenarlo.
Tipos de preguntas
Preguntas abiertas
Las preguntas abiertas son las que no restringen a los consultados a un tipo de respuesta;
por ejemplo: "¿Qué marca de cigarros fuma?", o "¿Cuántos años tiene?".
Preguntas cerradas
Las preguntas cerradas restringen a un conjunto fijo de opciones las respuestas posibles.
Por tanto, podrían ser de la forma: "¿Fuma?", o "Marque su grupo de edad: 20-29, 30-39,
40-49 o 50-59". Una versión cerrada de la pregunta sobre marcas de cigarros predilectas
incluiría las diferentes posibilidades. Una manera de introducir cierta flexibilidad en una
pregunta cerrada consiste en incluir la opción otros, que permite dar opciones no espera-
das, pero recuerde pedir que se especifiquen éstas.
Otra forma de pregunta cerrada sería dar una opción e indicar a los consultados que se
califiquen en alguna dimensión. Por ejemplo, podría proporcionarles un conjunto de foto -
grafias de personas y solicitarles que las clasifiquen en una escala que va de "muy atractivo"
a "muy poco atractivo". Como alternativa, podrían ordenarse las fotografias por atractivo; es
decir, ordenarlas según el atractivo percibido. Además, hay formas estándar de pregunta
cerradas que se utilizan para preguntas acerca de actitudes; en el capítulo 6 se describen.
Las preguntas cerradas tienen ciertas ventajas: dan a los entrevistados un contexto para
sus respuestas y pueden ayudar a mejorar su memoria. Además, aumentan la probabilida
de que un cuestionario se complete porque resulta más fácil que uno mismo las admini
~L--------------~I~nv~e~s~ti~ga~c~io~·n~c~u~a~nt~i~ta~tl~·v~a~e~n~p~si~co~l~og~í~a____________________
y se completan con mayor rapidez. Por último, se torna más sencillo calificarlas para la
fase de análisis. Sin embargo, pueden restringir mucho las posibles respuestas. Es buena
idea incluir más preguntas abiertas en la versión original de un cuestionario. En el estudio
piloto, los participantes proporcionarán respuestas diferentes que pueden servir para crear
una versión cerrada de la pregunta.
Preguntas de filtro
Es posible que su muestra incluya personas que responderán de manera fundamentalmente
distinta y tal vez desee explorar más a fondo tal diferencia. En este caso, en lugar de hacer
preguntas inapropiadas a algunas personas, puede incluir preguntas de filtro que lleven a la
gente a la sección apropiada para ellos. Por ejemplo, "Si fuma, pase a la pregunta 7; de lo
contrario vaya a la pregunta 31 ".
Preguntas con jerga o lenguaje técnico. No tiene mucho sentido plantear una pregunta si
los sujetos desconocen los términos utilizados. En general, puede expresarse con palabras
más simples, pero el costo suele reflejarse en una pregunta más larga y de comprensión más
dificil. La ventaja de una entrevista telefónica o personal es que usted puede saber si los
consultados entienden los términos, o explicarlos si es necesario. No obstante, reduzca al
máximo la terminología técnica y, por lo mismo, no utilice abreviaturas prescindibles.
beber un vaso de vino diario y considerar que eso es moderado, mientras que otro me ve-
ría casi como alcohólico y un tercero casi como abstemio, según sus propios hábitos (además,
cada quien juzgaría moderados sus hábitos). Es mejor dar un rango de posibles cantidades
de alcohol para que se indique su consumo.
Preguntas guiadas. Una pregunta guiada es la que indica al participante la respuesta es-
perada. Por ejemplo, "¿Cree en el mito de que los hombres no lloran?" sugiere que el con-
sultado no estará de acuerdo con la afirmación.
Preguntas con indicadores de rango deficientes. Si da opciones y quiere que los entrevis-
tados respondan sólo una, aquéllas deben ser mutuamente excluyentes, es decir, no será
posible satisfacer más de una. Imagine una persona de 30 años cuando se le pide que "In-
dique el rango de edad al que pertenece: 20-30, 30-40, 40-50, 50-60".
Preguntas con suposiciones implícitas. Algunas preguntas son inapropiadas para ciertos
entrevistados y, sin embargo, suponen que todos pueden responderlas. Un ejemplo sería
"¿Qué procesador de palabras utiliza?" sin dar la opción ninguno. Más común suele resul-
tar una pregunta de la forma "¿Su madre fuma?". Esto se antojaría inapropiado por varias
razones: la persona no conoció a su madre, o ésta murió.
Preguntas con doble elemento. Ciertas preguntas incluyen dos o más elementos, pero se
permite al entrevistado que responda sólo a uno. A menudo puede ser una extensión de la pre-
gunta con una suposición implícita. Por ejemplo, "Cuando se ducha, ¿usa gel para rega-
dera?". Si cuenta nada más con tina, tendrá dificultades para contestar porque, de hacerlo, no
sugeriría que sí tiene ducha pero que utiliza sólo jabón.
Uso de dobles negaciones. Las negaciones dobles resultan dificiles de entender. Por decir,
"¿Está de acuerdo con la frase 'a los abogados no se paga una cantidad que no es conside-
rable'?". Si quien elaboró el cuestionario quiere saber si la gente piensa que se paga mu-
cho a los abogados, convendría más expresarlo directamente.
Las preguntas acerca del comportamiento pueden resultar más problemáticas. Conviene
tranquilizar al participante con relación al anonimato, pero tal vez se necesite redactar la
pregunta de manera tal que aminore en cierta medida la incomodidad que despertaría. Por
ejemplo, si inquiere respecto al uso de drogas, podría llegar de modo indirecto a la interro-
gante, con comentarios preliminares que sugieran que sabe que muchos las consumen y qui-
zá si pregunta si los amigos del consultado las utilizan, para preguntar luego si él también.
Reserve un espacio suficiente para responder cuanto se desee en preguntas abiertas, pero
no demasiado como para sentirse intimidado por él.
El estudio piloto
Resulta fundamental el estudio piloto cuando usted ha formulado las preguntas de un cues-
tionario o si prueba un cuestionario existente en una nueva población. Como es usual, debe
aplicarse a individuos de su población destino. Vale la pena utilizar un número mayor de per-
sonas en un estudio piloto en que idea el sistema de medición que en uno donde emplea un
sistema existente, como en un experimento.
Además, el estudio piloto desempeña dos papeles. Primero, le ayudará a refinar su
cuestionario. Como ofrece un repertorio de respuestas a las preguntas abiertas, puede con-
vertirlas en cerradas si incluye las opciones que se le han dado. Segundo, puede indicarle
la utilidad de una pregunta. Si todos la responden igual, puede eliminarla por redundante.
Si una pregunta está mal redactada, debe quedar claro durante el estudio piloto, de modo
que tenga la oportunidad de volver a redactarla.
Resumen
Quienes desean plantear preguntas a sus participantes elegirán lo siguiente: los temas re -
pectivos (demográfico, de comportamiento y actitud/opinión/creencia), el formato del
86 Investigación cuantitativa en psicología
Introducción
En muchas situaciones, los investigadores desean medir actitudes. Tal vez quieran explorar
un área para descubrir las actitudes existentes (por ejemplo, conceptos de la gente sobre la
protección de animales). O quizá busquen conocer qué siente la colectividad acerca de algo
en particular (por ejemplo, si el gobierno realiza un buen trabajo). Incluso, una vez más, tal
vez quieran relacionar actitudes con aspectos de comportamiento (como descubrir la ma-
nera en que las actitudes de la gente hacia varios métodos anticonceptivos se relacionan con
su uso).
Una forma de identificar actitudes consiste en interrogar a la gente. Se ban ideado va-
rias técnicas para ello. En el presente capítulo se describen tres escalas de actitudes que qui-
zá encontrará cuando lea investigación sobre actitudes: las escalas de Thurstone, Guttrnan
y Likert. También se explica por qué esta última se ha vuelto el sistema de medición de ac-
titudes más usual. Además, se describen otros tres métodos utilizados para explorar lo que
significan ciertas entidades para la gente: el diferencial semántico, la metodología Q y las
cuadrículas de repertorio.
87
- ------------~
~~---------------ln_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
Ésa seria una pregunta razonable si tratara de predecir el comportamiento al votar. Sin em-
bargo, fallaría para identificar las sutilezas de la actitud hacia la política, pues supone que
hay una simple dicotomía entre quienes prefieren tales políticas y quienes las desdeñan.
Con frecuencia, cuando se le enfrenta a este tipo de preguntas, la gente responde que depen-
de de cuál política se considere. Por tanto, si los medios confieren importancia a una política
determinada con la que se está en desacuerdo, podría responder No, mientras que si fuera más
importante una política con la que se asiente, la respuesta sería Sí. No obstante, si las acti-
tudes son relativamente constantes, desearíamos un sistema de medición que reflejara la
consistencia. En otras palabras, queremos un sistema confiable. En general, una sola pre-
gunta es un sistema de medición de actitudes poco confiable.
Para prevenir la falta de confiabilidad de las preguntas únicas, se idearon escalas de va-
rios reactivos. La respuesta de una sola pregunta puede cambiar de una ocasión a otra, pero
las relativas a un conjunto de interrogantes proporcionará una puntuación que debería per-
manecer relativamente constante. Una escala de varios reactivos ofrece la ventaja adicional
de que la actitud de una persona puede colocarse en una dimensión, la cual va de tener una
actitud positiva hacia algo a tener una actitud negativa hacia eso mismo. Así, las actitudes
relativas de diferentes personas se compararán de manera más precisa.
Dimensiones
El uso de escalas de vari<;>s reactivos también permite a los investigadores explorar Jas su-
tilezas de actitudes para ver si existe una o más dimensiones. Por ejemplo, en actitudes po-
líticas podría percibirse una sola dimensión de la izquierda a la derecha. Sin embargo, hay
otras dimensiones; por ejemplo, liberal-autoritario. Por tanto, existen liberales de derecha
y de izquierda, así como autoritarios de izquierda y de derecha. Debido a ello, si los inves-
tigadores quieren explorar el dominio de la actitud hacia la política desearán plantear algunas
preguntas que identifiquen dónde se encuentra una persona en la dimensión izquierda-de-
recha y algunas que sitúen la dimensión liberal-autoritario.
Las tres escalas descritas a continuación abordan de manera diferente el tema de las di-
mensiones. La de Thurstone soslaya el problema y trata las actitudes como si fueran una
sola dimensión. La de Guttrnan lo reconoce y busca producir una escala unidimensional eli-
minando preg¡.mtas alusivas a otras dimensiones. La escala de Likert explora el repertorio
de actitudes y puede contener subescalas que atienden dimensiones distintas. La creación de
cualquiera de dichas escalas requiere a su vez la de un conjunto de preguntas o afirmacio-
nes y la posterior selección de las apropiadas a partir de cómo una muestra ha respondido
a ellas. Como se verá, el criterio para determinar lo que constituye una afirmación apropia-
da depende de la escala.
No obstante, los criterios de los tres tipos de escala comparten ciertas características.
Como con todos los cuestionarios, evite preguntas o afirmaciones mal redactadas; consul-
te en el capítulo anterior una descripción de los errores comunes. Ya que ha producido un
..
_____________P_l_an_t_ea_m_l_·e_
n_to_d_e~
pr_e~gu_n_t_as__
ll:_m
__ed_i_ci_ó_
n _d_e_a_ct_it_u_d_es~y_si~g_ni_fi_ca_d_o____~¡-89
conjunto inicial de afirmaciones, como con cualquier investigación, realice un pequeño es-
. tudio piloto para verificar que la redacción, a pesar de sus mejores esfuerzos, no es defi-
ciente. Luego, tras quedar satisfecho con este punto, estará listo para realizar el estudio más
completo para explorar su escala de actitudes.
Escalas de actitud
Escala de Thurstone
Una escala de Thurstone está diseñada para incluir cierto conjunto ~e preguntas con dife-
rentes valores en una dimensión. Quienes responden identifican las afirmaciones con las
que están de acuerdo. Por ejemplo, en una escala diseñada para medir actitudes acerca de la
protección de los animales las afirmaciones podrían ir de
Los humanos tienen derecho a cazar animales por placer
a
Ningún animal debe ser muerto para beneficio de los humanos
El diseñador de la escala formula juicios para clasificar cada afirmación, según el lugar que
ocupa en la dimensión (por ejemplo, de "totalmente despreocupado por la protección de los
animales" a "muy preocupado ... "). A partir de tales clasificaciones, se elige un conjunto de
afirmaciones, de manera que éstas tengan puntuaciones distribuidas equitativamente entre
los valores posibles. Tras elegir el conjunto final de afirmaciones, puede utilizarse en in-
vestigación; la puntuación de un participante en la escala será la media de las afirmaciones
con que está de acuerdo.
Exploración de la escala
Pida a por lo menos 100 jueces que califiquen cada afirmación en una escala de 11 puntos. Por
ejemplo, podría solicitarse a uno que califique las afirmaciones dadas antes, en la dimen-
sión que va de "totalmente despreocupado por la protección de los animales" (que obtendría
puntuación de 1) a "muy preocupado... " (con puntuación de 11). No se le pide que indique sus
propias actitudes hacia los animales sino que exprese sus opiniones sobre el lugar de la di-
mensión en que se encuentra cada afirmación.
11
90 Investigación cuantitativa en psicología
Análisis de reactivos
Se calcula la calificación promedio (la media) de cada afinnación, pues es una medida del
grado de acuerdo entre los jueces sobre la puntuación de cada afirmación (la desviación es-
tándar). El cálculo de ambos estadísticos se trata en el capítulo 9.
Ordene las afinnaciones con base en el tamaño de la puntuación media para cada una
de ellas e identifique las de, aproximadamente, puntuaciones medias para cada medio pun-
to de la escala. Por tanto, debe haber afinnaciones con puntuación de 1, otras con 1.5 y así
sucesivamente, hasta una de 11. Quizá las haya con puntuaciones similares. Elija para caaa
intervalo de la escala la pregunta sobre la que hubo más acuerdo, es decir, con la menor des-
viación estándar. Descarte las otras. Coloque en orden aleatorio las afirmaciones selecciona-
das y agregue la respuesta posible (de acuerdo/en desacuerdo) para cada una de ellas.
Escala de Guttman
La creación de una escala de Guttrnan también supone producir afirmaciones con las que
los entrevistados están de acuerdo o no. Una vez más, se diseña un conjunto de afmnacio-
nes para obtener una muestra del repertorio de actitudes posibles. Se dan a una muestra de per-
sonas y se examina la pauta de respuestas. La estructura de una escala de Guttman es tal que
resulta obligatorio que las afmnaciones se encuentren en una sola dimensión. Las afirma-
ciones se redactan de fonna que cierta persona con una actitud en un extremo de la escala no
esté de acuerdo con ninguno de los reactivos, mientras que alguien con una actitud en el otro
extremo de la escala concordará con todas las afinnaciones. Por tanto, un sistema de me-
dición de actitudes hacia la protección de los animales tendría afirmaciones que irían de
Es aceptable experimentar con animales para fines médicos
y
Es aceptable experimentar con animales para fines cosméticos
_____________P~I~an~t~e~
a~m ie~n~to~d~e~pr~e~g=un~t~as~ll:~m~ed=i~cl~·ó~n~d~e~a~c~ti~tu~d~e~s~y~sl~·g~ni~fi~c~ad=o~--~¡-91
a
Es aceptable experimentar con animales para cualquier fin
Si tales reactivos forman una escala de Guttman, alguien acorde con el reactivo fmal tam-
bién concordaría con los anteriores y quien no estuviere de acuerdo con el primer reactivo
discreparía de todos los demás. Las afirmaciones que no se encontraren en la pauta se des-
cartarían. La puntuación de una persona se basa por tanto en el grado de la dimensión con
que acepta estar de acuerdo. Si esas afirmaciones formaran una escala de tres puntos, por
estar de acuerdo con la primera se tendría puntuación de 1; por estarlo con la segunda, de 2;
y por estarlo con la última, de 3. Podría decirse que dos personas con la misma puntuación
figuran en el mismo punto de la dimensión.
Escala de Likert
Cada reactivo de una escala de Likert es una afirmación con la que los entrevistados pue-
den indicar su nivel de acuerdo en una dimensión de respuestas posibles. Un ejemplo del
tipo de afirmación es:
Ningún animal debe ser muerto para beneficio de los humanos
~L--------------~I~nv~e=s~ti~ga~c~io~·n~cu~a~n=t¡=·ta~t~iv~a~e~n~ps~ic~o~lo~g~í~a_____________________
Recomiendo usar una escala de cinco o siete puntos. Menos puntos en la escala omitirían
el repertorio de actitudes; más requerirían un nivel artificial de precisión, pues a menudo la
gente no puede proporcionar ese tipo de sutilezas en sus respuestas. Además, un número
non de posibles respuestas permite incluir una posición neutral; la falta de tal respuesta po-
sible fuerza a los participantes a tomar una decisión en una dirección específica, cuando tal
vez estén indecisos y ello tal vez produzca una medición poco confiable.
Tamaño de la muestra
En el capítulo 13 se explica la elección del tamaño de la muestra para un estudio determi-
nado. Por el momento, indicaré la regla de que la inclusión de al menos 68 personas en la
muestra significa que da a sus preguntas una posibilidad razonable de mostrar que son úti-
les en el análisis que llevará a cabo. Si usa menos sujetos, aumentará la posibilidad de que
rechace una pregunta porque no es útil para medir un aspecto de la actitud en estudio.
Análisis de la escala
Es posible efectuar dos análisis de las respuestas que la muestra ha dado a los reactivos. El
primero (un análisis de reactivos) busca si la escala de actitud mide una o más dimensio-
nes; ello identificará también afirmaciones que no parecen suficientemente relacionadas
con las otras de la escala. El segundo análisis verifica si una afirmación recibe una gama
suficiente de respuestas (el poder discriminatorio de la afirmación). Recuerde que si todos
dan la misma respuesta, o una muy similar, a una afirmación, aun cuando mantengan una
actitud distinta, no tiene caso incluirla porque no indica cómo difiere la gente.
De no leer los capítulos 9 y 19, no tendrá cubierto el material sobre las técnicas esta-
dísticas utilizadas en ambos análisis. Más adelante se describen éstos. En el apéndice XII
consulte una descripción más completa del proceso.
sobre actitudes respecto a la familia real británica un grupo de estudiantes encontró que una
dimensión adicional a la principal se relacionaba con la manera en que la familia era retra-
tada en los periódicos.
La afirmación que no se coiTelaciona razonablemente bien con la calificación total ni
con otras afi1maciones debe descartarse. Valdría la pena examinar estas afmnaciones para
ver qué identifica en ellas que pudiera explicar el resultado. Tal vez estén mal redactadas,
a pesar de haberse probado en el estudio piloto. Podría deberse a que la gente difiere poco en
cómo r-esponde a un reactivo determinado; si no hubiera variedad en las puntuaciones para
esa afirmación, no se correlacionaría con el total. Como alternativa, aunque haya inclui-
do la afirmación porque la creía relevante para la actitud, este resultado demuestra que no
poseía importancia, después de todo.
confiable, el número de afirmaciones no debe ser menor de 60 pero no mayor de 90.) Las
clasificaciones pueden utilizarse después por lo menos en tres maneras. En primer lugar,
pueden buscarse similitudes entre personas respecto a cómo clasifican los elementos. Por
ejemplo, los investigadores pueden pedir a potenciales votantes que clasifiquen por orden
de importancia un conjunto de afirmaciones. Éstas podrían incluir La inflación debe man-
tenerse baja, Las pensiones deben incrementarse, Debe mantenerse la actual asignación
de fondos al cuidado de la salud y Debemos mantener nuestro gasto actual en defensa.
Luego podrían explorarse las clasificaciones para ver si hay consenso entre los votantes en
cuanto a los temas considerados más importantes.
Un segundo uso, y más interesante, de la metodología Q sería la exploración de varios
subgrupos de personas que producirían ordenamientos similares, pero que diferirían de
C'tros subgrupos. Por tanto, en el ejemplo anterior podría encontrar que algunos clasifican
las pensiones y los fondos para el cuidado de la salud como los más importantes, mientras
que otros ponen prioridades más altas en defensa e inflación y un tercer grupo podría con-
siderar fundamentales los temas ambientales.
Un tercer uso de la metodología Q estriba en examinar el grado de acuerdo que un in-
dividuo tiene cuando clasifica objetos diferentes en la misma escala. Podría explorar el gra-
do en que una persona ve a sus padres como si fueran similares haciendo que clasifique un
conjunto de afirmaciones según el apego con que describe a un padre y hacer luego que re-
pita la clasificación de las afirmaciones para el segundo. Una vez más, podría lograr que
varias personas realicen tales clasificaciones para cada uno de sus padres y ver después si
hay un grupo que los clasifica de manera similar y otro que clasifica a cada un0 de modo
diferente.
Rogers ( 1951, 1961) ha usado clasificaciones Q en el contexto de la búsqueda de ayu-
da psicológica. Por ejemplo, puede pedirse a una persona que acude a terapia que clasifi-
que 100 ·afirmaciones en una escala de 11 puntos teniendo en cuenta si considera que las
afirmaciones la describen de manera típica. Esa clasificación Q puede compararse con otra
que tiene en cuenta si considera que las afirmaciones describen de forma típica a la perso-
na que le gustaría ser (su personalidad ideal). En varias etapas del periodo en que la persona
recibe ayuda se repetirían las clasificaciones Q. El objetivo de la terapia consistiría en lograr
que ambas clasificaciones Q tengan la mayor concordancia, ya sea con mejorar la imagen
propia de la persona o con tornar más realista su personalidad ideal. Además, Rogers ha
usado metodología Q para investigar si los psicólogos y sus pacientes concuerdan en cier-
tos temas. En este caso, se dan afitmaciones al terapeuta y al cliente y se les pide que las
ordenen por importancia. Según Rogers, el grado de acuerdo entre las dos clasificaciones
puede predecir bien el resultado de la terapia.
La metodología Q sirve para explorar teorías. Por ejemplo, las clasificaciones o los or-
denamientos se utilizan para examinar los significados de un concepto. Stenner y Marshall
(1995) la emplearon para investigar las acepciones que la persona reconoce para el \·oca-
blo rebeldía.
!11~~. .---~------~---------------------------------------------------~----~~~--------- -·----------
~~---------------l_n_
ve_s_ti~ga_c_io_'n_c_u_a_n_
ti_
ta_tl_ a _e_n~p_si_co_l_o~gí_a____________________
·v_
El diferencial semántico
Osgood, Suci y Tannenbaum (1957) idearon el diferencial semántico como una manera de
explorar cierta opinión sobre alguna entidad o, como lo expusieron, de medir cuantitativa-
mente el significado. Un ejemplo que dieron es la investigación acerca de cómo la gente ve
la política. Sugirieron que hay un espacio semántico con muchas dimensiones, donde cabrá
el s ignificado que una entidad determinada (por ejemplo, un político) tiene para alguien.
Contrastaron su método con los de otros contemporáneos y concluyeron que el suyo era ex-
plícitamente multidimensional, mientras que los métodos de los demás incluían sólo una
dimensión.
A los participantes se da una lista de pares de adjetivos bipolares como bueno-malo,
rápido-lento, activo-pasivo, seco-mojado, afilado-romo y duro-suave y se les pide clasifi-
car las entidades (los políticos), de una en una, en una escala de 7 puntos (1 para bueno y
7 para malo) para cada par. Recomendaron el diseño siguiente:
Margaret Thatcher
justa X injusta
rápida X lenta
activa X pasiva
------------~P~l~an~t~ea~m~~~·e~n~to~d~e~pr~e~gu=n~t=as~ll:~m~ed=i=ci=ó~n~d=e~a~ct=it~u=d=es~y=si~g=ni~fi=ca~d=o----~~
La persona que clasifica coloca una cruz en el cuadro abierto que parece más adecuado a
esa entidad para cada par de adjetivos.
La diferenciación semántica es el proceso de colocar un concepto en el espacio semán-
tico al clasificarlo en cada uno de los pares de adjetivos bipolares. La diferencia de significa-
do entre los conceptos se verá por su lugar en el espacio semántico. Luego se analizan las
respuestas de cierta persona o grupo para ver si forman pautas (factores). Una pauta común
es aquella en la que las clasificaciones forman tres dimensiones: Evaluación (por ejemplo,
limpio-sucio); Potencia (como fuerte-débil) y Actividad (digamos rápido-Lento).
El conjunto concreto de pares de adjetivos bipolares útiles depende del estudio en par-
ticular. Osgood y sus colaboradores indican que hermoso-horrible sería irrelevante cuando se
clasifica un candidato presidencial, pero justo-injusto poseería trascendencia; para clasifi-
car pinturas tal vez lo inverso sería la verdad. Brindan una lista de 50 pares de adjetivos.
El diferencial semántico sirve para varios propósitos: explorar las actitudes de un indi-
viduo respecto, digamos, a un partido político; comparar individuos para ver las diferen-
cias existentes sobre los significados que las entidades tienen para ellos, o evaluar cambios
después de una terapia o de una manipulación experimental.
..
~L________________In_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
cambia durante la terapia. Asimismo, puede aplicarse con fines de investigación para inda-
gar cómo se percibe a un grupo en particular; por ejemplo, cómo consideran los ciegos a
quienes no tienen discapacidad visual. Para obtener un recuento sobre el uso de las cuadricu-
las de repertorio y otros aspectos de la teoría de los constructos personales como se utili-
zan en la psicología clínica, consulte Winter (1992).
Resumen
Las escalas que incluyen varios reactivos se prefieren para valorar actitudes personales,
pues son más confiables que las preguntas simples diseñadas para valorar la misma actitud.
Esas escalas requieren la creación de gran número de reactivos que han de evaluarse en una
muestra razonable antes de utilizarlos en una investigación. La escala más popular es en es-
te momento la de Likert. Los psicólogos también usan otros medios para evaluar lo que
se piensa acerca de aspectos de sus vidas; sobre todo, lo que tales cosas significan para los
individuos.
En el capítulo siguiente se presentará un análisis sobre la observación del comporta-
miento humano.
7
Observación y análisis de contenido
Introducción
En el presente capítulo se describen dos métodos que tal vez no parezcan iguales en la su-
perficie pero que, en realidad, presentan problemas y soluciones similares. La observación
tiende a considerarse en el contexto de percibir el comportamiento de la persona, mientras
que el análisis de contenido suele asociarse con el análisis - valga la redundancia- de tex-
tos. Sin embargo, cuando puede observarse comportamiento videograbado y cuando se ha
aplicado análisis de contenido sobre anuncios televisivos, las barreras entre ambos méto-
dos parecen difusas. Como señalamos en el capítulo 2, puede indicarse que toda la inves-
tigación psicológica se basa en la observación y medición de comportamientos (trátese de
movimiento abierto, lenguaje o estados psicológicos) porque no podemos observar directa-
mente el pensamiento. No obstante, en el capítulo restringiré el significado de la observación
a la de algún tipo de movimiento o discurso.
Tanto la observación como el análisis de contenido pueden realizarse cualitativa y
cuantitativamente. Voy a centrarme en el método cuantitativo, pero muchos de los temas
metodológicos tratados en el capítulo también sirven de guía para quien efectúa investiga-
ción cualitativa. Debido a la superposición entre ambos métodos, empezaré por describir la
observación, luego echaré un vistazo a los aspectos de la investigación comunes para los
dos métodos. Describiré una forma de observación estructurada y, por último, revisaré el
análisis de contenido.
99
1(K}lL______________~In~v~e~st=ig~a~c~io=·n~c=u~a~n~ti~ta~t~iv~a~e=n~p~s~ic~o~lo~g~ía~--------------------
Observación
¿Cuándo es aplicable?
En varias situaciones desearemos efectuar una observación. Por lo general, es así cuando
no se cuenta con un reporte verbal exacto. Una de tales ocasiones se presenta cuando los
sujetos de estudio tienen poco repertorio lingüístico, o carecen de él, como los niños pe-
queños. Asimismo, tal vez quiera explorarse el comportamiento que ocutTe sin que su autor
esté consciente de lo que hace, como sucede en gran parte de la comunicación no verbal,
como cuando se establece contacto visual. Otra área en que vale la pena indagar es aquella
donde interesa a los investigadores resolver problemas. Es común el caso de expertos, co-
mo médicos, quienes para diagnosticar enfermedades no suelen seguir la ruta de razona-
miento que se les enseñó, pero cuando se les pide que describan su procedimiento reportan
el que se les enseñó originalmente. La observación ayudaría mucho a aclarar las etapas que .
tal diagnóstico recorre.
Una cuarta situación donde la observación resulta apropiada es cuando los participan-
tes desean presentarse bajo una luz favorable, como las personas prejuiciosas contra una
minoría étnica y que tal vez no admitan la manera en que se comportan con miembros de
ese grupo minoritario. Sin embargo, aun cuando se cuente con reportes verbales exactos,
vale la pena realizar observaciones para complementarlos.
Tipos de observación
Las observaciones pueden clasificarse de varias maneras. Una se basa en el grado en que
el psicólogo participa en el comportamiento analizado. Ello abarca desde el participante
completo, cuyo papel como observador se oculta a los demás sujetos que toman parte, has-
ta el observador completo, quien no interviene en absoluto y tiene un papel que también se
oculta a dichas personas. Un ejemplo del primer caso sería un investigador que se une encu-
biertamente a una organización para explorarla desde el interior. Uno del segundo incluiría
la observación de personas en un centro comercial para ver cómo utilizan el espacio. Entre
ambos extremos se hallan varias gradaciones. Una es la de participante-como-observador,
que --como el nombre lo indica-- requiere que los investigadores tomen parte en la acti-
vidad que se observa pero que revelen que son investigadores. En ocasiones, la labor del
participante completo y del participante-como-observador se describe como investigación
etnográfica.
La clasificación siguiente, partiendo de la participación directa, es la de participante
marginal. En ésta, es posible que los investigadores den pasos, como vestir cierta ropa,
para no obstruir la observación. Luego sigue el observador-como-participante. Los in-
vestigadores revelan que están explorando, pero no intervienen directamente en la acción
analizada. Esta clasificación destaca que la presencia de aquéllos puede tener cierto efecto
•' en el comportamiento de los demás y, por tanto, la mayoría de los observadores participan en
algún grado.
O_b_se_~
_________________________ _a_c_io_·n~y_a_n_
ál_is_is_d_e__
co_n_t_e_ni_d_o_______________J~
Otra manera de clasificar los tipos de observación se relaciona con el nivel en que se
observa y registra el comportamiento. El comportamiento molar se refiere a uno de mayor
escala, como saludar a una persona que entra en la habitación; este nivel de observación pue-
de requerir interpretación del observador respecto a la naturaleza del comportamiento. Por
comportamiento molecular se entienden los componentes del comportamiento molar, y es
menos probable que precise interpretación. Por ejemplo, una descripción molecular del
comportamiento definido antes como saludar a quien entra en la habitación seria ésta: "Tien-
de la mano al recién llegado; toma la mano del recién llegado y la sacude; eleva la comisu-
ra de los labios y hace breve contacto visual; suelta la mano del recién llegado".
Una forma más de clasificar la observación depende del grado en que esté predetermi-
nada su naturaleza. Ello abarca de lo que se denomina observadón informal o casual a la
formal o sistemática. En la informal, los investigadores pueden anotar lo que consideran de
interés en el momento; este procedimiento suele ser precursor del sistemático y se utiliza
para obtener una idea respecto al repertorio de comportamientos posibles. En la observa-
ción sistemática se buscan aspectos específicos de comportamiento con la idea de probar
hipótesis.
La última forma de ver los tipos de observación se basa en las posiciones teóricas de los
investigadores. Probablemente la etología (el estudio de animales y de seres humanos en su
medio natural) recurra más a la observación de comportamiento molecular y a poca interpre-
tación. Tal vez la observación estructurada utilice más interpretación y aborde comporta-
miento más molar. La etnografia quizá demande más información e interpretación casual,
además de una introspección del observador. Quienes emplean la observación ecológica
estarán interesados en el contexto y el ambiente donde ocurrió el comportamiento y, tam-
bién, en la inferencia de los significados y las intenciones de los participantes.
El uso de palabras como tal vez y probablemente en el párrafo anterior se debe a mi
creencia de que ninguna de tales formas de clasificar la observación describe modos mu-
tuamente excluyentes de realizar una observación. Diferentes maneras son complementa-
rias, y los mismos investigadores pueden utilizarlas en triangulación. Además, diversos
métodos pueden representar varias etapas en una sola pieza de investigación, como se su-
girió antes.
Obtención de acceso
Sí va a observar una situación abierta al público (por ejemplo, una escuela, una prisión, una
institución psiquiátrica o una compañía), hay un obstáculo inicial por vencer: la obtención
de acceso a las personas que realizan sus tareas ·diarias. Si permanecerá totalmente encu-
bierto, entonces tal vez deba afiliarse a la institución por el mismo medio que los otros
miembros lo han hecho. Antes de decidir si estará encubierto del todo, considere los temas
éticos afines (consulte el capítulo 1). Por otra parte, si consigue un confidente en la o~-
1 .-~- ------ ------------~~
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s~ic_o_lo~g~ía__________________
nización puede obtener acceso sin revelar a todos sus intenciones. Aunque su p~pel como
investigador sea abiertamente conocido, necesita que alguien le ayude a introducirse y que
dé a la tarea cierta legitimidad.
Procure no identificarse demasiado con esa persona, pues es probable que no agrade a
los demás o que a éstos les preocupe lo que podría revelar, lo cual matizaría el comporta-
miento hacia usted.
Ha de tranquilizar a la gente acerca de sus objetivos. Para ello, tal vez deba modificar lo
que expresa, de modo que los sujetos no se pongan innecesariamente en guardia o incluso
se vuelvan hostiles. Piense si es necesario indicar a los profesores de escuela que, como psi-
cólogo, trata de comparar los enfoques que aplican para la enseñanza de matemáticas con
las recomendaciones de los teóricos. Seria mejor explicar que le interesa la manera en que la
planta docente enseña ese tema y en sus opiniones. No recomiendo que recurra al engaño;
lo que dice es verdad, pero si presenta su informe completo, los instructores podrían com-
portarse y hablarle de modo que se amolde a lo que piensan que usted debe oír, en lugar de
reflejar lo que realmente hacen. Vale la pena destacar el valor que tendrá para ellos cual-
quier invest:gación que usted lleve a cabo; garantice confidencialidad, de manera que los
individuos no sean identificados, y muestre su deseo de compartir sus descubrimientos con
ellos; cumpla estas promesas.
Métodos de grabación
El método idóneo para registrar lo observado es el que no obstruye y que preserva en lo po-
sible el .comportamiento original. Un sistema de medición que no obstruye reduce al máxi-
mo el efecto del investigador sobre los participantes; no tiene mucho sentido obtener un
registro carente de validez ecológica porque los participantes modificaron su comporta-
miento debido a que se les estudiaba. De igual manera, tiene poco interés explorar com-
portamientos con plena validez ecológica si no puede registrarse lo que se quiere. En la
circunstancia correcta, las videocámaras conectadas a un buen sistema de audiograbación
ofrecen lo mejor de estos dos mundos.
Puede tenerse una habitación construida a propósito, con cámaras y micrófonos con-
trolados desde otro cuarto. Los movimientos de la cámara --cambios de foco y de ángu-
lo- han de ser lo más silenciosos posible, lo cual se logra con las cámaras modernas. La
grabación visual que proporciona el vídeo resulta útil aunque la investigación se centre en
el lenguaje, pues pondrá a éste en su contexto. Mantener las cámaras lo más cerca del techo
las tornará menos evidentes, pero se requerirá una habitación de buen tamaño para grabar
más que la simple vista de las cabezas de la gente.
Una sola cámara puede significar que, a menos que se restrinjan la posición y el movi-
miento de los sujetos de estudio, se grabará sólo parte de la acción. Una combinación de dos
-
o tres aparatos reducirá el número de puntos ciegos en una habitación. Pueden grabarse
O_b_se_~_a_c_i_
_________________________ o·n~y_a_
na_'l_is_is_d_e__
co_n_t_en_i_d_o______________~¡-voJ
las imágenes de más de una cámara directamente en una sola videocinta. Ello permite a los
investigadores ver las caras de dos personas que conversan frente a frente o analizar a un
solo individuo en acercamiento o a la distancia.
Aparte de las ventajas descritas, el vídeo permite a los investigadores ver varias veces
la misma pieza de comportamiento. Así, puede observarse la misma conducta en varios nive-
les, lo cual permite centrarse, en diferentes ocasiones, en diversos aspectos del comporta-
miento. También toma factible grabar en la cinta una medida del tiempo transcurrido; ello
ayuda al muestreo y al cálculo del tiempo que duran ciertos comportamientos. Una venta-
ja adicional radica en que la cinta puede reproducirse a distintas velocidades para detectar
- los comportamientos de gran rapidez. El vídeo también permite verificar más fácilmente la
confiabilidad de las mediciones.
Por muchas razones quizá no pueda usar el laboratorio construido a propósito. Sin em-
bargo, aun en investigación de campo puede utilizar una cámara de mano o con un tripié. Por
fortuna, la gente tiende a habituarse a la presencia de una cámara o de una grabadora de au-
dio si no interfieren mucho. Si los individuos dudan al conceder su permiso para que se les
registre, concédales la oportunidad de indicar cuándo desean que el dispositivo de grabación
se apague y, para tranquilizarlos, especifiqueles qué uso dará a las grabaciones. No obstante,
tal vez haya situaciones en que observe de manera encubierta o en que se le haya denega-
do el permiso de grabar. En el último caso, tendrá un problema de selectividad y de saber
cuándo anotar lo que ha sucedido.
Si pretende una observación más impresionista, tal vez deba tomar descansos compara-
tivamente frecuentes para anotar sus observaciones; sin duda, tendrá problemas para depen-
der de su memoria y verificar la confiabilidad. Aun cuando haya tomado notas, requiere
tiempo para ampliarlas en cuanto sea posible, después del evento. Si desea una observa-
ción más formal, lo aconsejable radica en crear una lista de verificación de conductas en la
forma más conveniente para anotar lo ocurrido y, si lo precisa, la duración de comporta-
miento relevante. En ese caso, tal vez pueda verificar la confiabilidad de ese conjunto de
observaciones si hace que un segundo observador utilice la lista de verificación al mismo
tiempo. Por lo menos debe verificar la confiabilidad general de ésta haciendo que dos o más
observadores la empleen mientras exploran cierto comportamiento relevante. Es posible
anotar más información si se utilizan varios observadores para que cada cual se centre en
diferentes aspectos de la conducta o que supervise a distintas personas.
Transcripción
Una desventaja del videocasete y, en menor medida, de la cinta de audio, se halla en la
gran cantidad de información por escudriñar. Ello puede consumir mucho tiempo. Resulta
tentador pasar las cintas a alguien más para que transcriba las descripciones o, más par-
ticularmente, las palabras dichas. Si bien esto ahorra tiempo a los investigadores y ayuda a
proporcionar un registro más útil para leerlo con atención, parece buena idea ver y escu-
char las cintas originales. Es muy útil conocer el contexto en que ocurrió el comporta-
miento, el discurso y la entonación originales. Una solución intermedia consiste en tener
una transcripción a la que se añadirán notas tomadas de la observación de la grabación
original.
________________________O_b_
se_N_a_c_io_·n~y~an_á_li_si_s_d_e_c_o_nt_e_nl_·d_o______________~f105
Tipos de datos
En primer lugar, probablemente extraerá una lista de categorías y subcategorías de conduc-
ta relevante. Luego debe determinar si registrará la frecuencia. con que ocurre una conducta
en particular o su duración. Además, tal vez le interesen secuencias específicas de eventos
a fin de buscar pautas en cómo ciertas conductas siguen a otras. Aun cuando le interese sólo
la frecuencia con que ocurren ciertas conductas, tal vez valga la pena poner esto en dife-
rentes marcos temporales para ver si ocurre un cambio con el tiempo. Además, en el caso
de juicios más subjetivos, quizá prefiera obtener evaluaciones de aspectos, como el grado de
emóción.
Muestreo
El muestreo puede realizarse a partir del tiempo y del lugar, además de la gente. El muestreo
continuo de tiempo real consiste en observar el comportamiento todo el tiempo que se reaJj-
za. Ello consume mucho tiempo y además existen maneras de seleccionar periodos más
cortos de la duración completa. El muestreo temporal de punto requiere la elección de momen-
tos específicos, anotando si ocurren entonces las conductas objetivo. Esto podría efectuarse de
manera regular o aleatoria. Como alternativa, el muestreo temporal de intervalo consiste en
la elección de lapsos de una duración fija en etapas seleccionadas de la duración general,
anotando la frecuencia de los comportamientos objetivo durante los periodos fijos .
Debe pensar en los periodos y ambientes que le gustaría incluir en la muestra. Por tanto,
si explora el comportamiento de estudiantes en la universidad, acaso desee observar confe-
rencias, cursos, seminarios, bibJjotecas, comedores y dormitorios. Además, querrá observar
durante la semana de inicio de cursos. en varios momentos de cada año, incluso durante los
periodos de exámenes y graduación.
Un ejemplo de muestreo sistemático para un análisis de contenido sobre anuncios comer-
ciales de televisión consiste en obtener anuncios que representen lo mostrado en diferentes
lapsos del día, como programas durante el desayuno, el día, la tarde y la noche cuando aún
la miran niños, en horas pico y a medianoche. El enfoque aleatorio supondría la elección de
cierto número de ejemplares del año anterior de una revista, al azar, a partir del número del
ejemplar. Consulte en el capítulo 11 un análisis de la selección aleatoria.
Observación estructurada
Una forma de observación estructurada que se usa ampliamente es el análisis de proceso
de interacción (IPA, interaction process analysis), el cual fue ideado por Bales (1950).
,..
1Q6l~---------------'~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a____________________
Análisis de contenido
El análisis de contenido puede verse como una forma de observar sin intrusión, pues el
experimentador no está presente cuando las acciones se desarrollan, sino que analiza los
trazos dejados por éstas. En general, requiere el análisis de textos, como artículos de pe-
riódico o transcripciones de un discurso o de una conversación. Sin embargo, puede apli-
carse en otro medio, como un anuncio de televisión.
Un análisis de contenido típico incluye la observación de cómo las personas se repre-
sentan a sí mismas y a quienes buscan mediante anuncios en colwnnas de corazones solita-
rios de una revista. El analista podría investigar si hay diferencias entre hombres y mujeres
en sus métodos y en las palabras que usan. Por ejemplo, ¿los hombres se centran en su ri-
queza y sus posesiones pero aluden a los atributos físicos de la pareja que esperan? ¿Los
hombres y las mujeres hacen uso diferente del humor? Las categorías buscadas podrían deri-
varse de una teoría de cómo se comportarían los hombres y las mujeres o de una observa-
ción preliminar de los anuncios para ver cuáles dimensiones sobresalen. Una vez definidas
las categorías, un análisis de este tipo requerirá el conteo del número de hombres y muje-
res que muestran estilos particulares en sus anuncios.
Manstead y McCulloch (1981) condujeron otro ejemplo de un análisis de contenido.
Examinaron anuncios mostrados en la televisión británica para ver si se representaba de
manera diferente a los hombres y a las mujeres. Para empezar, identificaron, donde era po-
sible, los personajes clave de varón y de dama. Luego clasificaron los anuncios de acuerdo
con la naturaleza del producto que se vendía y los papeles que hombres y mujeres desem-
peñaban en los mensajes (como emisores o receptores de la infonnación).
O_b_se_~_a_c_io_'n_y~a_na_'l_is_is_d_e_c_o_n_t_en_i_do______________~~
_________________________
Resumen
La observación y el análisis de contenido son dos métodos no experimentales de conside-
rar la conducta. En el caso de la observación, el investigador suele estar presente cuando
ocurre la acción y varia el grado en que los participantes están enterados de la presencia e
intenciones del observador. Por otra parte, el análisis de contenido se conduce sobre el pro-
ducto de la acción, y el analista no se halla presente cuando se realiza ésta. Ambos métodos
requieren que se idee un sistema para clasificar el material que se analiza. Por tanto, es ne-
cesario examinar en los dos la validez y la confiabilidad de los sistemas de clasificación.
En los capítulos 8 y 22 se tratará el tema de la recolección de datos en la investigación
y cómo analizarlos.
8
Escalas de medición
Introducción
En el capítulo 2 se analizaron las diferentes formas de medición que utilizan los psicólogos.
Además, se recalcó la necesidad de comprobar que aquéllas son válidas y confiables. En el pre-
sente capítulo se mostrará cómo tales mediciones pueden clasificarse en cuatro escalas. Se
contrastará esto con la manera en que los expertos en estadística se refieren a las escalas.
Se analizarán también las consecuencias del uso de una escala de medición en particular.
Ejemplos de mediciones
Las preguntas siguientes dan lugar a respuestas que difieren en el tipo de medición reque-
rido. Antes de pasar a la próxima sección, observe las preguntas y vea si encuentra diferen-
cias en el tipo y en la precisión de la información que cada respuesta proporciona.
9. ¿Come carne?
10. ¿Cuánta'S horas prefiere dormir por la noche?
11. ¿De qué color son sus ojos?
12. ¿Cuántas unidades de alcohol bebe por semana?
(1 unidad= un vaso de cerveza, una medida de alcohol o un vaso de vino)
13. ¿Su memoria es ...?
Escalas de medición
Hay cuatro escalas que se utilizan para describir las mediciones posibles; lea sus descrip-
ciones y luego trate de clasificar las 16 preguntas anteriores en las cuatro. Las respuestas
se darán al final de la sección siguiente.
Nominal
La escala nominal de medición se usa para describir datos integrados únicamente por nom-
bres o categorías (de allí su otro nombre: nivel categórico). Por tanto, la respuesta a la pre-
gunta ¿vive en las instalaciones universitarias? constituye una forma de dato nominal. Los
datos nominales no son sólo binarios (donde hay sólo dos contestaciones posibles). La res-
puesta a ¿cómo viaja a la universidad? también representa un dato nominal.
Ordinal
La escala ordinal se refiere, como su nombre lo indica, a los datos que pueden colocarse
en un orden. Por ejemplo, las clasificaciones de grados universitarios en lo., 2o. y 3o. for-
man una escala ordinal.
De int ervalo
La escala de intervalo incluye datos que indican más que simplemente un orden; señala el
grado de diferencia entre dos calificaciones: Por ejemplo, si se le dice la temperatura, ex-
presada en grados Fahrenhcit, de dos habitaciones, sabrá no sólo que una es más cálida que
la otra, sino también en cuánto.
110l~· _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
De razón
La escala de razón le proporciona, como la de intervalo, información acerca de la magni-
tud de las diferencias entre lo que está midiendo. Sin embargo, reúne la propiedad adicional
de que Jos datos deben tener un cero verdadero; en otras palabras, cero significa que la pro-
piedad que se mide carece de una cantidad. Por ejemplo, el peso expresado en kilogramos
es una escala de razón. Ello puede resultar confuso porque cuando se pregunta a la gente su
peso, no puede responder "cero kilogramos"; esto significaría que no cuenta con peso. La tem-
peratura en grados Fabrenheit se encuentra en una escala de intervalo y no en una de razón
porque cero grados Fabrenheit constituye una temperatura mensurable.
En el caso de una escala de razón, podemos hablar de la razón entre dos entidades me-
didas en ella porque hay un punto de partida fijo. Por ejemplo, si comparamos la estatura
de una persona que mide 100 centímetros con la de otra de 200, podemos decir que la pri-
mera tiene la mitad de la altura de la segunda. En el caso de la temperatura, no hay un punto
de partida fijo para la escala; por ello, no es verdad si se dice que 40 centígrados es la mi-
tad de 80 centígrados.
Comprenderá el concepto si convierte la escala a otro tipo de unidades para ver si la ra-
zón entre dos puntos permanece igual. Si el ejemplo de la altura se cambia a pulgadas, donde
cada una equivale a 2.54 centímetros y 0.00 centímetros es lo mismo que 0.00 pulgadas, la
persona de menor estatura mide 39.37 pulgadas y la más alta 78.74. La conversión no ha
cambiado la relación entre ambos individuos; el primero mide la mitad del segundo. Sin
embargo, si convertimos 40 y 80 centígrados a Fabrenheit, obtendremos 104 y 176 grados,
respectivamente. Queda claro que una temperatura no es la mitad de la otra. Por fortuna
para cualquier lector que no comprenda la diferencia entre escalas de intervalo y de razón,
las estadísticas explicadas en este libro tratan de la misma manera los datos de razón y los
de intervalo.
¿Fuma?
Nada e n absoluto.
Entre uno y 1O cigarrillos al día.
Más de 1O cigarrillos al día.
----------------------------~E=s~ca~l~as~de~m~e=d~ic~io~-n~------------------~¡-111
obtendrá datos ordinales que le ayudarán a distinguir, entre los fumadores, a quienes fuman
mucho y a quienes fuman poco,
Por último, si pregunta:
¿Cuántos cigarros fuma al día?
recibirá datos de razón que le indicarán con más precisión cuánto fuma la gente.
La diferencia importante entre las tres versiones de la pregunta es que usted puede apli-
car distintas técnicas estadísticas, según cuente con datos de intervalo/razón, ordinales o
nominales. Cuanto más información proporcione, tanto más informativas serán las estadís-
ticas que derive de ella.
De acuerdo con lo anterior, si se le proporciona una medida situada en una escala de
razón, estará desperdiciando información si la trata como ordinal o nominal.
Las preguntas siguientes le dan datos nominales:
Vale la pena señalar que si quisiera ordenar las ocupaciones sobre la base, digamos, del es-
tatus, convertiría los datos en una ·escala ordinal. Sin embargo, si no tiene un. orden, perma-
necerán en una escala nominal. ~
Otras escalas nominales son éstas:
El ejemplo anterior puede confundir, pues indica que las opciones son simplemente nom-
bres o categorías, pero note que forman un orden; quien asegura tener una memoria mejor
que el promedio afirma que la suya es mejor que la de alguien con una memoria promedio.
peor que el promedio o mucho peor que el promedio.
112l~ _______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
La pregunta siguiente es una de las pocas que ofrecen datos de intervalo, no de relación:
Indicadores
Una consideración adicional sobre el nivel de una medición específica estriba en cómo ha-
brá de usarse; qué indica. Se ha señalado que los psicólogos en raras ocasiones tienen me-
diciones directas de lo que desean observar. Esto resulta particularmente cierto si tratan con
algo --digamos un estado socioeconómico- que tal vez quieren definir. Mediciones co-
mo años de estudios o ingresos se encuentran en el nivel de razón, pero cuando se utilizan
para indicar el estatus socioeconómico son ordinales, pues una diferencia del mismo tamaño
en ingresos significará cosas distintas en diversos puntos de la escala. Por tanto, una persona
que gana 200 000 pesos al año se halla en una situación mucho mejor que alguien que percibe
l 00 000, mientras que quien gana 2 600 000 al año no está mucho mejor pagado que alguien
que obtiene 2 500 000. Con el ejemplo anterior se demostró que un aumento absoluto tenT
drá significado diferente en distintos puntos de la escala. Sin embargo, incluso el mismo
aumento en proporción o razón puede tener significados diversos en diferentes puntos de
la escala. Es más probable que un aumento de 10% tenga mayor importancia para quienes
ganan l 00 000 al año (e incluso puede llevar a clasificarlos en un grupo socioeconómico di-
ferente) de lo que sería 10% para el individuo que percibe 2 500 000.
Las preguntas siguientes arrojan respuestas que se encuentran en una escala discreta:
Las preguntas siguientes arrojan respuestas que se hallan en una escala dicotómica:
Los psicólogos se sitúan en al menos dos campos: los que aplican la clasificación nominaL or-
dinal o de intervalo/razón de medición para decidir cuál estadística emplear; y los que pre-
fieren seguir el sistema de clasificación de los expertos en estadística. Sin embargo. deben
~~----------------ln~v~e~st~ig~a~c~io~·n_c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
considerarse ambos sistemas. Como verá en el capítulo 14, otros criterios importantes in-
dican cuál versión de un procedimiento estadístico emplear. Mí percepción es que ambas
maneras de clasificar las escalas resultan válidas y que podemos seguir el consejo de los
expertos en estadística respecto a la elección de pruebas estadísticas, pero hemos de reparar
en lo que las mediciones significan (lo que indican) y, por tanto, en el sentido que podemos
dar a los resultados del análisis estadístico.
Resumen
Hay dos métodos para clasificar escalas de medición. Los psicólogos tienden a describir
cuatro de éstas: nominal, ordinal, de intervalo y de razón. Cada una proporciona un deter-
minado nivel de información; la escala nominal ofrece la menor cantidad de información, y
la de razón la mayor. En cuanto a las técnicas estadísticas descritas en el libro, las es'calas
de mediciones de intervalo y de razón pueden tratarse igual. Los expertos en estadística pre-
fteren hablar de escalas continuas, discretas y dicotómicas. Ambos sistemas de clasifica-
ción deben tomarse en cuenta. Una consideración adicional que determina cómo clasificar
una medición es lo que se pretende indicar. La escala de una medición tiene efecto sobre el
tipo de estadística utilizable en esa medición.
En el capítulo siguiente se presentan las maneras en que pueden describirse los datos,
tanto numérica como gráficamente.
·~
9
Resumen y descripción de datos
.
111
Introducción
La primera fase del análisis de datos consiste en la producción de un resumen. Esta mane-
ra de describir los datos puede ser numérica o gráfica. Reviste utilidad particular porque
puede mostrar si los resultados de la investigación concuerdan con la hipótesis del investi-
gador. Los expertos en estadística confieren una importancia creciente a esta etapa y la han
descrito como análisis de datos exploratorio (EDA, exploratory data analysis). Los psicó-
logos tienden a subemplear el EDA como una etapa de su análisis.
Métodos numéricos
Datos de razón, de intervalo u ordinales
Medidas de tendencia central
Cuando haya recolectado datos acerca de los participantes deseará elaborar un resumen que
le dé una idea sobre los resultados de los participantes que ha estudiado. Imagine que ha
entregado a un grupo de 15 adultos una lista de 100 palabras y que le ha pedido a cada per-
sona que recuerde el mayor número de palabras posible. Las puntuaciones de recuerdo son
las siguientes:
3, 7, 5, 9, 4, 6, 5, 7, 8, 11, 10, 7, 4, 6, 8
------------------------------------------------------------~
f115
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_l~og~ía______________________
Ésta es una lista de lo que se denomina datos crudos. Tal como se presentan, proporcionan
poca información acerca del fenómeno que se estudia. El lector puede revisar los datos cru-
dos y tratar de obtener una idea de su aspecto, pero posee mayor eficacia utilizar alguna
forma de estadística de resumen o despliegue gráfico para presentar los datos. Esto es aún
más cierto cuando hay un número mayor de puntos de datos.
El tipo más común de estadística de resumen es el que trata de presentar alguna espe-
cie de valor central de los datos. Esto suele denominarse promedio. Sin embargo, hay más
de un promedio; a continuación se presentan los tres más comunes.
Media. La media es aquello en lo que la gente suele pensar cuando utiliza el término pro-
medio. Se encuentra al sumar las puntuaciones y dividir la respuesta entre el número de
éstas. Para encontrar la media de recuerdo del grupo de 15 participantes, sumaría las 15
puntuaciones, lo que daría un total de 100, y luego dividiría el resultado entre 15, lo cual
significaría una media de 6.667. El símbolo más común para la media de una muestra es x.
Los expertos en estadística emplean letras minúsculas del alfabeto latino para simbolizar
estadísticas calculadas a partir de una muestra.
Mediana. La mediana es el valor que se encuentra en medio de todos los valores. Por tan-
to, para encontrar la de recuerdo del grupo de 15 participantes, deben ordenarse las puntua-
ciones de recuerdo.
Ahora cuente hacia arriba, hasta la persona con el octavo mejor recuerdo (la situada en una
posición donde el número de sujetos con mejor recuerdo es el mismo que los que tienen
peor recuerdo). Su recuerdo es la mediana del grupo. En este caso, la mediana de recuerdo
es 7. De haber un número par de personas, no figuraría persona alguna en medio del gru-
po. En ese caso, la mediana caerá entre la mitad con el peor recuerdo y la mitad con el me-
jor recuerdo. Tome la media del individuo con el mejor recuerdo de la mitad inferior del
grupo y la persona con el peor recuerdo de la mitad superior. Ese valor será la mediana
del grupo. Si una persona con una puntuación inferior a 7 se agregase a las 15 puntuacio-
nes mostradas en la tabla 9.1, la mediana estaría entre el 7o. y el 8o. rangos actuales, en
6.5. Sin embargo, si se agregase a los 15 una persona con una puntuación de 7 o más, la
mediana se encontraría entre los actuales 7o. y 8o. rangos, en 7.
Modo. El modo es el valor que más se presenta entre los participantes. En la tabla 9.1 la pun-
tuación de recuerdo más frecuente fue 7. Como la mediana, el modo se identifica mejor si
las puntuaciones se ordenan por magnitud. 1·
Medidas de dispersión
Máximos y mínimos. Sí reporta los valores mayor (el máximo) y menor (el mínimo) en la
muestra, da una idea de la dispersión de tal muestra. Por tanto, si todos en la muestra re-
cordaron 7 palabras, entonces el máximo y el mínimo serían 7, mientras que la muestra de
dispersión más amplia tendría un máximo de 11 y un mínimo de 3.
Rango. Otra forma de expresar el máximo y el mínimo consiste en restar el mínimo al
máximo para dar el rango de valores. Esa cifra permite que diferentes muestras tengan ran-
gos similares aunque difieran sus máximos y mínimos. Por ejemplo, una muestra puede
tener un recuerdo máximo de 9 y uno mínimo de 1, en tanto que otra puede tener un re-
cuerdo máximo de 11 y uno mínimo de 3. Al reportar su rango, puede ver claramente que
ambas tienen la misma dispersión de 8 palabras.
_________________________R_es_u_m_e_n~y~d_e_s_ ·n_d_e_d_a_t_os________________~f119
cn~·p~c_io_
Tanto el rango como el máximo y el mínimo aún tienen problemas para resumir de ma-
nera suficiente al grupo, pues tratan sólo con valores extremos. La falla se encuentra en que
no considera si esos extremos son comunes. Por ende, una muestra de 15 personas podría
incluir una con un recuerdo de 3, otra de 11 y todo el resto el mismo recuerdo de 7. El grupo
tendría el mismo máximo y mínimo (y, por tanto, igual rango) que otro grupo cuyas pun-
tuaciones de recuerdo tuvieran una dispersión más equitativa entre 3 y 11.
Rango intercuarmar. Para calcular el rango intercuartilar se localizan las puntuaciones si-
tuadas en el25o. (en otras palabras, el valor de puntuación más alto del 25% inferior) y en
el 75o. percentiles (el valor de puntuación más alto del 75% inferior) y se anota su diferen-
cia. Si tomamos como referencia !a tabla 9.1, veremos que el25o. percentil es 5 y el 75o.
8. Por tanto, el rango intercuartilar es 8 - 5 = 3. El rango intercuartilar tiene la ventaja de
que lo afectan menos las puntuaciones extremas que el rango, calculado con el máximo y
el mínimo.
Varianza. La varianza tiene en cuenta la diferencia entre el valor de cada persona y la media
del grupo. Para calcularla se anota cuánto difiere (o se desvía) cada puntuación de la me-
dia. Utilizaré como ejemplo las puntuaciones de recuerdo de una muestra de 5 personas.
Palabras recordadas
1
2
3
4
5
Ahora queremos resumir las desviaciones. Sin embargo, si sumáramos las desviaciones,
obtendríamos cero; y ello sería siempre igual para cualquier conjunto de números. Una ma-
nera de sortear tal dificultad consiste en elevar al cuadrado las desviaciones antes de su-
marlas, ya que eso elimina los signos negativos.
~L--------------~In~v~e~st~ig~a~c~io~·n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Palabras recordadas Desviación de la media Desviación al cuadrado
1 -2 4
2 -1 1
3 o o
4
5 2 4
Ahora, cuando sumamos las desviaciones al cuadrado obtenemos 1O. Para identificar la va-
rianza, dividimos la suma de las desviaciones al cuadrado entre el número de puntuaciones
(5) y obtenemos una varianza de 2.
Un grupo de dispersión más equitativo tendría una varianza mayor, pues habría más personas
cuyo recuerdo diferirla de la media. Si dos de 15 participantes tienen puntuaciones de 3 y
11 palabras, mientras que todas las demás recuerdan 7, la varianza será 2.134. Por otra par-
te, la muestra distribuida de manera más equitativa, que se observa en la tabla 9.1, tiene una
varianza de 4.889. La varianza se utiliza, como la media, en muchas técnicas estadísticas.
Para complicar el tema, los expertos en estadística han observado que si tratan de estimar,
a partir de los datos reunidos, la varianza de la población de que provienen los participan-
tes, obtienen un estimado más exacto si dividen la suma de los cuadrados de las desviaciones
entre el número de elementos de la muestra, menos uno. Esta versión de la varianza es la
que suelen dar los programas de cómputo y la que se utiliza en pruebas estadísticas. En es-
ta versión, la varianza para el conjunto de puntuaciones de dispersión más equitativa será
5.238.
Desviación estándar. La desviación estándar (so DE) se vincula directamente con la va-
rianza porque es la raíz cuadrada de ésta; por tanto, suele representarse como s 2 la varian-
za de una muestra. La desviación estándar que los programas de cómputo en general dan
se deriva de la varianza, que supone la división de la suma de las desviaciones al cuadra-
do entre el número de puntuaciones menos uno, pues también constituye la mejor esti-
mación de la desviación estándar de la población. Por tres razones se prefiere la desviación
estándar sobre todas las medidas de dispersión, cuando se resumen datos.
En primer lugar, es -igual que la varianza-- una medida de dispersión relacionada
con la media. Por consiguiente, cuando se reporta la media es apropiado notificar la des-
viación estándar. En segundo término, las unidades en que se expresa la desviación estándar
son las mismas que la medición original, esto es, puede decirse que la desviación estándar de
recuerdo es de 2.289 palabras para el conjunto de puntuaciones de dispersión más equita-
tiva. En tercer sitio, la desviación estándar se usa en ciertas circunstancias para indicar la
proporción de personas de la población que se inscriben en un rango determinado devalo-
res. Consulte en el capítulo 12 una explicación más completa del tema.
•
------------------------~R~e~su~m~e~n~y~de=s~c~ri~pc=i~ón~de~d~at~o~s--------------~¡121
Desviación intercuartilar. Cuando se cita una mediana, la medida apropiada de dispersión
es la desviación intercuartilar. Se trata del rango entre cuartiles dividido entre 2. En el ejem-
plo de las 15 calificaciones de recuerdo la desviación intercuartilar sería 2. = 1.5.
2
Datos nominales
Si se trata con 'variables que tienen niveles en forma de categorías, los números son frecuen-
cias; es decir, el número de personas situadas en una categoría específica. Por ejemplo,
cuando hemos encontrado cuántas personas de un grupo fuman tiene poco sentido aplicar
las técnicas mostradas antes para resumir los datos. Podemos utilizar varios métodos de
presentación basados en el número de personas de una categoría determinada. Por ejemplo,
podemos simplemente reportar el número de fumadores (digamos 10) y el de no fumadores
(digamos 15). Como alternativa, podemos expresar esas cifras como fracciones, proporcio-
nes o porcentajes.
Fracciones
Para encontrar una fracción buscamos el número total de personas (25) y expresamos el de
fumadores como una fracción de ese total. Por tanto, 10 de 25, o .!..Q, de la muestra eran fuma-
25
dores; 15 de 25, o~. no. Podemos simplificarlo aún más porque 10, 15 y 25 son divisibles
25
entre 5. Así, diremos que ~ eran fumadores y 2. no.
5 5
Proporaiones
Podemos encontrar proporciones a partir de fracciones si convertimos las fracciones en deci-
males. Por tanto, al dividir 10 entre 25 (o 2 entre 5) se nos indica que 0.4 de la muestra eran
fumadores, mientras que 15 dividido entre 25 (o 3 entre 5) revela que 0.6 de la muestra no
fumaban. Tenga en cuenta que las proporciones de todos los sub grupos deben sumar 1: 0.4 +
0.6 = l; esto puede servir como comprobación de que los cálculos son correctos.
Porcentajes
Para encontrar un porcentaje debe multiplicar una proporción por 100. Así, de la muestra,
40% corresponde a fumadores y 60 a no fumadores. El porcentaje de todos Jos subgrupos
sumará lOO.
122lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_i_ta_tJ_·v_a_e_n~p_si_co_L_o~gí_a____________________
Distribuciones de frecuencia
Si hemos preguntado a una muestra de 120 personas cuál es su grupo de edad podemos re-
presentar esto en una tabla simple:
Tablas de contingencia
Cuando los niveles de las variables son nominales (u ordinales, como en el último ejemplo);
pero se consideran dos variables, los datos pueden presentarse como una tabla de contingen-
cia. Imagine que hemos preguntado a 80 personas (50 hombres y 30 mujeres) si fuman.
Fumadores No fumadores
Hombres 20 30
Mujeres 12 18
Sin embargo, a veces resulta más apropiado, sobre todo con fmes de comparación entre
grupos con muestras desiguales, reportar proporciones o porcentajes. El reporte de los datos
crudos de que 20 hombres y 12 mujeres fuman dificulta la comparación entre géneros: 20
de 50 se vuelve 20 = 0.4, o 4 de 10; 12 de 30 se toma ~ = 0.4, o 4 de 10, también. Ex-
50 30
presado así, puede verse que pese a los distintos tamaños de muestra, hay proporciones
equivalentes de fumadores entre las muestras de hombres y mujeres.
__________________________R_e_su_m_e_n_y~d_e_sc_n~
· p_c_ió_n_d_e_d_a_t_os________________~¡-123
Una ventaja adicional del reporte de proporciones es que el lector puede calcular con rapi-
dez las proporciones o los porcentajes que no caen en una categoría. Por tanto, 0.6 o 60%
de hombres y 60% de mujeres de la muestra no fuman.
Métodos gráficos
Hay muchas formas de resumir gráficamente los datos. La ventaja de un resumen gráfico
es que comunica al lector aspectos de los datos, como tamaño relativo, de manera más ': 11-
v
mediata que las tablas equivalentes. Se tienen por lo menos dos desventajas. Primera, a ve-
ces resulta dificil obtener los valores exactos de una gráfica. Segunda, con frecuencia quien
las elabora no tiene en cuenta que tal vez algunos lectores no estén acostumbrados a las
convenciones relacionadas con las gráficas. Ello se toma menos problemático cuando se
encuentran en un artículo, pues el lector puede dedicar tiempo a descubrir lo que se repre-
senta. El peligro principal surge cuando se utilizan para ilustrar una charla y no se da tiempo
suficiente a los escuchas para verlas ni se explican a cabalidad las convenciones que se
usan. E¡l primer problema se resuelve proporcionando tablas y gráficas, pero algunas revis-
tas desalientan tal práctica.
La mayoría de la exhibición gráfica de datos emplea dos dimensiones, o ejes: una para
los valores de la variable independiente y otra para la dependiente. Por convención, el eje
vertical representa la variable dependiente y el horizontal la independiente. A menudo no
hay variables dependientes o independientes obvias; en ese caso, han de colocarse las va-
riables en los ejes de la manera en que tenga más sentido a la luz de la convención.
Como alternativa, con tamaños de muestra desiguales un mejor método consiste en mos-
trar en la misma barra el número de fumadores y no fumadores .
"' 50 O No fumadores
"'5 40 • Fumadores
"'
~ 30
Cl>
-o 20
e
~ 10
• :::l
z o
Hombres Mujeres
Género
Histogramas
Los histogramas son similares a las gráficas de barras, sólo que éstas se tocan entre sí, y
tienden a usarse cuando los niveles de las variables independientes son cuantitativos, como
en el ejemplo de grupo de edad mostrado en la tabla 9.2. Algunos dirán que lo~ histogra-
mas deben reservarse para variables continuas, pues el contacto entre las barras implica que
los valores no son discretos. Considero innecesaria tal distinción.
"' 50
"'
e:
~ 40
:!i 30
Cl>
-o 20
e
~ 10
•:::l
z o 1
20·29 30·39 40·49 50·59 60·69
Edad (en años)
60-69 20-29
De modo alternativo, las áreas pueden expresarse como porcentajes con una clave (o leyen-
da) para mostrar a cuál subgrupo pertenece cada rebanada o sector.
~ 20-29
• 30-39
~ 40-49
~ 50-59
~ 60-69
~ 20-29
.30-39
~ 40-49
~ 50-59
~ 60-69
También resulta factible mostrar más de un conjunto de datos en gráficas de pastel separa-
das, de modo que los lectores puedan compararlas.
Mujeres Hombres
60%
• Fumadores
O No fumadores
Una ayuda visual adicional consiste en representar los diferentes números de participantes
de cada rebanada o sector haciendo un pastel más grande para una muestra mayor.
..
--~----------------------R_e_su_m_e_n~y_d_e_sc_r~ip_c_ió_n_d_e_d_a_t_o_s______________~¡-127
60%
60%
• Fumadores
D No fumadores
e
Figura 9.8. Porcentaje de fumadores y no fumadores entre hombres y mujeres.
3.0
2.5
"'
'ü
e:
2.0
(])
::J
u
~ 1.5
LL..
1.0
0.5
0.0
3.0 4.0 5.0 6.0 7.0 8.0 9.0 10.0 11.0
Número de palabras recordadas
En la figura 9.9 se aprecia de un vistazo que 7 es el modo, el cual se encuentra casi en me-
dio de la dispersión de puntuaciones y que el mínimo es 3 y el máximo 11. En la figura 9.3
se observa una distribución de frecuencia de edad, pero las barras tienen anchos de 10 años.
2 o
4 0000
6 00000
8 000
10 00
Los valores del tallo dan el primer número del rango de puntuaciones contenidas en la ho-
ja. En la versión de la gráfica de tallo y hojas, los O de las hojas denotan simplemente el
número de puntuaciones que caen en el rango específico. Por tanto, el 2 indica que las pun-
tuaciones en el rango de 2 a 3 están contenidas en esa hoja y el O único de la hoja muestra
que hay sólo una puntuación en ese rango.
La naturaleza del tallo puede cambiar según la dispersión de puntuaciones. A continua-
ción se muestra la gráfica cuando la 15a. puntuación es 25 en lugar de 11:
o 344
o 5566777889
o
2
2 5
Figura 9.11. Gráfica de tallo y hojas de número de palabras recordadas (con una
puntuación extrema).
tallo y hojas sobre el histograma es que podemos leer las puntuaciones reales, aunque ca-
da tallo se base en un amplio rango de puntuaciones, como en el último ejemplo. Observe
que, aunque una parte del tallo no tenga una hoja correspondiente, aún debe mostrarse esa
parte del tallo (fig. 9.11).
1 3 30
2 4 25
3 4 28
4 5 30
5 5 25
6 6 23
7 6 24
8 7 23
9 7 21
10 7 23
11 8 23
12 8 18
¡:J!)
13 9 19
14 10 20
IUUO.··
15 11 19
----------------------------------------
13ol Investigación cuantitativa en psicología
12
11 o
"'
"'
"O
10 o
"'
'E
o
V 9 o
....
Cl>
"'~ 8 o o
.t:l
7 o o
"'
-¡¡;
a.
Cl> 6 o o
"O
e 5 o o
Cl>
E
•::J 4 o o
z
3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)
Maneras de representar puntuaciones iguales (empates). Hay varias formas de mostrar que
varios puntos de datos son iguales. Un método consiste en usar números como símbolos y en
representar el número de puntos de datos que coinciden por el valor del número.
___________________________R_e_s_
um e_n~y_d_e_s_c_ri~pc_i_ó_n_d_e_d_a_t_os________________~¡-131
__
12
11
V>
<O 10
"O
<O
"O
9
C5
u
~ 8
V>
~
_.o
<O
7 2
-¡¡;
c..
OJ 6
"O
eOJ 5
E
- ::J
z 4
2
16 18 20 22 24 26 28 30 32
Otro método estriba en hacer que el tamaño del símbolo denote el número de puntos de da-
tos coincidentes.
12
V> 11 o
<O
"O
<O 10 o
.....
"O
o
u 9 o
~
V>
<O
8 o o
.2i<O
-¡¡;
7 o o
c..
OJ
6 o o
"O
o
..... o o
OJ
E
- ::J
4 o o
z
3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)
1JZlL--------------~I~nv~e~st~ig~a~c_ió_n_c_u_a_nt_it_a_ti_va__en~p_
si_co_lo~g~ía_____________________
Una técnica adicional consiste en utilizar lo que se llama girasol. Aquí, el número de pun-
tos de datos coincidentes se representa con el número de pétalos de una flor.
12
11 o
"'<O
""E
<O 10 o
o 9 o
...
ijj
8 o o
..."'
f
<O
.o
<O
7 o
-¡;;
a.
41
6 o o
"e 5 o o
41
E
•::::1
4 o o
z 3 o
2
16 18 20 22 24 26 28 30 32
Tiempo de articulación (décimas de segundo)
Graficación de medias
Una var;able ;ndepend;ente
Gráficas de líneas. Para este ejemplo, imagine que los investigadores desean explorar la
eficacia de dos técnicas de memorización. La primera requiere que los participantes rela-
cionen los elementos de una lista de palabras con un conjunto de elementos aprendidos pre-
viamente y que riman entre sí: uno-ayuno, dos-veloz. Por ejemplo, la lista que habrá de
aprenderse podria empezar con las palabras caballo y pato. Se estimula a los participantes
a formar una imagen de un caballo en ayuno y de un pato veloz. Esta técnica se llama pa-
labras gancho. La segunda técnica precisa que los participantes imaginen que caminan por
una ruta que les resulta familiar y que coloquen cada artículo de una lista de palabras en la
ruta, de modo que cuando deseen recordar los artículos imaginen que caminan una vez más
por la ruta (conocido como método de ubicación o locz). Los investigadores también inclu-
yen una condición control en que no se da capacitación a los participantes.
Las medias y las desviaciones estándar para las tres condiciones se muestran en la ta-
bla 9.6 y en la figura 9.16.
__e_
___________________________R_e_s_um n~y_d_e_s_c_ri~p_
ci_ó_n_d_e_d_a_t_o_s________________~~
10
Vl
o "'
"O
L.. " '
9.5
QJ"O
E Í5 9
-~ ~
QJ Vl 8.5
"Oro
.,_o
·-:;:o."'
-o_
QJ "'
8
QJ 7.5
"O
7
Control Palabras gancho Método de ubicación
Estrategia nemotécnica
Esto sugiere que el uso de la nemotécnica mejora el recuerdo y que el método de ubicación
es la mejor de las dos técnicas. Sin embargo, conviene ser cauteloso en relación con lama-
nera en que se despliega la información. Observe que el rango de puntuaciones de recuerdo
posibles mostrado en el eje vertical sólo va de 8.6 a 10. Tal truncamiento del rango devalo-
res puede sugerir una diferencia entre grupos mayor que la real. En la figura 9.17 se mues-
tran las mismas medias, pero con el eje vertical sin truncarse.
Figura 9.17. Media de palabras recordadas para tres diferentes grupos de memoria
(eje· vertical no truncado).
1J4l~_______________l_nv_e~st~ig~a~c~ió_n_c_u_a_nt_it_a_ti_va~en~p_si_co~lo~g~ía~-------------------
Observe que la diferencia entre las medias no parece tan marcada en la gráfica anterior.
Gráficas de barras. Las medias de dos variables independientes también pueden mostrar-
se con gráficas de barras. En realidad, como la medida del eje horizontal es discreta (y no-
minal, en este caso), las gráficas de barras pueden considerarse más apropiadas porque no
tienen líneas que conectan las medias y que podrían implicar una continuidad entre los ni-
veles de la VI usada en la investigación.
10
~ 9
e~ s
lli"E 7 -
Eo
·~ ~ 6
Q¡ "' 5
~~ 4
" 111 3
~~ 2
~ 1
0+-~----L--+--~---L--+-~----L-~
Tabla 9. 7. Media de recuerdo de palabras de grupos a los que se dieron listas vinculadas
y desvi nculadas de palabras para que las recordaran mediante diferentes
técnicas de memorización.
• • •
12
ca
V\
10
o "O
'- ca
v-o
E C; 8
•:::1
<:: ~
u -+- Vinculada
<1! V\ 6
----- Desvinculada
"O
ca.n
e
'5
v-"' 4
~~
<1! 2
"O
o
Control Palabras Método
gancho de ubicación
Estrategia nemotécnica
Figura 9. 19. Media de número de vocablos recordados con tres estrategias nemotécnicas
cuando las palabras de la lista están vinculadas o desvinculadas.
A partir de lo expuesto, el lector puede ver que, generalmente, el recuerdo fue mejor en las
listas vinculadas, pero se produjo la mayor mejora, sobre las desvinculadas, cuando los
participantes estaban en la condición control donde no utilizaban técnica de memorización
alguna.
Gráficas de barras. También es posible presentar las medias de dos variables indepen-
dientes con una gráfica de barras.
12
10
"'
V\
o "O
._ ca
<1!"0 8
E C;
'~ ~ • Vinculada
<1! 6
"O
V\
e O Desvinculada
. !!!~
alíií
~c.
4
<1!
"O 2
o
Control Palabras Método
gancho de ubicación
Estrategia nemotécnica
Gráficas de lineas
Si graficamos medias y desviaciones estándar para las tres condiciones de memoria obten-
dremos lo siguiente:
12
11
"'"'
"O
"'
"E 10
o
u
.....
Q¡
"'.....
"'
.o
9
~
"'a.
Q¡
8
"O
o
.....
Q¡ 7
E
.::;,
z
6
S
Control Palabras Método
gancho de ubicación
Estrategia nemotécnica
Figura 9. 21 . Las medias y las desviaciones estándar de palabras recordadas con las
tres estrategias nemotécnicas.
Las líneas verticales muestran una desviación estándar arriba y abajo de la media. Eso re-
fleja que la diferencia entre las tres condiciones no es tan clara como sugiere la gráfica que
sólo incluyó las medias. Aquí podemos ver que los tres métodos tienen un alto grado de su-
perposición. En el capítulo 12 se abordan otras medidas de dispersión que pueden incluir-
se en una gráfica de líneas.
_________________________R_~_u_m_e_n~y_d_e_s_ __ió_n_d_e_d_a_t_os________________~j137
cn~·~
Gráficas de barras
Con una gráfica de barras, sobre todo si éstas habrán de sombrearse, es mejor mostrar só-
lo una desviación estándar arriba de la media.
12
11
"'"'
'O
"'o
....
'O
10
~
....
"'~ 9
.Q
"'
-¡¡;
c. 8
Q¡
'O
o
.... 7
Q¡
E
•::J
z 6
5
Control Palabra.s Método
gancho de ubicación
Estrategia nemotécnica
Figura 9.22. Las medias y las desviaciones estándar de palabras recordadas con las tres
estrategias nemotécnicas.
Sería posible representar las desviaciones estándar para los niveles de dos VI en una gráfi-
ca de barras.
Diagramas de caja
Un diagrama de caja ofrece al lector gran cantidad de información útil. En este ejemplo. in-
cluí los datos de 15 personas a quienes se dio una lista para recordar (los datos mostrados
en la tabla 9.1 ).
~L--------------~I~nv~e=s~ti~ga~c~io~'n~cu~a~n=tl=·ta~t~iv~a~e~n~ps~ic~o~lo~g~í~a_____________________
12
~ 11 o
"<O
T
10
'E
~ 9
"' 8
~
.g 7
iú
a. 6
Ql
"
e 5
_L
~ 4
· ::;)
z o
2
[
~ 9 -Bigotes
"' 8 Bisagra superior
.ge
~
Ql
7
6 ''""'"
(50%)
Mediana
Los bigotes pueden extenderse a lo que se denomina bardas exteriores superior e in-
ferior (no mostradas en la figura 9.24). Los puntos situados entre las bardas interior y exte-
rior pueden ser extremos y deben examinarse. Resulta muy probable que los puntos que se
encuentran más allá de las bardas exteriores sean extremos y pueden excluirse legítimamen-
te una vez que se hayan comprobado las razones para que dichos valores sean tan extremos.
Al agregar alguien cuyo recuerdo es de 25 palabras y volver a calcular el diagrama de
caja se muestra que esa persona cae más allá de las bardas interiores.
27.5
"'
V>
"'O 25 o
"'o
"E 22.5
u
~
20
17.5
-.--
V>
~
.o 15
"'o.
-¡;;
12.5
<IJ
10
...o
"'O
<IJ
7.5 1
+
E 1 1
5
z
·~
2.5
.
Figura 9.25. Diagrama de caja del recuerdo de un adulto con una puntuación extrema
y una barda exterior superior agregada.
La distribución de datos
Observar la distribución de datos es una razón para producir un histograma o una gráfica
de tallo y hojas. Esto resulta importante porque varias pruebas estadísticas deben aplicarse
a un conjunto de datos sólo si la población de que proviene la muestra se amolda a una dis-
tribución en particular (la distribución normal).
__________. _ ~~ --e:;::
14Dl~-------------~'~nv~e=s~ti~ga~c~ió=n=c=u=a=nt~it~a=ti_va~e=n~p~si=co~l~og~í~a____________________
La distribución normal
Cuando una variable está distribuida normalmente, la media, la mediana y el modo son
iguales. Además, el histograma muestra que tiene una distribución simétrica en ambos la-
dos de la media (la mediana y el modo). Por ejemplo, si una prueba de IQ tiene una media
de 100 y una desviación estándar de 15 y si se aplica a 16 000 personas, las puntuaciones de
éstas tendrán una distribución normal, como se muestra en seguida:
3000
..
"'eo r-
VI
2 000 - -
....
-
VI
Q¡ r-
c.
Q¡
r-
"O
o r-
....
Q¡
1000
E
•:::J r-
r-
z
o
40 50
A
60 70 80 90 100 110 120
~
130 140 150
IQ
Observe que a medida que el IQ que se grafica se aleja de la media, menos personas tienen
ese IQ. Por tanto, son menos las personas con un IQ de 90 que con uno de 100. Debidq a
su forma, a veces se le denomina curva de campana. Otro nombre es curva de Gauss, por
uno de los matemáticos que la identificaron (Carl Friedrich Gauss).
En realidad, la distribución normal es una distribución teórica; es decir, en realidad no
existe. Se considera que los datos están distribuidos normalmente cuando se asemejan a la
distribución teórica. La distribución normal es continua y, por tanto, forma una curva sua-
ve, como se muestra en la figura 9.27.
Sesgo
Se dice que una distribución está sesgada cuando no es simétrica a ambos lados de la me-
dia (la mediana o el modo). El sesgo puede ser positivo o negativo.
___________________________R_e_s_um
__e_n~y_d_e_s_c_ri~pc_i_ó_n_d_e_d_a_t_os________________~¡-1.41
Valor de variable
Sesgo positivo
Por ejemplo, podríamos probar el recuerdo de una muestra y encontrar que algunas perso-
nas tienen memorias particularmente buenas. Observe que la cola de la distribución es más ·-·
larga en el lado en que son mayores las puntuaciones de recuerdo.
20
"'
Vl r-
e f--
oVl
L...
Q)
f--
c. - f-
Q) r-
-o 10 -
o -
:¡; r-
E r- f--
•:J -,-
z
lnmm
-,-
-
o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Sesgo negativo
Esta muestra podría incluir una gran proporción de personas que han practicado nemo-
técnica. Ahora, la cola de la distribución es mayor donde las puntuaciones de recuerdo
son menores.
20
r-
"'"'e: r
o r
~ r
~ r-
~ 10 r-
e
41
r-
E r-
• ::J
z r
-m-miT
r
o
0.5
2.5
4.5
6.5
8.5
10.5
12.5
14.5
16.5
18.5
20.5
22.5
24.5
26.5
28.5
n
30.5
Número de palabras recordadas
Curtosis
Curtosis es el término utilizado para describir cuán angosta o ancha resulta una distribu-
ción. La distribución relativamente plana se describe como platicúrtica (fig. 9.30) y la rela-
tivamente alta y angosta como leptocúrtica (fig. 9.31); la normal es mesocúrtica.
------~-----.-------------R_e_s_u_m_e_n~y_d_e_s_c_ri~p_cl_.ó_n_d_e_d_a_t_o_s________________~¡-1.43
Valor de variable
"'e:
·e;
(j)
::J
u
....(j)
LL.
Valor de variable
El sesgo y la curtosis influyen en cómo deben analizarse e interpretarse los datos. Los pa-
quetes estadísticos dan índices de sesgo y de curtosis. Sin embargo, como veremos, éste
suele ser más problemático que aquélla. Los efectos de las distribuciones no normales se
tratan en los capítulos sobre el análisis. La interpretación de los índices se aborda en el
apéndice l.
"
144lL--------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti~va~e~n~p~si~co~l~og~í~a____________________
o
'U
"'l¡¡o.
"'QJ
-¡¡¡ o
E
::;
e
'-
o -1
~
o
-2
o
-3
-10 o 10 20 30 40
Valor observado
Resumen
La primera etapa del análisis de datos debe incluir siempre algún tipo de resumen de los
datos. Ello puede hacerse de manera numérica o gráfica (o de ambas). El proceso permite
determinar s i los resultados de la investigación concuerdan con la hipótesis de los inves ti-·
gadores. Además, serán útiles para ayudar a identificar puntuaciones inusual es y, cuando se
reporten los resultados, como una manera de describir los datos.
Resumen y descripción de datos
------------------------------~--~~----------------------~
["145
Con frecuencia, las gráficas se emplean para identificar la distribución de los datos.
La distribución normal es una pauta particularmente importante para los datos porque, si
está presente, pueden aplicarse a los datos ciertas técnicas estadísticas. La distribución de
éstos puede apartarse de la normal por estar sesgada (no simétrica) o tener curtosis (creando
una forma plana o alta y angosta). Las gráficas de cuantil-cuantil normal ayudan a detectar
datos que tienen una distribución normal.
En el capítulo siguiente se describirá el proceso que los investigadores utilizan como
ayuda para decidir si los resultados de su investigación han apoyado su hipótesis.
SIIE
10
Más allá de la descripción
Introducción
En el presente capítulo se explica cómo se utilizan los resultados para probar hipótesis. Se
presenta la noción de probabilidad y se muestra cómo la decisión de rechazar o aceptar la
hipótesis depende de la probabilidad de que Jos resultados hubieran ocurrido por azar.
Prueba de hipótesis
La expresión formal de una hipótesis de investigación siempre se realiza en términos de dos
hipótesis relacionadas. Una es la experimental, alternativa o de investigación (a menudo se
muestra como HA o H 1). Se trata de una afirmación que postula el resultado del estudio
como lo predicen los psicólogos. Por ejemplo, en el capítulo 9 observamos un trabajo sobre
la re lación entre la velocidad con que la gente pronunciaba una lista de palabras (velocidad
de articulación) y el recuerdo de éstas. En este caso, la hipótesis de investigación sería: hay
una relación positiva entre la velocidad de articulación y la memoria de corto plazo. La
segunda hipótesis es la nula (H0) . Por lo general, es una afmnación de que una VI no tiene
efecto sobre una VD o de que no hay relación entre variables. Por ejemplo, no hay relación
entre la velocidad de articulación y la memoria de corto plazo.
Puel.!e plantearse sólo una HA para cada H 0, aun cuando en la investigación se pruebe
más de una hipótesis. En otras palabras, cada H A debe tener una H 0 equiparable. Habrá nota-
do que sólo en raras ocasiones los psicólogos mencionan de manera explícita su hipótesis
146
--------------------------~Má~·=s~a=ll=á~d=e_la~d~es~c~ri~~~i~ón~----------------~1147
cuando reportan sus investigaciones, y que es aún más raro que mencionen su hipótesis nu-
la. Recomiendo que durante la etapa en que aprenda acerca de la investigación y la prueba
de hipótesis haga explícitas las hipótesis de investigación y nula. Así comprenderá mejor los
resultados de la prueba de su hipótesis.
Probabilidad
Como se explicó en el capítulo 1, nunca puede probarse que una hipótesis es verdadera. Lo
mejor que podemos hacer estriba en evaluar los datos para ver si resulta improbable que H 0
sea verdadera. Podemos hacer esto sólo sobre la base de la probabilidad de que el resul~
do obtenido habría ocurrido si H 0 fuera cierta. Si es poco probable que nuestro resultado
ocurriera por azar, podemos rechazar H0 y aceptar HA. Por otra parte, si es probable que
nuestro resultado ocurriera por azar, entonces no podemos rechazar H0 .
Para analizar el significado de probabilidad, usaré un ejemplo simple, donde la proba-
bilidad de que cierto resultado se produzca por azar se calcula de manera directa. Esto se
diseñó para demostrar que diferentes resultados pueden tener distintas probabilidades de ocu-
rrir, aun cuando se obtengan del mismo evento al azar.
Si tomamos una moneda que no está "cargada" y la lanzamos al aire, habrá sólo dos
resultados, igualmente posibles: caerá cara o cruz. En otras palabras, la probabilidad de que
caiga cara es una de dos o 112. De igual manera, la probabilidad de que caiga cruz es de
1/2. Tenga en cuenta que cuando sumamos las dos probabilidades el resultado es uno. Esto
último es cierto en cualquier situación; sin importar cuántos resultados posibles haya en
una situación, si calculamos la probabilidad de cada uno y sumamos esas probabilidades el
resultado será uno. Ello significa simplemente que la probabilidad de que ocurra por lo me-
nos un resultado es de uno. Las probabilidades suelen expresarse como proporciones de
uno. Por ejemplo, la probabilidad de una cara es 0.5 y la de una cruz de 0.5 también. En oca-
siones, las probabilidades se expresan asimismo como porcentajes. Por ejemplo, hay 50%
de oportunidadés de que una sola moneda caiga cara y 100% de que salga cara o cruz.
Imagine que una amiga dice que puede influir en el resultado del lanzamiento de mone-
das haciendo que caigan cara. Convirtamos esto en un estudio para probar su afirmación.
Estableceríamos nuestras hipótesis:
HA: nuestra amiga puede hacer que las monedas caigan cara.
H 0: nuestra amiga no puede influir en la caída de las monedas.
Sabemos que la posibilidad de que una moneda caiga cara por azar es de 0.5. Por tanto. si
la lanzamos y cae cara, sabríamos que era muy probable que esto sucediera por azar y no
tendríamos pruebas suficientes para rechazar la hipótesis nula. En realidad, ésta no consti-
tuye una prueba justa de nuestras hipótesis, pues ningún resultado del estudio en parricular
es suficientemente improbable por azar para servir de evidencia contra la hipótesis nula.
~~----------------ln_v_e~~_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
Para que la prueba de nuestra hipótesis resultara más justa necesitaríamos una situa-
ción en la que fuera improbable que algunos resultados ocurrieran por azar. Si complicamos
ligeramente la situación, veremos que diferentes resultados pueden tener probabilidades
distintas.
Si lanzamos cinco monedas a la vez y anotamos cómo caen, habremos aumentado el
número de resultados posibles. Las posibilidades van desde que todas caigan cara hasta que
todas caigan cruz, pasando porque algunas caigan cara y otras cruz. En realidad, hay cinco
posibles resultados: cinco caras, cuatro, tres, dos, una y ninguna cara.
Sin embargo, algunos resultados podrían obtenerse con más de una combinación, mien-
tras que otros se lograrían sólo de una manera. Por ejemplo, hay cinco combinaciones para
tener cuatro caras. La moneda uno cae cruz mientras todas las demás caen cara, la moneda
dos cae cruz mientras todas las demás caen cara, la moneda tres cae cruz mientras todas las
demás caen cara, la moneda cuatro cae cruz mientras todas las demás caen cara y la moneda
cinco cae cruz mientras todas las demás caen cara. Por otra parte, hay una manera única en
que hubiéramos obtenido cinco caras: que las cinco monedas cayeran cara. En la tabla 10.1
se muestran todas las combinaciones posibles de la caída de las cinco monedas.
Observe que hay 32 combinaciones. Podemos elaborar una distribución de frecuencia
a partir de estos resultados posibles (fig. 10.1).
12
10
8
"'e
'ü
Cll
:l 6
u
....
<1.1
1.1..
o
0.0 1.0 2.0 3.0 4.0 5.0
Número de caras
Figura 10.1 . Distribución de caras y cruces a partir del lanzamiento de cinco monedas.
__io_·n__________________~¡-1.49
----------------------------M~á~s_a_ll_á_d_e_l_a_d_e_sc_n~·pc
Número de combinaciones
Número de caras con que se obtiene Probabilidad
5 1 0.031
4 5 0.156
3 10 0.313
2 10 0.313
1 5 0.156
o 0.031
Por tanto, los resultados menos probables son que todas las monedas caigan cara o cruz;
cada una de tales combinaciones tiene una probabilidad de 1/32, o 0.031, de ocurrir por
azar. Recuerde que esto también puede expresarse como una posibilidad de 3.1% de obte-
ner cinco caras. Pongámoslo de otra manera: si lanzamos las cinco monedas y anotamos el
número de caras y de cruces, y lo hacemos hasta que hayamos lanzado las monedas 100
veces, esperaríamos obtener por azar cinco caras en aproximadamente tres ocasiones.
Las combinaciones más probables son las de tres caras y dos cruces y tres cruces y dos
caras, cada una con la probabilidad de 10/32, o 0.313, de ocurrir por azar. En otras pala-
bras, si lanzamos las cinco monedas 100 veces, esperaríamos obtener exactamente tres ca-
ras en unas 31 ocasiones.
Imagine ahora que hemos hecho el estudio para probar si nuestra amiga puede influir
en las monedas de modo tal que caigan sólo caras. Lanzamos las cinco y caen caras. Sabe-
mos que el resultado pudo ocurrir por azar, pero nos preguntamos: ¿es suficientemente im-
probable que ocurra por azar para arriesgamos a decir que pensamos que puede rechazarse
la hipótesis nula y sustentar nuestra hipótesis de investigación?
Antes de probar una hipótesis, los investigadores establecen un nivel de probabilidad
crítico, de modo que el resultado de su trabajo debe tener una probabilidad igual o menor
que el nivel crítico antes de rechazar la hipótesis nula de que el resultado ocurrió por azar.
Estos experimentadores dicen que el rango de resultados tan probable o menos probable que
la probabilidad crítica se encuentra en la región de rechazo; en otras palabras, es suficien-
temente improbable que estos resultados ocurran al azar para rechazar la hipótesis nula.
___________________________M_á~s_a_ll~á~d~e~la~ ri~~-io_·n__________________~f151
de~s~c_
Significación estadistica
Si el resultado del estudio se encuentra en la región de rechazo, se dice que el resultado es
estadísticamente significativo; si su probabilidad se halla fuera de la región de rechazo, no
se considera estadísticamente significativo. Por convención, en investigación la probabili-
dad crítica suele fijarse en 0.05. En general, se utiliza el símbolo a (la letra griega alfa) para
denotar la probabilidad crítica. Por tanto, a= 0.05 en muchas investigaciones. Este nivel
parece elevado porque constituye otra manera de indicar una oportunidad en 20, pero se ha
elegido como un compromiso entre dos tipos de error que los investigadores llegan a co-
meter cuando deciden si rechazan la hipótesis nula. Si la probabilidad de que nuestro resul-
tado haya ocurrido por azar es igual o menor que a, resulta estadísticamente significativa
y podemos rechazar H 0 . Sin embargo, si la probabilidad es mayor que a, no resulta esta-
dísticamente significativa y no podemos rechazar H 0 .
Como la probabilidad de obtener cinco caras por azar es de 0.031 (por lo general, expre-
sada como p = 0.031) y a que pes menor que 0.05 (nuestro nivel crítico de probabilidad,
a), rechazaríamos la hipótesis nula y aceptaríamos nuestra hipótesis de investigación. Por
consiguiente, concluimos que nuestra amiga puede influir en la caída de la moneda para
producir caras.
Una convención adicional se refiere a cómo escribir acerca de la significación estadís-
tica. A menudo se elimina la palabra estadística y un resultado se describe simplemente
como significativo. En cierto modo, esto es desafortunado, pues torna menos explícito el
hecho de que la significación se relaciona con ciertos criterios estadísticos. Sin embargo,
se vuelve engorroso describir un resultado como significativamente diferente estadística-
mente; por tanto, seguiremos la convención y evitaremos tales expresiones.
Tipos de error
Cualquier resultado puede ser un evento al azar, aun cuando sea muy improbable, pero de-
bemos decidir si deseamos arriesgarnos a rechazar la hipótesis nula, pese a la posibilidad.
Como no podemos saber con seguridad que nuestra hipótesis es correcta, hay cuatro re~Úl
tados posibles de nuestro proceso de decisión y se basan en la decisión que tomamos y la
naturaleza de la realidad (que no podemos conocer).
Realidad
H0 falsa H0 verdadera
Cálculo de la probabilidad
del resultado de la investigación
A menudo, en la investigación psicológica no efectuamos una predicción exacta en nuestra
hipótesis de investigación. En lugar de manifestar que nuestra amiga puede hacer que las
cinco monedas caigan cara, expresamos que puede influir en la caída de las monedas de
manera que caigan cara. Imagine que volvemos a ejecutar el experimento, pero ahora ob-
tenemos cuatro caras en lugar de cinco. Recuerde que nuestra amiga no dijo que podría ha-
cer que cuatro de cinco monedas cayeran cara. En este caso, la probabilidad de obtener ese
resultado sería de 4/32, o 0.156 (tabla 10.2). Ahora, quizá se daría el caso de que ella pudie-
ra influir en las monedas, pero que estuviera pasando por un mal dia. Hemos de advertir que
la probabilidad de que este resultado ocurra por azar es la probabilidad del resultado real,
más las probabilidades de todos los demás resultados posibles más extremos que el alcan-
zado pero que concuerdan con la hipótesis, pues si tenemos en cuenta sólo la probabilidad
exacta del resultado, aun cuando no corresponda a la predicción hecha, estamos dando una
ventaja injusta a la hipótesis de investigación. La probabilidad que usamos ahora es la de
obtener cuatro o más caras; es decir, 0.156 + 0.031 = 0.187. Por tanto, si obtenemos sólo
___________________________M_á_s_a_ll_á~d~e_la~de~s_c_ri~~-i_ón__________________~j153
cuatro caras, no tendríamos justificación para rechazar la rupótesis nula, porque la probabili-
dad es mayor de 0.05. Por consiguiente, concluimos que hay pruebas insuficientes para
apoyar la hipótesis de que nuestra amiga puede influir en las monedas para que caigan cara.
En el caso de cinco monedas, podríamos rechazar la hipótesis nula sólo si todas las mo-
nedas cayeran cara. No obstante, en ciertas situaciones nuestra predicción no podría satis-
facerse plenamente y, sin embargo, aún podemos rechazar la hipótesis nula.
Para demostrarlo, echemos un vistazo a la situación en que lanzamos 1O monedas. En
seguida se muestra que en este caso hay JI posibles resultados que van de cero a 1O caras,
pero ahora hay l 024 maneras en que podríamos lograrlo.
Número de posibles
Número de caras combinaciones para obtenerlo Probabilidad
o 1 0.00098
1 10 0.00976
2 45 0.04395
3 120 0.11719
4 210 0.20508
5 252 0.24609
6 210 0.20508
7 120 0.11719
8 45 0.04395
9 10 0.00976
10 1 0.00098
Imagine que, para probar nuestra hipótesis, lanzamos las lO monedas, pero sólo nueve caen
cara. La probabilidad del resultado (o uno más extremo y en dirección de nuestra hipó-
tesis) estribaría en la probabilidad de obtener nueve caras, más la probabilidad de obtener
10: 0.00976 + 0.00098 = 0.01074. En tal caso, estaría justificado el rechazo de la hipótesis
nula. Por tanto, el resultado no tiene que concordar totalmente con nuestra hipótesis antes de
que podamos considerarla sustentada.
Por fortuna, es muy improbable que alguna vez se vea obligado a calcular la probabi-
lidad del resultado de su investigación. En el capítulo siguiente mostraremos que puede uti-
lizar pruebas estadísticas estándar para evaluar su estudio y que los expertos en estadística
ya calcularon las probabilidades.
154l~ ______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Pruebas de una y de dos colas
Hasta ahora hemos considerado la situación en que nuestra amiga nos indicó que podía lo-
grar que las monedas cayeran cara. Ha predicho la dirección en que ocurrirá el resultado.
Imagine ahora que ella nos ha hecho conjeturar y que ha señalado simplemente que podía
influir en la caída de las monedas de modo que hubiera una mayoría de un tipo, pero no ha
expresado si se trata de caras o de cruces.
Otra vez lanzaremos cinco monedas y nuestras hipótesis serán éstas:
HA: nuestra amiga puede lograr que las monedas caigan de manera tal que la mayoría
caigan del mismo lado.
H 0 (como antes): nuestra amiga no puede influir en la caída de las monedas.
Cuando planteamos nuestra hipótesis original, que las monedas caerán cara, dijimos que el
resultado estará en el lado derecho de la distribución de la figura 10.1 (o la cola derecha de
la distribución). Eso se describe como hipótesis direccional o unidireccional.
Sin embargo, la nueva hipótesis de investigación es no direccional o bidireccional por-
que no estamos prediciendo la dirección del resultado; no estamos señalando en cuál cola de
la distribución esperamos que esté el resultado. Podemos calcular la probabilidad de la si-
tuación, pero ahora debemos tener en cuenta ambas colas. Si las cinco monedas caen cara, la
probabilidad de que todas caigan del mismo lado es la misma de que todas sean cara, más
la probabilidad de que todas sean cruz. Planteado de otra forma: 0.031 + 0.031 = 0.062. Por
lo mismo, en la nueva versión del experimento no rechazaríamos la hipótesis nula, pues
es demasiado probable que este resultado, o uno más extremo, en la dirección de nuestra
hipótesis, ocurra por azar (es decir, que p sea mayor que 0.05, lo cual suele escribirse co-
mop > 0.05).
Cuando la hipótesis establece la dirección del resultado aplicamos lo que se describe
como prueba de una cola de la hipótesis porque la probabilidad se calcula sólo en una "co-
la" (o extremo) de la distribución. Sin embargo, cuando la hipótesis no es direccional, la
prueba se describe como de dos colas porque la probabilidad se calcula para ambos extre-
mos de la distribución.
Con una prueba de una cola, la región de rechazo se encuentra en una cola de la distri-
bución y, así, estaremos dispuestos a aceptar un resultado como estadísticamente significa-
tivo si su probabilidad es de 0.05 o menor, en el lado predicho de la distribución. En otras
palabras, 5% de los casos posibles se sitúan en la región de rechazo (fig. 10.2).
•
--------------------------~M~á~s~a~ll~á~d~e~la~de~s~c_ri~pc~i_ón__________________~f155
Figura 10. 2. Región de rechazo para una prueba de una cola con a = 0.05.
Con una prueba de dos colas, por lo general dividimos la probabilidad de 0.05 en 0.025 en
un lado de la distribución y 0.025 en el opuesto. En otras palabras, 2.5% de los casos posi-
bles se encuentran en una región de rechazo y 2.5% en la otra (fig. 10.3).
Figura 10.3. Regiones de rechazo para una prueba de dos colas con a = 0.05.
Si compara las figuras 10.2 y 10.3, verá que para que un resultado se encuentre en la región
de rechazo cuando aplicamos una prueba de una cola, debe tener menos caras --y aún resul-
tar estadlsticamente significativo-- de las que necesitaría en caso de aplicarse una prueba de
dos colas.
156l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
Resumen
Los investigadores nunca pueden aceptar de manera inequívoca sus hipótesis. Deben eva-
luar la probabilidad de que los resultados obtenidos sucedieran por azar. Con base en ello,
pueden decidir si rechazan o no la hipótesis nula. Por convención, si la probabilidad de que
el resultado ocurra por azar es de 0.05 o menor, se describe como estadísticamente signifi-
cativo y puede rechazarse la hipótesis nula. Este nivel de probabilidad se ha elegido como
el mejor valor para evitar un error tipo I (rechazo de la hipótesis nula cuando es verdade-
ra) y tipo II (fallo al rechazar la hipótesis nula cuando es falsa).
En el capítulo se ha tratado sólo la manera en que los investigadores tienen en cuenta
el peligro de cometer un error tipo l. En el capítulo 14 mostraremos cómo pueden reducir
al máximo la probabilidad de incurrir en uno tipo 11. Además, se mostrarán otras formas de
presentar los resultados y que dependen menos de la prueba de significación.
Ya se explicará en el capítulo siguiente cómo pueden utilizar los investigadores las es-
tadísticas de resumen para obtener conclusiones sobre la población de que provienen sus
muestras. También se analizarán temas relacionados con la manera de seleccionar una mues-
tra de una población.
111 ,.
11
Muestras y poblaciones
Introducción
En este capítulo se presenta la noción de parámetros de población y se describen dos mé-
todos básicos para elegir una muestra de una población: muestreo aleatorio y no aleatorio.
Se explica la noción de intervalo de confianza y se muestra cómo deben estimarse las pro-
porciones en una población a partir de las encontradas en una muestra.
Estadísticas
Las estadísticas de resumen, como la media ( x), la varianza (s 2 ) y la desviación estándar
(s), que se trataron en el capítulo 9, describen la muestra que se midió. Cada estadística tie-
ne un equivalente que describe la población de la cual proviene la muestra; ésta se conoce
como parámetro.
Parámetros
Cada parámetro se simboliza con una letra del alfabeto griego. El equivalente de la media
de la muestra es la media de la población y se denota con 1..1. (la letra griega mu). El equiva-
lente de la varianza de la muestra es la varianza de la población, que se muestra como cr2
(el cuadrado de la letra griega sigma). El equivalente de la desviación estándar de la mues-
tra es la desviación estándar de la población, denotada por cr. Hay una razón para elegir una
letra griega en cada caso: 1..1. es el equivalente de la m en nuestro alfabeto, y a de nuestra s.
--------------------------------------------------------~ 157
~L--------------~In~v~e~st~ig~a~c~ió~n~c~u~a~n~ti~ta~t~iv~a~e~n~p~s~ic~o~lo~g~ía~--------------------
Cuando se propone una hipótesis de investigación, el psicólogo está interesado no só-
lo en la muestra específica de participantes. En cambio, la hipótesis hará una afirmación
más general sobre la población de que proviene la muestra. Por ejemplo, la hipótesis "los
hombres realizan menos labores domésticas que sus compañeras" puede probarse en una
muestra en particular, pero se hace la suposición de que el hallazgo puede generalizarse a la
población más amplia de hombres y mujeres.
A menudo, los parámetros se estiman a partir de encuestas que se han realizado para
identificar pautas de votación o características propias de una población, como la propor- ....
ción de personas que practican cantidades recomendadas de ejercicio diario.
Además, muchas pruebas estadísticas incluyen la estimación de los parámetros de la
población para evaluar la probabilidad de que los resultados de la investigación hayan ocu-
rrido por azar.
-
quede identificada.
1 1
____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_e_s__________________~f159
Los objetivos del estudio ayudarán a definir la población y, a gran escala, a constituir la
muestra. Por ejemplo, si se desea comparar elementos de subpoblaciones, como géneros o
grupos de edad, tratará de lograrse una representación igual de los subgrupos de la muestra.
En las encuestas se emplean dos métodos generales de muestreo: aleatorio (o probabi-
lístico) y no aleatorio (o no probabilístico). Su elección dependerá de los objetivos del es-
tudio y de factores como la exactitud, el tiempo y el dinero.
Muestras aleatorias
En las muestras aleatorias cada elemento de población tiene una probabilidad igual, o una
probabilidad cuantificable, de ser seleccionado. El principio del muestreo aleatorio se com-
prenderá más fácilmente a partir de la descripción del proceso de muestreo aleatorio simple.
Encuestas telefónicas
Cuando se realiza una encuesta telefónica puede caerse en la tentación de usar un directo-
rio. Sin embargo, al menos tres grupos se verán excluidos por el método: quienes no tienen
teléfono; quienes se han mudado recientemente al área y, por tanto, no aparecen en ese catá-
logo, y quienes han elegido que se les retire de éste. En cada caso, la falta de dichas perso-
nas producirá una muestra sesgada.
Una forma de sortear ambos problemas consiste en seleccionar números telefónicos al
azar a partir de todas las combinaciones permisibles para el área o las áreas incluidas en la
muestra.
Muestreo sistemático
El muestreo sistemático requiere que se decida un tamaño de muestra y que luego se divida
el de la población entre el de la muestra. Esto da una cifra (redondeada al número entero más
cercano) que se usa como base del muestreo. Por ejemplo, si se necesita una muestra de lOO
personas de una población de 2 500, la cifra es 2 500/ 100 = 25. Al azar se elige un número
de inicio entre la población; digamos 70. La primera persona de la muestra es la 70a., la si-
guiente es la 70 + 25 = 95, sigue la 95 + 25 = 120 y así sucesivamente, hasta que tenemos
una muestra de 100. Sin embargo, considere que la 97a. persona que seleccionamos para
la muestra será la 2 495 de la población; si a ésta le sumamos 25, obtendríamos 2 520, un
número superior al tamaño de la población. Para sorteado, debemos restar 2 500 a 2 520 y
elegir a la 20a. persona, seguida por la 20 + 25 = 45a.
--------------------------~M~u~e~st~ra=s~y~p~o~b~la=c~io~n~e~s------------------~¡161
Un peligro del muestreo sistemático sería que el ciclo coincidiera con un ciclo natural de
r
la población. Por ejemplo, si se tomó una muestra de personas que viven en una calle deter-
minada y la base del muestreo usa un número par, podría incluirse sólo a moradores de un
lado de la calle. Esto revestiría especial importancia si una autoridad local gobierna un lado
de la calle y una autoridad distinta el otro.
Muestreo estrati{kado
Un muestreo estratificado requiere la división de la población en subgrupos o estratos mu-
tuamente excluyentes. Un ejemplo típico es la división de la muestra por género, en estratos
de hombres y mujeres. Una vez que se han elegido los estratos puede aplicarse el muestreo
aleatorio simple o el sistemático en cada estrato para elegir la muestra. Una ventaja del mues-
treo estratificado es que se garantiza que ésta contendrá representantes suficientes de cada
uno de los estratos. Un riesgo del muestreo aleatorio simple y del sistemático radica en que no
pueden garantizar una buena representación de los miembros de subgrupos particulares. Hay
dos maneras de conducir el muestreo estratificado: proporcionada y desproporcionada.
Muestreo proporcionado. El muestreo proporcionado se aplica si el muestreo del estrato re-
fleja las proporciones de la población. Por ejemplo, un colega quería entrevistar a gente que
visitaba una clínica de enfermedades transmitidas sexualmentc. Sabía que alrededor de una
séptima parte de los visitantes eran mujeres. Por ello, si quisiera una muestra estratificada
proporcionada, habría de integrarla de tal modo que obtuviera seis séptimas partes de hom-
bres y una séptima parte de mujeres.
Muestreo desproporcionado. Si los investigadores no requieren que su muestra tenga las
proporciones de la población, pueden elegir una muestra desproporcionada. Mi colega tal
vez quería que su muestra tuviera 50% de hombres y 50% de mujeres. Resulta claro que,
simplemente, no sería razonable combinar las submuestras de una muestra desproporcionada
y tratar de extrapolar el resultado a la población. La extrapolación implicaría un análisis
más complejo (véase Sudman, 1976).
Muestreo de conglomerados
El muestreo de conglomerados requiere un muestreo inicial con base en una unidad mayor
que el elemento de población. Esto puede hacerse de dos maneras: en una sola etapa o en
varias .
.'vfuestreo de conglomerados de una sola etcpa. Un ejemplo radica en que los investigado-
L res desean encuestar a estudiantes que cursen psicología en Gran Bretaña, pero en lugar de
Identificarlos a todos identifican todos los lugares donde se imparten cursos en la materia.
Podrían seleccionar al azar varios cursos y luego encuestar a todos Jos inscritos en ellos.
~L________________In_v_e_st_ig~a_c_io_
'n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
Muestras no aleatorias
Muestreo accidental 1de oportunidad1de conveniencia
Como su nombre lo indica, el muestreo accidental/de oportunidacllde conveniencia implica
el muestreo de las personas que uno encuentra por casualidad. Por ejemplo, los investiga-
dores podrían pararse fuera de un supermercado y acercarse a toda la gente que necesiten. A
menos que esté interesado sólo en personas que se detienen en una sucursal determinada
de una cadena de supermercados en particular, se aconseja que diversifique su ubicación.
También recomiendo que se anote la tasa de rechazo y alguna indicación de quién rechaza. Así
tendrá un indicio sobre cualquier sesgo de la muestra.
Cuota
Una muestra de cuota es una de oportunidad, pero con cuotas establecidas para el número de
personas que habrán de incluirse en las submuestras. Por ejemplo, tal vez los investigadores
____________________________M_u_es_t_ra_s~y~p_o_b_la_c_ es__________________~f16J
io_n_
deseen un número igual de hombres y mujeres. Una vez que obtengan su cuota para un
género, se acercarán sólo a miembros del otro género, hasta que tengan los individuos su-
ficientes.
A veces la cuota puede basarse en algo, como un grupo de edad o un estatus socioeco-
nómico, donde se necesitaría acercarse a todos y plantear una pregunta de fi ltro para saber
si se encuentran en uno de los subgrupos por incluir en la muestra.
Si las cuotas se establecerán en varias dimensiones, suele usarse el ténnino muestreo
dimensional (por ejemplo, si los investigadores querían muestras de gente con distintos
niveles de discapacidad visual, de varios grupos de edad y diversa edad de inicio con su con-
dición visual). Para ese trabajo tal vez se necesitaría buscar gente que cumpla especifica-
ciones muy precisas.
ProposWvo
El muestreo propositivo se utiliza cuando desea estudiarse una muestra definida claramen-
te. Un caso común es donde los investigadores tienen una noción de lo que constituye un
ejemplo típico de lo' que les interesa. Podría tratarse de una región donde la pauta de vota-
ción en las elecciones suele reflejarse en la pauta nacional. El peligro del método estriba en
que tal vez la región ya no resulte tipica.
Otro uso del muestreo propositivo es cuando se buscan participantes con característi-
cas particulares, como gente de cada nivel de una organización.
Bola de nieve
El muestreo de bola de nieve usa contactos iniciales para identificar a otros posibles partici-
pantes. Por ejemplo, en la investigación sobre cómo redactan los escritores ciegos, un colega
y yo usamos nuestros contactos para identificar a escritores invidentes y luego les pregun-
tamos por otros que conocieran.
Intervalos de confianza
Como con cualquier estimado, nunca podemos estar totalmente seguros de que nuestro es-
timado de un parámetro es exacto. Sin embargo, sí podemos encontrar un rango de valores
16,4lL--------------~'~nv~e~s~ti~ga~c~ió~n~c~u=a~nt~it~a=ti~va~e=n~p~si~co~l~og~í~a____________________
que nos dé cierto nivel de confianza de que el parámetro debe caer en él. Tal rango se lla-
ma intervalo de confianza. En general, el nivel de confianza que podemos tener de que el
parámetro debe estar en el rango suele expresarse como porcentaje. Un nivel común de
confianza es 95%. No sorprende que cuanto mayor sea el porcentaje de confianza que re-
querimos, tanto mayor será el intervalo donde el parámetro puede caer a fm de que podamos
tener más confianza de que hemos incluido el parámetro en el intervalo.
En el apéndice II figuran una explicación acerca de cómo se obtienen los intervalos de
confianza y los detalles de los cálculos que son necesarios para cada uno de los ejemplos
dados más adelante. También se describe cómo puede decidir el tamaño de una muestra si
requiere cierta exactitud en sus estimados.
Por ejemplo, en el caso de unos comicios, cierta compañía de investigación de merca-
dos realiza un sondeo de opinión para predecir cuál partido ganará. Utiliza una muestra
aleatoria de 2 500 votantes y encuentra que 36% dice que sufragará en favor de un partido
de derecha (la Vía Derecha), mientras que 42% afirma que lo hará por uno de izquierda (el
Partido de los Trabajadores). Los encuestadores calculan los intervalos de confianza apro-
piados. Encuentran que pueden tener 95% de confianza de que el porcentaje de la pobla-
ción que se inclinaría por la Vía Derecha se halla entre el 34.1 y el 37.9%; el que votaría
por el Partido de los Trabajadores, entre el40.1 y el43.9%. Como no se superponen esos
dos intervalos de confianza, podemos predecir que si se realizara la elección más personas
votarían por el Partido de los Trabajadores que por la Vía Derecha.
Tal vez haya notado que a veces las organizaciones dedicadas a las encuestas reportan
en sus resultados lo que llaman margen de en·or. En este caso, el margen de enor sería de
aproximadamente 2%, pues la votación predicha para cualquier partido está en un rango si-
tuado aproximadamente 2% aniba y 2% abajo de las cifras encontradas en la muestra. El
margen de error es la mitad del intervalo de confianza.
Por lo menos tres factores influyen en el tamaño del intervalo de confianza para el mis-
mo grado de confianza: la proporción de la muestra para la que se calcula el intervalo de
confianza; el tamaño de la muestra, y los tamaños relativos de la muestra y de la población.
____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_es__________________~j165
Tabla 11. 1. Intervalo de confianza de 95% para una submuestra, según la proporción
entre la submuestra y la muestra de 2 500.
50 27.7%
100 19.6%
200 13.9%
300 11.3%
400 9.8%
500 8.8%
1 000 6.2%
2 000 4.4%
2 500 3.9%
5 000 2.8%
10 000 2.0%
Tabla 11.3. Efecto en el intervalo de confianza de 95% tras variar la muestra como una
proporción de la población (para una submuestra de 500 tomada de
una muestra de 1 000).
Intervalo de confianza
Desde luego, si ha tomado un censo de su población (es decir, de todos los elementos de la
población), no hay un intervalo de confianza, pues las estadisticas que calcule serán !os pa-
rámetros de población.
El factor final que influye en el tamaño del intervalo de confianza es el grado de con-
fianza que requiere con relación al tamaño del intervalo de confianza.
dlk.-
____________________________M_u_e_st_ra_s~y~p~o_b_la_c_io_n_e_
s __________________~j167
Nivel de confianza
80% 85% 90% 95% 99%
Intervalo de confianza 4.0% 4.6% 5.2% 6.2% 8.1 %
1!".-
Las cifras anteriores son reales sólo para una muestra aleatoria simple. El lector que desee
calcular los intervalos de confianza o el tamaño de la muestra para otros tipos de muestra
aleatoria debe consultar un texto más avanzado, como Sudman (1976). Ha de tener en cuen-
ta que ese grado de exactitud se basa en la suposición de que la muestra carece de sesgo.
i
Resumen
Los investigadores pueden elegir la muestra que deseen estudiar por muestreo aleatorio o
no aleatorio. Si emplean una muestra aleatoria, pueden estimar a partir de las cifras obte-
nidas con sus muestras y, con cierto grado de exactitud, los parámetros equivalentes para
la población. El grado de exactitud de esos estimados dependerá del tamaño de la muestra
y de la proporción de la población que habrán incluido en la muestra.
En el capítulo siguiente se describirá cómo los investigadores pueden decidir la proba-
bilidad de que una muestra provenga de una población en particular.
12
Análisis de diferencias entre
una sola muestra y una población
Introducción
En ocasiones, luego de obtener una puntuación para una persona o una muestra, los inves-
tigadores desean conocer si es común en una población. Además, buscan identificar si una
medida tomada de alguien, o de una muestra de individuos, resulta estadísticamente distinta de
la medición equivalente de una población. En este capítulo se presenta una familia de prue-
bas estadísticas (las pruebas z) que permite responder ese tipo de preguntas. Además, se
trata una familia de pruebas afines (pruebas t) aplicables en circunstancias donde hay in-
formación insuficiente para usar una prueba z.
En el capítulo se incluyen también versiones adicionales de gráficas y otra manera de
identificar mediciones extremas.
Pruebas z
Las pruebas z permiten a los investigadores comparar una estadística determinada con la
media de la población para dicha estadística, a fin de ver si ésta es común en la población
y, por tanto, de saber las probabilidades de que la persona, o la muestra de individuos,
provenga de la población dada. Una prueba =puede utilizarse para probar la significación
estadística de un amplio rango de estadísticas de resumen, incluido el tamaño de una sola
puntuación, de una media o de la diferencia entre dos medias. En el capítulo utilizaré ejem-
plos para examinar el total de un participante individual o de una media proveniente de una
muestra.
168
Análisis de diferencias entre una sola muestra y una población ¡169
------------------------------------------~~~~----------~
Todas las pruebas z se basan en el mismo principio. Señalan la distancia a que se en-
cuentra la estadística que se evalúa de la media de la población, en términos de desviacio-
nes estándar de ésta. Por ejemplo: la estadística podría ser una puntuación individual de una
prueba de IQ; la media de la población, la media de la puntuación de IQ para una pobla-
ción determinada, y la desviación estándar, la desviación estándar para los IQ de quienes
se encuentran en la población. La gente que diseñó la prueba habrá determinado los pará-
metros de la población (o nomzas) y los incluirá en el manual donde se explique el uso
apropiado de la prueba.
La ecuación para una prueba z que compara la puntuación de un solo participante con
la de la población es de la forma siguiente:
100 - 100
z 15
o
1701 Investigación cuantitativa en psicología
3000
"'e:
""o - -
~ 2000 r--
- -
Q)
a.
"....o
Q)
Q)
r-- r-
E
•::l 1000 f-
z r--
o
40 50
A60 70 80 90 100 110 120
k 130 140 150
IQ
3000
r--
"'e:
o""
2000 r-- 1--
~
8.
- -
"....o
Q)
Q)
- -
E
·::l
z 1000
....- 1--
,...--
f--
o ~ ~
- 3.96 - 2.62 - 1.29 0.04 1.38 2.71
-4 -2 o 2 4
z
120 - 100
z =
15
1.333
Al consultar las tablas z, podemos encontrar cuál proporción de personas tiene una puntua-
ción z por lo menos igual de grande.
1721 Investigación cuantitativa en psicología
Lectura de tablas z
El apéndice XN incluye las tablas de valores z utilizables para encontrar su significación.
En seguida se observa una parte de la tabla AXIV.l de dicho apéndice XIV:
Para identificar la proporción de una z de 1.333, busque en la primera columna basta en-
contrar la fila que indica el primer lugar decimal: 1.3. Ahora, como la cifra (1.333) tiene
más de un lugar decimal, recorra las columnas hasta dar con el valor del segundo lugar de-
cimal (3). Observe ahora la entrada en la tabla donde la fila 1.3 coincide con la columna 3;
esto nos dará la proporción de la población que produciría una puntuación z de 1.33 (o ma-
yor). En esta tabla no podemos encontrar una puntuación z con mayor precisión que dos
lugares decimales. La celda da la cifra 0.0918. Ésta es la proporción de personas que ten-
drán una puntuación suficientemente alta para arrojar una z de al menos 1.33; en otras
palabras (en este ejemplo), la proporción de personas que tengan un IQ de 120 o más.
La conversión de la proporción en un porcentaje (multiplicándolo por lOO) nos indi-
ca que el IQ medido está en el9.18% superior. Si restamos esa cifra de 100%, podemos
decir que 90.82% de la población tiene un IQ inferior al de tal persona.
Si una puntuación z resulta negativa, entonces, como la distribución z es simétrica, aún
podemos utilizar la tabla 12.1, pero las proporciones deben leerse ahora como las situadas
debajo de la puntuación z. Por tanto, si z = -1.333 (para un IQ de 80), entonces 9.18% de
la gente de la población tiene una puntuación igual o inferior a ésta.
_____________A_n_á_lis_is__
de__
dl_·re
_r_e_nc_i_as_e_n_t_re_u_n_a_s_o_ta_m
__ue_s_tr_a~y~u_n_a~po~b_ta_c_ió_n______~J173
Con este uso de las puntuaciones z se demuestra que una desviación estándar puede
constituir una estadística de resumen particularmente útiL Si conocemos la media y la des-
viación estándar de una población (distribuida de modo normal), entonces si alguien tiene
una puntuación que representa una desviación estándar más alta que la media, la z de esa
persona será l.
Por ejemplo, sabemos que la desviación estándar de la prueba de IQ es 15. Si una per-
sona tiene un IQ con una desviación estándar arriba de la media, su IQ será 115. Por tanto,
115 - 100
z=
15
70-100
z=
15
-2
En otras palabras, el IQ del cliente se encuentra dos desviaciones estándar abajo de la me-
dia de la población.
Distribución de medias
En lugar de tomar todas las puntuaciones individuales de una población y buscar su distri-
bución, necesitamos tomar una muestra aleatoria de un tamaño determinado de la pobla-
ción y calcular la media de la muestra, y luego repetir el ejercicio con otra muestra de igual
tamaño de la misma población. De realizar esto con la frecuencia suficiente, produciremos
una distribución de medias, la cual tendría su propia media y desviación estándar.
Los expertos en estadística han calculado cómo se distribuyen las medias. Han encon-
trado que la media de esta distribución es la misma que la de la población. Sin embargo, la
desviación estándar de las medias depende del tamaño de la muestra, de manera que la pobla-
ción de tales medias tiene una desviación estándar de ':- ; es decir, la desviación estándar
vn
de las puntuaciones originales dividida entre la raíz cuadrada del tamaño de la muestra. A
veces, la desviación estándar de las medias se denomina error estándar de las medias.
Por tanto, si conocemos la media y la desviación estándar de la población original de
puntuaciones, con una prueba z podemos calcular la significación de la diferencia entre la
media de una muestra y la de la población mediante la ecuación siguiente:
Pruebas t de un grupo
Evaluación de la media de una sola muestra
cuando se conoce la media de la población,
pero no la desviación estándar de la población
Cuando conocemos, o suponemos que conocemos la media de una población, pero no su
desviación estándar, lo mejor es usar una aproximación de tal desviación a partir de la co-
rrespondiente a la muestra. Los expertos en estadística han descubierto que no es posible
producir ese tipo de afirmación suficientemente parecida a la desviación estándar de la po-
blación para que revista utilidad en una prueba z. En su lugar, idearon otro tipo de distri-
bución, utilizable para probar la significación de la diferencia entre la media de la muestra
y la media de la población: la distribución t.
gl = 1
gl =50
A medida que los grados de libertad aumentan, la distribución empieza a parecerse más a
una distribución normal. Como la forma de la distribución depende de los gl, en lugar de
que sea posible producir una sola para t, hay una diferente de t para cada muestra cuyo ta-
maño se conoce.
Las pruebas t pueden aplicarse para probar la significación de varias estadísticas, no
sólo medias individuales. A diferencia de las tablas z, las probabilidades que se muestran en
tablas t dependen del tamaño de la muestra y de la versión de la prueba t que se usa. Los ex-
pertos en estadística han descubierto que la distribución t depende de otro factor, aparte del
mero tamaño de la muestra: los grados de libertad relacionados con la versión particular de t.
En vez de crear otro conjunto de tablas de probabilidad para cada versión de la prueba t, la
misma tabla sirve si conocemos los grados de libertad relacionados con la versión particu-
lar de la prueba t que se emplea.
Grados de libertad. Los grados de libertad de muchas pruebas estadísticas dependen, en
parte, del tamaño de la muestra y, en parte, del número de entidades fijas en la ecuación de
la prueba a fin de estimar los parámetros. En el caso de una prueba t, con base en una sola
media, nada más una entidad es fija (la media) porque se utiliza para estimar la desviación
estándar de la población.
'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
~L________________In_v_e_st_ig~a_c_io_
Para demostrar el significado de los grados de libertad, imagine que hemos aplicado a
cinco personas un examen de matemáticas. De 1O aciertos posibles, sus puntuaciones fue-
ron las siguientes:
Puntuación
Participante en matemáticas
1 7
2 8
3 6
4 5
5 9
La media de las puntuaciones es 7. Puedo modificar un número y, si cambio uno o más del
resto de los números para compensar, todavía tendré una media de 7. En realidad, tengo la
libertad de modificar cuatro de los números al valor que desee, pero ello significará que el
valor del quinto número será fijo. Por ejemplo, si sumo uno a cada uno de los primeros cua-
tro números, el último tendrá que ser 5 para que la media siga siendo 7. De ahí se deduce
que tengo cuatro grados de libertad. Por tanto, para obtener los gl de la ecuación, restaré
uno al tamaño de la muestra.
El método para calcular los gl de cada versión de la prueba t se dará a medida que se
presente cada versión. Sin embargo, la mayoría de los programas de computadora reporta-
rá los gl para la prueba t.
(Por cierto, a medida que la muestra se amplía, su desviación estándar produce una me-
jor aproximación de la desviación estándar de la población. Por tanto, cuando los gl para
la prueba t se encuentran arriba de 200, la probabilidad para un valor t determinado es casi
igual que para el mismo valor z.)
Como ejemplo del uso de esta versión de la prueba t, conocida como de un grupo, si-
gamos usando las puntuaciones del examen de matemáticas. Digamos que los investigado-
res idearon un método de capacitación para mejorar el desempeño en matemáticas. Como
hay pocos posibles participantes, cuentan sólo con un grupo de 1O personas en su estudio.
A las 1O se proporciona la capacitación y luego se les aplica un examen de matemáticas a
cuyo respecto se nos ha dicho, en el manual, que tiene una media de 6 en la población, pe-
ro que, por un mal reporte, se desconoce la desviación estándar de ésta.
La hipótesis de la investigación era direccional:
HA: La puntuación en matemáticas de los participantes que recibieron capacitación
será mejor que la de la población general.
La hipótesis nula era ésta:
0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4.144 4.587
Observe que las tablas t tienen un diseño distinto del correspondiente a las tablas z. Aqui,
los niveles de probabilidad se dan en la parte superior, los gl en la primera columna y los
valores de t en el cuerpo de la tabla misma. Observe también que se proporcionan las pro-
babilidades de una y de dos colas.
Para leer la tabla, encuentre los gl (en este caso, 9). Recorra la fila hasta que llegue al
valor de t inmediatamente inferior al de los resultados de su búsqueda (t = 2.536). Observe
que 2.262 es menor que 2.536, mientras que 2.821 es mayor. Por tanto, siga basta la parte
superior de la columna que contiene 2.262. Como la hipótesis de la investigación es 'direc-
cional, queremos una probabilidad de una cola. Se nos ha dicho que el valor de t ha sido
18QlL--------------~I~nv~e=s~ti~ga~c~io~·n~c=u=a~nt~it=a~ti~v~a~e~n~p~si~co~l~og~í~a____________________
2.262; entonces, la probabilidad sería 0.025. Nuestro valor de tes mayor aún y así sabemos
que la probabilidad es menor de 0.025. Esto puede escribirse p < 0.025, donde el símbolo
<significa menor que. Como 0.025 es menor que el valor crítico de 0.05, los investigado-
res pueden rechazar la hipótesis nula y aceptar la suya de que el grupo que recibió la capaci-
tación en matemáticas tiene mejor desempeño que la población en general.
Reporte de los resultados de una prueba t. La columna para el nivel p = 0.01 de una co-
la en la tabla 12.2 muestra que el valor de t tendría que ser 2.821 para resultar significati-
vo. Como el valor de t obtenido en la investigación fue mayor que 2.262 pero menor que
2.821, sabemos que el nivel de probabilidad cae entre 0.025 y 0.01. Ello puede represen-
tarse como sigue:
0.01 <p < 0.025
Hay muchas sugerencias con relación a la manera de notificar los niveles de probabilidad.
Si un programa de computadora le ha dado el nivel exacto, repórtelo (en este caso, p =
0.016). No obstante, si debe obtener el nivel de tablas t, recomiendo el formato que muestra
el rango donde cae el nivel de p, pues constituye la manera más informativa de presentar
los datos. Si escribe sólo p < 0.025, el lector no sabe si pes inferior o superior a 0.001.
Para reportar los resultados de la prueba t utilice el formato siguiente:
t( 9) = 2.536; 0.01 < p < 0.025, prueba de una cola
_____________A d_i~_r_e_nc_i_as_e_n_t_re__
_n_á_li_sis_ _d e__ un_a_s_o_la_m
__ue_s_tr_a~y~un_a~p~o_b_la_c_ió_n______~j181
Gráficas adicionales
Ahora podemos introducir tres nuevas versiones de gráficas analizadas originalmente en el
capítulo 9: gráficas de línea con medías y error estándar de la medía, gráficas de línea con
medías e intervalos de confianza y diagramas de caja con muescas.
Figura 12.5. Media de recuerdo y el error estándar de la media de las tres estrategias
nemotécnicas.
"'
"'
~ 11
~
8 10
~
"'
~ 9
"'a.
-¡¡¡
8
Q)
-o
e
Q)
1
E
~ 6
Figura 12.6. Media de palabras recordadas e intervalo de confianza de 95% para las tres
estrategias nemotécnicas.
Análisis de diferencias entre una sola muestra y una población
------------------------------------------~~~~----------~
f18J
Diagramas de caja con muescas
En seguida se reproduce la versión anotada del diagrama de caja original de los datos re-
cuerdo de palabras para 15 participantes (de la tabla 9.1) que se presentó en el capítulo 9:
12
11 o Posible extremo
"'
VI
Se aprecia en seguida la versión con muescas del diagrama de caja para los mismos datos.
Esta variante del diagrama de caja permite que se presente en la muesca el intervalo de con-
fianza de la mediana. La manera de calcular este intervalo de confianza se muestra en el
apéndice III.
12
11 o
VI
"'
"O 10
"'....o
"O
9
J
u
....
QJ
8
Intervalo
VI
"'
....
.D 7
de confianza
"'
-¡;¡ para la mediana
a. 6
QJ
"O 5
o
....
QJ
E 4
•::S
z 3 o
2
::S Figura 12.8. Diagrama de caja con muescas del número de palabras recordadas.
1B4l~_______________ln_v_es~ti~g_ac_io_·n_c_u_a_nt_it_a_
ti_
va_e_n_p~s_ic_o_lo~g~ía____________________
Puntuación Puntuación
original estandarizada
3 -0.946
4 -0.749
4 - 0.749
5 - 0.553
S - 0.553
6 - 0.356
6 - 0.356
7 - 0.160
7 -0.160
7 - 0.160
8 0.037
8 0.037
9 0.233
10 0.430
11 0.626
25 3.378
______________A_n_á l_is_is_d_e__d_
if_
er_e_n_cl_
·~__e_nt_r_e_u_n_a_s_ol_a_m
__ue_s_tr_a~y~un_a~po_b_l_
ac_i_
ón________~~
Una puntuación estandarizada mayor que 3 o menor que -3 debe investigarse más como
posible extremo. Considere que la puntuación de 25 produjo una puntuación estandarizada
de 3.378.
Resumen
Cuando los investigadores conocen la media y las desviaciones estándar de la población en
una estadística de resumen pueden comparar el valor de una estadística obtenida de una per-
sona o de una muestra de individuos con la media de la población de esa estadística, utilizan-
do una prueba z. Así, pueden ver si los valores obtenidos son comunes entre la población
y, por tanto, identificar la probabilidad de que el sujeto o el grupo provengan de la pobla-
ción determinada. Cuando se conoce sólo la media de la población de la estadística tiene
que emplearse una prueba t en lugar de una z.
El capítulo se ha centrado sobre todo en la significación estadística como manera de
decidir entre una hipótesis de investigación y una nula. En otras palabras, se consideró sólo
la probabilidad de cometer un error tipo I. En el capítulo siguiente se explicará cómo los
investigadores pueden tratar de evitar un error tipo II y se presentarán estadísticas de resu-
men adicionales que les ayudarán a decidir.
13
Tamaño del efecto y poder
Introducción
Los psicólogos y otros científicos relacionados con el estudio del comportamiento han ten-
dido a centrarse en determinar si un resultado es estadísticamente significativo y a excluir
cualquier otra consideración estadística (Cohen, 1962; Sedlmeier y Gigerenzer, 1989;
Clark-Carter, 1997). En el presente capítulo se tratan las consecuencias de tal enfoque y se
describen técnicas adicionales que permiten a los investigadores tomar decisiones más in-
formadas.
186
___________________________Ta_m_a_ñ_o_d_e_l_e_fe_c_
to_y~po_d_e_r________________~j187
nula de que no hay efecto, en tanto que los del estudio más pequeño se verán forzados a re-
chazar su hipótesis de investigación. De acuerdo con esto, cuanto más pequeño sea el ta-
maño de la muestra, tanto más probable resultará que cometamos un error tipo II (recha-
zando la hipótesis de investigación cuando en realidad es correcta).
Dos nuevos conceptos proporcionarán soluciones de ambos problemas. El tamaño del
efecto ofrece una medida de magnitud de un resultado independiente del tamaño de la mues-
tra. El cálculo del poder de la prueba estadística ayuda a decidir sobre la probabilidad de
que se evite un error tipo II.
Poder estadístico
El poder estadístico se defme como la probabilidad de evitar un error tipo II. La probabi-
lidad de cometerlo suele simbolizarse con B(la letra griega beta). Por tanto, el poder de una
prueba es 1 - B.
En la figura 13. 1 se representa la comparación de dos medias; por ejemplo, la media
del JQ de la población en que se ha estandarizado una prueba (1..1. 1) y la de la población de
gente a quien se dio una capacitación especial para mejorar su IQ (~). Establecida formal-
mente, H0 es ~ = !..1. 1, mientras que la hipótesis de investigación (HA) es !..1.2 > !..1. 1. Como es
usual, se establece un nivel de a (digamos, a= 0.05). Ello determina la media crítica (la
media de IQ) para un tamaño demuestra determinado, que sería suficientemente grande pa-
ra permitimos rechazar H 0. Determina ~' que será el área (en la distribución que está cen-
trada en !..1.2 ) situada a la izquierda de la media critica. También determina el poder (1 - ~),
que es el área (en la distribución centrada en J.l?.) que cae a la derecha de la media critica.
......
___________________________
Ta_m_a_ñ_o_d_e_l_ef_ect
__o~y~~--e_r________________~f189
Media crítica
El poder que requerimos para cierta investigación depende de los objetivos de ésta. En
consecuencia, si resulta particularmente importante evitar un error tipo II, nos orientaremos
a un nivel de poder lo más cercano posible a l. Por ejemplo, si fuéramos a probar la efica-
cia de un medicamento que puede salvar vidas, no querremos rechazar de manera errónea
la hipótesis de investigación de que el medicamento posee eficacia. Sin embargo, como se
verá, para lograr tal nivel de poder tal vez sea preciso un tamaño de muestra impráctica-
mente grande. Por tanto, Cohen y otros expresan, como regla básica, que un nivel razonable
de poder, en condiciones normales, es 0.8. En otras palabras, la probabilidad de cometer un
error tipo II (~) es 1 - poder = 0.2. Con un nivel de a establecido en 0.05, esto nos dará
una razón de probabilidades de cometer un error tipo I y tipo Il de 1:4. Empero, como in-
dicamos en el capítulo 10, puede establecerse un nivel de a diferente.
El poder estadístico depende de muchos factores, incluidos el tipo de prueba que se
emplea, el tamaño del efecto, el diseño (si es entre sujetos o intrasujetos), el nivel de a es-
tablecido, si la prueba es de una o dos colas y, en el caso de diseños entre sujetos, el tamaño
relativo de las muestras.
El análisis de poder puede utilizarse de dos maneras: prospectivamente durante la etapa
de diseño, para decidir el tamaño de la muestra requerido a fin de lograr cierto nivel de po-
der; y de forma retrospectiva, una vez que los datos se han recolectado, para evaluar cuál
es el poder de la prueba. El enfoque más útil se halla en el análisis de poder prospectivo. Tras
19QlL_______________I_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tT_·v_a_e_n~p_si_co_l_og~í_a____________________
decidir el diseño, el nivel de a y la cola de la prueba, los investigadores pueden calcular el
tamaño de la muestra que requieren. Sin embargo, aún encaran el problema de llegar a una
indicación del tamaño del efecto antes de que puedan realizar los cálculos del poder. Em-
pero, como falta realizar el estudio, éste es desconocido.
Tabla 13. 1. Extracto de las tablas de poder para una prueba z de un grupo,
probabilidad de una cola, a= 0.05 ( *denota que el poder está
sobre 0.995).
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
15 0.10 0.19 0.31 0.46 0.61 0.75 0.86 0.93 0.97 0.99
16 0.11 0.20 0.33 0.48 0.64 0.77 0.88 0.94 0.97 0.99
17 0.11 0.21 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99
En la fila superior de la tabla se advierten los tamaños del efecto (d) y en la primera colum-
na, el tamaño de la muestra. Las cifras del cuerpo de la tabla son el poder estadístico que
se alcanzará con cierto tamaño de efecto si se usa un tamaño de muestra específico.
En la tabla se muestra que para una prueba z de un grupo con un tamaño de efecto me-
dio (d = 0.5), una prueba de una cola y un nivel de a de 0.05 se requieren 25 participantes
a fin de lograr un poder de 0.80.
En los ejemplos siguientes se aprecia el efecto que la modificación de cada una de ta-
les variables tiene sobre el poder. Si bien los ejemplos son para la prueba z de un grupo, el
poder de todas las pruebas estadísticas se afectará de manera similar por los cambios del
tamaño de la muestra, el tamaño del efecto, la naturaleza de la hipótesis de investigación y
el nivel de a,
192lL_______________In_v_es_tl~·g_ac_io_·n_c_u_a_nt_it_a_ti_va_e_n~ps_ic_o_lo~g_ía____________________
Tamaño de muestra y poder
Un tamaño de muestra aumentado produce mayor poder. Si todo lo demás se mantiene
constante, pero usamos sólo 15 participantes, el poder caerá a 0.61. Como alternativa, su-
birá a 0.94 si empleamos 40 participantes.
Njvel de a y poder
Cuanto más pequeño sea el nivel de a, tanto menor será el poder. En otras palabras, si
todo lo demás se mantiene constante, la reducción de la probabilidad de cometer un error
tipo 1 aumentará la de incurrir en uno tipo 11. Si se establece a en 0.0 l el poder se reducirá
de 0.8 a 0.57. Por otra parte, si se establece a en 0.1 se aumentará el poder a casi 0.99.
Estos efectos se observan en la figura 13.1; a medida que a se empequeñece (la media crí-
tica se mueve a la derecha), 1 - ~ disminuye; y a medida que a se amplía (la media crítica
se mueve a la izquierda), 1 - ~ crece.
Tabla 13.2. Extracto de una tabla de poder para pruebas t de un grupo, probabilidad
de una cola, a =·0.05 (*denota que el poder es sobre O. 995).
Tamaño del efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.1 1.2 1.3 1.4
140 0.32 0.76 0.97
150 0.33 0.79 0.98
160 0.35 0.81 0.98
170 0.36 0.83 0.99
180 0.38 0.85 0.99
190 0.39 0.86 0.99
200 0.41 0.88 0.99
300 0.53 0.96
400 0.64 0.99
500 0.72
600 0.79
700 0.84
800 0.88
Resumen
El tamaño del efecto es una medida del grado en que se considera que una VI afecta una
VD o del grado en que dos o más variables están relacionadas entre sí. Como es indepen-
diente del tamaño de la muestra, resulta útil para comparar estudios.
Cuanto mayor poder tiene una prueba estadística, tanto mayores probabilidades habrá
de evitar un error tipo II. Un contribuyente importante al poder de una prueba es el tama-
ño de la muestra. Durante la etapa de diseño los investigadores deben realizar algún tipo de
análisis de poder para decidir el tamaño de muestra óptimo. Si no alcanzan significación
estadística, deben calcular el nivel de poder de su prueba e identificar el tamaño de mues-
tra requerido para lograr un nivel razonable de poder estadístico.
En el capítulo siguiente se analizará la diferencia entre dos tipos de prueba estadística:
paramétrica y no paramétrica.
14
Pruebas paramétricas
y no paramétricas
Introducción
Las pruebas estadísticas pueden clasificarse en paramétricas (como las t) y no paramétricas
- a veces conocidas como pruebas de distribución libre- (como las de Kolmogorov-
Smimov, cuyo análisis se presenta más adelante). La diferencia se basa en ciertas suposi-
ciones acerca de los parámetros de población existentes y en el tipo de datos analizables.
La prueba de bondad de ajuste, x2 (llamada chi cuadrada), se presenta para analizar
datos a partir de un grupo cuando el nivel de medición es nominal.
Pruebas paramétrkas
Las pruebas paramétricas tienen dos características, de las cuales puede desprenderse su
nombre. Primero, su cálculo requiere la estimación,·a partir de los datos muestreados, de
los parámetros de la población. Segundo, realizan ciertas suposiciones acerca de la natura-
leza de ciertos parámetros para las mediciones tomadas.
--------------------------------------------------------~195
~L----------------I~nv~e~s~ti~ga~c~io~·n~cu_a_n_ti~ta~t~iv~a_e~n~ps_ic_o~lo~g~ía~--------------------
significa que nadie debe contribuir con más de una puntuación. Además, no habrá influen-
cia de una persona hacia otra. En el capítulo 12 se dio un ejemplo en que un grupo recibió
mejor capacitación en matemáticas. Luego se aplicó a los participantes una prueba de esa
materia. Para que las puntuaciones resulten independientes no existirá oportunidad de que
los participantes pasen las respuestas de la prueba.
Un caso común donde resultan improbables los datos independientes se encuentra en la
investigación en psicología social; ahí los proporcionan personas a quienes se prueba en
grupos. Un ejemplo sería que los participantes se concentraran en grupos para analizar sus
opiniones acerca de una pintura; aquí, la variable dependiente sería la puntuación del gusto
de cada persona por la pintura. Sin duda, los individuos de un grupo sufrirían la influencia de
las opiniones de otros del grupo. Una manera de alcanzar la independencia de las puntua-
ciones en la situación referida consistiría en tomar las medias de los grupos como variable
dependiente, en lugar de las calificaciones individuales. Para esto, y a fin de mantener un
nivel razonable de poder estadístico, debería tenerse un número de participantes mayor del
que se requeriría si pudieran utilizarse las puntuaciones individuales.
Un criterio adicional que los psicólogos establecen a menudo para una prueba paramé-
trica radica en que los datos deben ser de intervalo o razón. Como se señala en el capítulo
8, los expertos en estadística se preocupan menos por ese principio. Al sumarse a él, pue-
den imponerse restricciones acerca de cuáles análisis son posibles con los datos. Las direc-
trices siguientes le permiten una sujeción menos estricta a la regla. En el caso de datos
nominales con más de dos niveles no tiene sentido aplicar pruebas paramétricas porque no
hay un orden inherente en los niveles (por ejemplo, si la variable es un partido político; y·
los niveles, conservador, liberal y radical). Sin embargo, si la variable es ordinal pero tie-
ne niveles suficientes (digamos, 20 o más) entonces, si se satisfacen los otros requisitos pa-
ramétricos, se considerará legítimo aplicar pruebas paramétricas sobre los datos. Un ejemplo
común al respecto se presenta cuando se ha obtenido una puntuación a partir de una esca-
la de Likert de varios elementos (consulte el capítulo 6). Si la escala incluye cinco elementos
y cada uno tiene una escala ordinal de 7 puntos, el rango de puntuaciones posibles estará
entre 5 y 35. Zimmennan y Zumbo (1993) señalan que muchas pruebas no paramétricas
producen la misma probabilidad que si se convirtieran los datos originales en rangos (y, por
tanto, en un nivel ordinal de medición) y se realizara la prueba paramétrica equivalente en
los datos ordenados. Así, la restricción de las pruebas paramétricas a datos de intervalo o
de razón ignora la derivación de algunas pruebas no paramétricas.
Si no se satisfacen los criterios para cierta prueba paramétrica es inapropiado utilizar
ésta. Sin embargo, hay otro malentendido entre los investigadores: la creencia de que las
estadísticas no paramétricas están exentas de presuposiciones acerca de la distribución de
los datos. Por tanto. aunque no se satisfagan Jos presupuestos de una prueba paramétrica no
se recomienda el uso de una no paramétrica equivalente. Se han elaborado algunas varia-
ciones de pruebas paramétricas para utilizarlas aunque se hayan contravenido algunas su-
posiciones.
--------------------~Pr~u~e~b=as~p~a=r=a~m=é=tn=·c=a=s~y~n~o~p~a~r~am~é=tr~ic=a=s______________~r-t97
Una desventaja adicional de una prueba no paramétrica consiste en que puede tener
menos poder que su equivalente paramétrica. En otras palabras, tal vez tengamos más proba-
bilidades de cometer un error tipo II cuando usamos una no paramétrica. Sin embargo, esto
suele ser ~erdad sólo cuando los datos cumplen los requisitos de una prueba paramétrica y
aun así utilizamos una no paramétrica. Cuando no se reúnen tales exigencias, la prueba no
paramétrica puede ser la más poderosa.
Robustez
Pese a los criterios establecidos, los expertos en estadística han encontrado que las pruebas
paramétricas resultan muy exactas, aunque se infrinjan algunas de sus suposiciones; son ro-
bustas. Sin embargo, esta noción ha de tratarse con cuidado. Si los datos no cumplen más de
una suposición relacionada con una prueba paramétrica concreta, sería mejor utilizar una pa-
ra métrica que relaje algunas suposiciones o una no paramétrica equivalente, pues tal vez los
niveles de probabilidad dados por las tablas estándar o por la computadora no reflejen las pro-
babilidades reales. Por el advenimiento de las computadoras, ahora los investigadores pueden
evaluar los efectos de las contravenciones de las suposiciones de las estadísticas paramé-
tricas y no paramétricas. Esos estudios han mostrado que, en ciertas condiciones, ambos
tipos de pruebas se afectan en gran medida por tales violaciones, de manera tal que pueden
malinterpretarse las probabilidades que reporten; es probable que, en algunas condiciones,
tengamos muy poco poder y que, en otras, la probabilidad de cometer un error tipo 1 sea
marcadamente mayor de lo que nos indican las tablas o el programa de computadora.
Las reglas básicas sobre la distancia a que nuestros datos pueden alejarse de la condi-
ción ideal antes de que debamos hacer algo para contrarrestar el problema se darán a me-
dida que se presente cada prueba.
Por.fortuna, en psicología a menudo nos interesa una estadística de resumen y no las
puntuaciones originales que proporciona la estadística. Por tanto, solemos interesamos en
la diferencia entre la media de una muestra y la de la población o de otra muestra, en lugar
de la diferencia entre la puntuación de un individuo y la correspondiente a la población.
Hay un fenómeno más bien conveniente (descrito por el teorema de/límite central): si
tomamos una estadística de resumen como la media, tendrá una distribución normal, aun
cuando la población original de puntuaciones de la que proviene carezca de ella. Para com-
prender la distribución de la media, imagine que tomamos una muestra de cierto tamaño
de una población y que obtenemos la media de la muestra. Luego tomamos otra muestra de
igual tamaño de la misma población y obtenemos su media. Realizamos esto hasta que ha-
yamos encontrado las medias de gran cantidad de muestras de la población. La distribución
de frecuenc ia de las medias que produzcamos será normal. Sin embargo, adviértase que el
tamaño de la muestra debe ser suficientemente grande. La mayoría de los autores parece de
acuerdo en que basta una muestra de 40 o más elementos, aunque la distribución original
de puntuaciones individuales esté muy sesgada.
198l~ _______________l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
A menudo desconocemos la distribución de las puntuaciones de la población. He dicho
que esta última debe estar distribuida normalmente. Tal vez sólo tengamos los datos de
nuestra muestra. No obstante, podemos obtener una impresión de la distribución de la po-
blación a partir de dicha muestra. Por ejemplo, en la muestra incluí el IQ de 20 personas de
una población con distribución normal; el resultado de la distribución se aprecia en seguida:
"'"'e 7
o 6
"''- 5
a.
V
4
"o
V
'-
3
V
E 2
• ::J
z
o
20 40 60 80 100 120 140 160 180
IQ
Al crear una distribución de frecuencia de los datos de la muestra podemos ver si está sesga-
da marcadamente. Si no lo está, podemos seguir con una prueba paramétrica. Si está ses-
gada y la muestra es menor de 40, podemos transformar los datos.
Transformac1ón de datos
Es posible aplicar una fórmula matemática para cada elemento de datos y producir un conjun-
to de ellos con distribución más normal. Por ejemplo, si los datos forman una distribución
con sesgo negativo, con elevar al cuadrado cada puntuación puede reducirse el sesgo; luego,
sería permisible emplear una prueba paramétrica de los datos. Si utiliza una prueba esta-
dística que busque diferencias entre las medias de diferentes niveles de una variable inde-
pendiente ha de utilizar la misma transformación en todos los datos. Tal tansformación es
un procedimiento del todo legítimo si no prueba varias transformaciones para encontrar la
que produce resultados estadísticamente significativos. No obstante, se sospecha que mu-
chos estudiantes utilizan ese procedimiento. Para quienes desean profundizar en el tema se
presentan posibles transformaciones para diferentes distribuciones en el apéndice V, junto
con ilustraciones sobre el efecto de algunas de ellas.
Pruebas paramétricas y no paramétricas 199
Datos nominales
Prueba ;(2 de una muestra
A veces queremos ver si una pauta de resultados de una muestra difiere de lo que habríamos
esperado según alguna suposición hecha sobre tal pauta. Un ejemplo se da cuando estudia-
mos las preferencias iniciales de los niños por ciertas pinturas en una galería de arte. Obser-
vamos a 25 pequeños cuando entran en una sala que incluye cinco cuadros y anotamos, en
el caso de cada infante, a cuál obra se acerca primero. Nuestra hipótesis de investigación
sería que los niños se aproximarán primero a una pintura más que a las otras. La hipótesis
• nula sería que el número de pequeños que se acercan primero a cada cuadro será igual para
todos éstos. De acuerdo con la hipótesis nula, esperaríamos que los pequeños se aproxima-
25
ran primero a cada obra en un =5 de los casos.
5
Los datos se observan en seguida:
Tabla 14. 1. Número de niños que se acercan primero a una pintura específica y número
esperado de acuerdo con la hipótesis nula.
Klee 11 5
Picasso 5 5
Modigliani 3 5
Cézanne 4 5
Rubens 2 5
La prueba x2 compara los números reales, u observados, con los esperados (de acuerdo con
la hipótesis nula) para ver si difieren significativamente. El ejemplo anterior produce x2 =
x
1O. La manera en que se calcula la 2 de un grupo se muestra en el apéndice V.
20Ql~_______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
0.0404 = 0.0081
5
Aunque legítima, ésta no constituye una práctica muy utilizada y, por consiguiente, tendría
que reportar cómo llegó a tal probabilidad.
Si no conocemos la probabilidad exacta de x2 podemos utilizar una tabla que dé las
probabilidades para lo que se llama distribución de chi cuadrada. Como la tabla puede uti-
lizarse para encontrar las probabilidades de las pruebas estadísticas diferentes de las x2, se-
guiré la práctica de algunos autores de escribir chi cuadrada cuando hable de la tabla y x2
si me refiero a la prueba.
Para encontrar la probabilidad de los resultados de una prueba x2 debe conocer los gra-
dos de libertad. En la versión de un grupo de la prueba x2, se basan en el número de cate-
gorías, que en este caso eran cinco (la cantidad de pinturas). Los gl se calculan restando
uno al número de categorías, pues el total de participantes es el elemento fijo de la prueba.
En este caso, como tal número era 25 podría cambiarse la cantidad de participantes que se
encontraba en cuatro de las categorías, pero la de la quinta tendría que ser tal que totaliza-
ra 25. Por tanto, hay cuatro grados de libertad.
La tabla de probabilidad para la distribución de chi cuadrada se da en el apéndice XIV.
En la tabla 14.2 se muestra un extracto suyo.
Cuando hay cuatro gl, el nivel crítico para x2 en p = 0.05 es 9.49 y para p = 0.02 de
11.67. Por tanto, como nuestra x2 era 1O y esto rebasa 9.49, la probabilidad de que tal
resultado or.urra por azar es menor que 0.05. Sin embargo, como 1O es menor que 11.67,
la probabilidad es mayor que 0.02. En este caso, reportaríamos la probabilidad como
0.02 < p < 0.05. La manera completa de informar el resultado de una prueba x2, cuando us-
ted no conoce la probabilidad exacta, es x2(4) = 10, 0.02 < p < 0.05, N = 25.
. Pruebas paramétricas y no paramétricas [201
Tabla 14.2. Extracto de la tabla de probabilidad para la distribución de chi cuadrada.
Probabilidad
gl 0.99 0.95 0.90 0.80 0.70 0.50 0.30 0.20 0.10 0.05 0.02 0.01 0.001
0.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 10.83 11
2 0.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 13.82
3 0.11 0,35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 16.27
5 0.55 1.1 5 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13 .39 15.09 20.51
y N es el tamaño de la muestra.
Por tanto, en el presente caso :
{10
w=
~ 25
roA
0.632
Cohen define una w de 0.1 como un tamaño de efecto pequeño, una de 0.3 como uno me-
dio y una de 0.5 como uno grande. Por tanto, podemos decir que el tamaño del efecto era
grande en el ejemplo.
El poder de la prueba x2
En las tablas del apéndice XV se da el poder de la prueba z2 . En la tabla 14.3 se aprecia un
extracto de las tablas de poder cuando gl = 4.
2o2l Investigación cuantitativa en psicología
Tabla 14.3. Extracto de las tablas de poder para w cuando gl = 4 y a = 0.05 ( * denota
que el pode r está arriba de 0.995).
gl =4
Tamaño del efecto (w)
Suposiciones de la prueba x!
La primera suposición consiste en que todas las observaciones son independientes, esto es,
en este caso cada niño debe contarse sólo una vez (para 25 puntuaciones habrá 25 peque-
ños). La segunda suposición estriba en que las frecuencias esperadas tendrán por lo menos
cierto tamaño. En el caso donde hay nada más un gl (por ejemplo, sólo dos pinturas), todas
las frecuencias esperadas serán de al menos 5. Cuando los gl son mayores de 1, no más de
20% de las frecuencias esperadas pueden estar abajo de 5. En el caso de cinco categorías,
significa que sólo una de las frecuencias esperadas podía ser menor de 5. Como las frecuen-
cias esperadas están regidas parcialmente por el tamaño de la muestra, para tratar de evitar
el problema de frecuencias pequeñas esperadas se aconseja tener por lo menos cinco parti-
cipantes por categoría. Por ello, el tamaño de muestra mínimo para esta investigación habría
sido de 25.
Si demasiadas categorías tienen frecuencias esperadas abajo de 5, es posible combinar
aquéllas. Por ejemplo, si la muestra hubiera incluido sólo 20 participantes, como se obser-
va en la tabla 14.4, podríamos combinar los números para diferentes pinturas.
Pruebas paramétricas y no paramétricas
------------------------~--------~--~--------------------~
¡--203
Tabla 14.4. Número de niños que se acercan primero a una pintura específica
y número esperado de acuerdo con la hipótesis nula.
Klee 9 4
Picasso 4 4
Modigliani 2 4
Cézanne 3 4
Rubens 2 4
Tabla 14. 5. Número de niños que se acercan primero a una pintura específica
y número esperado de acuerdo con la hipótesis nula.
Pintor Se acercaron primero Esperado por H0
Klee 9 4
Otros cuadros 11 16
Observe que la frecuencia esperada para los otros cuadros es la suma (o total) de las espe-
radas para cada una de las pinturas. E l resultado de una x2 para estos datos es x2(l) = 7.812,
p = 0.0052 y N= 20, que también reviste significación estadística.
Con el último ejemplo se demuestra que las frecuencias esperadas no tienen que ser
iguales. Con el ejemplo original se probaba si las pinturas tenían una probabilidad igual de
x
que los niños se les aproximaran primero. Sin embargo, otro uso para la prueba 2 de un
grupo se halla en una de bondad de ajuste. Tal vez en ciertas situaciones pensamos que
un conjunto de datos está distribuido de manera particular y deseamos probar si la suposi-
ción es correcta. Pongamos por caso que se nos dice que una población comprende 20% de
fumadores y 80% de no fumadores. Tenemos una muestra de 100 participantes cuyo es-
tatus de tabaquismo hemos anotado y deseamos comprobar que la muestra es representati-
va de la población. Los datos se advierten en seguida:
Resumen
Pruebas paramétricas como la t hacen ciertas suposiciones acerca de la medición que se
analiza. En su mayoría requiere que los datos que se analicen sean independientes entre sí
y tengan una distribución normal en la población. Si las suposiciones no se cumplen, de-
ben emplearse las versiones modificadas de las pruebas paramétricas o no paramétricas.
En el capítulo siguiente se describen las pruebas estadísticas que nos permiten compa-
rar los datos a partir de dos niveles de una VT para ver si son significativamente distintos.
15
Análisis de diferencias entre dos
niveles de una variable independiente
Introducción
En este capítulo se estudian los diseños que incluyen una variable independiente con sólo
dos niveles. Se presentan pruebas paramétricas y no paramétricas que analizan diseños en-
tre e intrasujetos. Se explica el uso de pruebas z para evaluar muestras más grandes en prue-
bas no paramétricas. Se examina también el poder y el tamaño del efecto de la prueba t de
dos muestras y sus equivalentes no paramétricas.
Pruebas paramétricas
Distribución de la diferencia entre dos medias
Como ahora buscamos la diferencia entre las medias de dos muestras en vez de la media
de una muestra y de una población, los expertos en estadística han tenido que identificar
cómo se distribuye la nueva estadística (cuáles son su med ia y su etTor estándar), de modo
que una estadística inferencia! puede utilizarse con fines de evaluación. En realidad, hay
diferentes versiones de la prueba, ya sea que se trate de diseño entre o intrasujetos. En el
apéndice VI se presentarán las ecuaciones completas para las pruebas y se darán ejemplos
de trabajo. Todas las versiones de la prueba emplean la distribución t y, por tanto, puede
usarse la misma tabla de probabilidad que para la prueba 1 de un grupo.
----------------------------------------------------~ 205
206l~--------------~l~nv~e~st~ig~a~c~ió_n_c~u~a_nt~it~a~ti_va~en~p~si~co~lo~g~ía~-------------------
.. Puesta formalmente, la hipótesis nula consiste en que la media de nivel de ansiedad para la
población que recibe la terapia (¡..¡. 1) es la misma que la correspondiente a la que no la reci-
be (¡..¡.e); es decir: ¡..¡.1 = 11-e o (¡..¡. 1 - ¡..¡.) = O. La hipótesis de investigación es ¡..¡. 1 < !!e o (!J- 1 -
!!)<o.
Para decidir el tamaño de muestra, los investigadores realizan un análisis de poder.
Análisis de poder
I:a hipótesis es direccional y, en consecuencia, resultará apropiada una prueba de una
cola. La alfa se .establecerá en 0.05. Los investigadores esperan que la terapia produzca unta-
maño de efecto grande (d = 0.8). Buscan poder de 0.8. Buscan en las tablas de poder apro-
piadas (véase el apéndice XV), donde se aprecia que necesitan 20 personas en cada grupo.
Encuentran 40 aracnofóbicos y los asignan al azar a los dos grupos.
Los resultados del estudio se muestran en seguida:
Terapia Control
Media 71.5 79.5
DE 6.557 7.64
90
"O
l1l 80
"O
(l)
·¡¡:;
e:
l1l
(l)
"O
a;
z> 70
60
Terapia Control
Grupo
En el ejemplo,
71.5-79.5
d
7.64
-1.047
Lo anterior nos indica que la terapia redujo la ansiedad en una desviación estándar de 1, lo
cual, en términos de Cohen, puede considerarse un tamaño del efecto grande.
Si la investigación hubiera incluido la comparación entre las medias de dos grupos ex-
perimentales sería más legítimo utilizar una desviación estándar que combinara la informa-
ción de ambos grupos (la desviación estándar combinada) en la ecuación anterior en lugar
de la desviación estándar de un grupo (véase en el apéndice VI la ecuación de la desvia-
ción estándar combinada).
Hemos visto que el resultado ha ido en la dirección de la hipótesis; ahora deseamos sa-
ber si es estadísticamente significativo. Sin embargo, primero debe verificarse si los datos
cumplen los requisitos de una prueba t. Uno adicional de la prueba t entre sujetos estriba
en que los datos de las dos condiciones deben ser independientes. Los investigadores han
garantizado esto, mas necesitan verificar si hay homogeneidad de varianza en los dos conjun-
tos de datos. Las varianzas se obtienen elevando al cuadrado las desviaciones estándar. La
varianza del grupo de terapia es 42.99 y la del control 58.37. Como la varianza del segun- •
do (la mayor) no es más que el triple de la del primero y la escala de ansiedad constituye
una medición de razón que está distribuida normalmente en la población, los investigado-
res deciden que es legítimo utilizar una prueba t.
Esta versión de la prueba t está formada por lo siguiente:
diferencia entre medias - diferencia entre medias si H 0 es correcta
error estándar de la diferencia entre medias
La diferencia entre las medias, si H 0 resulta correcta, es O, caso en el que la ecuación pue-
de reescribirse como sigue:
diferencia entre las medias
t entre sujetos
error estándar de la diferencia entre medias
• ___________ A
_n_á_li_si_s _de__
dl_.fe_r_e_nc_ia_s_e_n_
tr_
e_d_
o_s_
ni_ve_l_
es_d_e_u_n~a_v_a_ri_ab_l~e_in_d~e~pe~n~d~ie_n~te~_J~
gl 0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
50 0.255 0.528 0.849 1.299 1.676 2.009 2.403 2.678 3.261 3.496
21QlL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
De buscar a lo largo de la fila para gl = 38, veremos que el valor t de 3.553 (recuerde que
debe obviar el signo negativo si el valor t calculado es negativo) se encuentra entre 3.319
y 3.566. Por tanto, la probabilidad de una cola del valor tes menor que 0.001, pero mayor
que 0.0005; podemos decir que 0.0005 <p < 0.001. En realidad, la computadora da el va-
lor exacto de p, que es 0.00052. Resulta claro que el valor de pes menor que el nivel de a
y que los investigadores pueden rechazar la hipótesis nula y concluir que su técnica tera-
péutica reduce la ansiedad de los aracnofóbicos.
Por lo general, no supone un problema que no se muestre el gl exacto en las tablas. El va-
lor de t será, con toda claridad, estadísticamente significativo cuando el gl sea más peque-
ño que el valor exacto (por ejemplo, cuando gl = 45 y t = 1.69), en cuyo caso el resultado
también será significativo con el nivel exacto; como alternativa, el resultado no será sig-
nificativo aun con el siguiente gl mayor para el que existe una entrada en la tabla (por ejem-
plo, cuando gl = 45 y t = 1.67), caso en el que no sería estadísticamente significativo con el
gl exacto. Un problema surge, si usted depende de las tablas, cuando el valor de t no es cla-
ro en una de estas dos posiciones; por ejemplo, si ha sido 1.682 con gl = 43. (En el apéndice
XIV se muestra cómo puede encontrar un valor de t crítico más exacto con la interpolación.)
Heterogeneidad de varianza
Si las varianzas de las dos muestras difieren por más del triple (y las muestras tienen el
mismo número de participantes), se aconseja usar una versión modificada de la prueba t.
Cuando el tamaño de las muestras sea desigual, use la prueba t modificada si las varianzas
difieren más del doble. En la versión de la prueba t que se da arriba se han combinado las
varianzas de las dos condiciones, o se han resumido en una sola medida. Cuando las dos va-
rianzas son diferentes, conviene más estimar el error estándar para la diferencia entre las me-
dias sin combinar las dos varianzas.
Esta nueva versión de la prueba t, a veces conocida como prueba t de Weich, no se distri-
buye de la misma manera que las otras. Sin embargo, las tablas estándar pueden utilizarse
--~~~----------------------------- --- -- ----------------------~------~~~
____________A
_n_á_li_si_s_d_e_d_if_e_re_n_c_ia_s_e_n_t_re_d
_o_s_n_iv_e_l_es__
de__u_na__
va_r_ia_b_le__
in_d_e.:..._p_en en_t_e____Jj211
_d_i_
Anáus;s de poder
La naturaleza de la hipótesis significa que una prueba de una cola resulta apropiada. La al-
fa se establece en 0.05. Como el entrenamiento toma mucho tiempo, los psicólogos están
interesados en detectar sólo un efecto grande (d = 0.8) y desean un poder de 0.8 . Buscan
en las tablas de poder para la prueba t intrasujetos (véase el apéndice XV) y deciden que
se necesitan 11 ciclistas para el estudio. Como cada participante en un diseño intrasujetos
proporciona una puntuación para cada nivel de la VI, se requerirán menos participantes que
en un diseño entre sujetos para el mismo nivel de poder. Además, los diseños intrasujetos
cuentan con más poder que los entre sujetos, pues deben tener menos variabilidad en el
conjunto general de puntuaciones porque la misma persona proporciona dos puntuaciones,
2f2lL_______________I_nv_e_s_t_i~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
y así necesitan incluso menos participantes para lograr el mismo nivel de poder. Como ya
se verá, esta forma de evaluar el poder es muy aproximada y ha de usarse sólo cuando no se
dispone de otras directrices acerca del tamaño del efecto.
Tabla 15.3. Medias y desviaciones estándar del tiempo (expresado en minutos) que los
ciclistas toman en completar la ruta antes y después del entrenamiento.
Etapa de entrenamiento
Antes Despúés
Media 184.0909 182.5455
DE 21.66 20.68
(He dado las medias con cuatro decimales para que los cálculos que se aprecian abajo pro-
duzcan resultados consistentes. No recomiendo que repo1te resultados con esos niveles de
exactitud.) ·
210
~ 200
....::Jo
.Ee 190
e
~
...."' 180
2
e
<11
o 170
Cl.
E
<11
¡= 160
150
Antes Después
del entrenamiento del ent renamiento
Condición
Figura 15.2. Medias y desviaciones estándar del tiempo que los ciclistas toman en
terminar la ruta antes y después del entrenamiento.
\
_ _ _ __ _A
_n_á_li_si_s_d_e_d_if_e_re_n_c_ia_s_e_n_t_re_d_o_s_n_iv_e_l_es_de_u_na_va_r_ia_b_le_in_d_e.:...p_en_d_ie_n_t_e_--Jf213
A partir de las estadísticas de resumen podemos ver que hay una ligera mejoría en la me-
dia del tiempo en la condición posterior al entrenamiento, pero que se tiene gran superpo-
sición entre las dispersiones de ambas condiciones.
Si ninguna condición puede tratarse como control, habríamos encontrado la desviación es-
tándar (DE) agrupada como en el diseño entre sujetos.
En el presente caso,
184.0909- 182.5455
d
21.66
= 0.07
De acuerdo con Cohen (1988), ello es menor que un tamaño del efecto pequeño.
Esta versión de la prueba t se forma con lo siguiente:
La media de diferencia si H 0 es conecta es igual a cero. Por tanto, la ecuación puede rees-
cribirse como sigue:
media de diferencia
t intrasujetos = - -- - - - - - -
error estándar de diferencias
En el presente caso,
t = 184.091 - 182.546
1.021
1.513
"'2'141 Investigación cuantitativa en psicología
~------------------=-------------~----~--------------------
En la parte correspondiente de las tablas t del apéndice XV, los investigadores encuentran
que con gl = 1O, p cae entre 0.1 y 0.05 para una prueba de una cola. De acuerdo con esto,
los psicólogos no pueden rechazar la hipótesis nula y están forzados a concluir que su téc-
nica de entrenamiento no mejora el desempeño.
0.456
Cuando el valor de t intrasujetos se conoce, d' puede calcularse de
d' = _t_
¡;;
Por tanto,
3
d' = 1.5! = 0.456
..Jlí
Los investigadores notan que, con ese tamaño del efecto (d = 0.456) y una muestra de 11
participantes, el poder de su prueba estaba entre 0.32 (parad= 0.4) y 0.44 (para d = 0.5).
Por tanto, como el efecto cae aproximadamente a medio camino entre los dos valores
tabulados, el poder será alrededor de la media de los dos niveles; lo que significaría
(0.32 + 0.44)/2 = 0.38. A fin de alcanzar el poder de 0.8, los investigadores habrían nece-
sitado entre 30 y 40 participantes, o unos 35 ciclistas. Por ello, pueden concluir que vale la
pena repetir el estudio con el tamaño de muestra más grande.
(La discrepancia entre los dos valores, parad y d', calculados para el estudio se expli-
ca en el apéndice XV.)
-
_ _ __ __ A_n.:..ál....:is....:is_d....:e_d.:..i.:..fe_r_en_c_ia_s_e_n.:..
tr....:e_d....:o.:..s_n_iv....:e..:..:le.:..s....:d....:.e....:u....:n.:..a_v_ar_ia.:..b....:le..:...._in....:d....:.e!:...pe.:..n....:d_ie.:..n....:.te
..:....____Jf215
Pruebas no paramétricas
Pruebas para evaluar la diferencia entre dos niveles
de una variable independiente: por lo menos escala ordinal
Diseños entre sujetos: la prueba U de Mann-Whitney
La prueba U de Mann-Wbitney supone que las distribuciones en la población de los dos gru-
pos que se comparan son iguales. Por tanto, no es tan restrictiva como la prueba t y puede
usarse ante distribuciones anormales. Sin embargo, implica homogeneidad de varianza.
Esta última restricción puede resultar menos problemática porque la prueba requiere la
colocación de los datos en orden en lugar de anotar el tamaño de cualquier diferencia en-
tre puntuaciones y, por ello, se reducirá el efecto de puntuaciones extremas. No obstante,
si las puntuaciones originales tienen varianzas heterogéneas, valdría la pena convertir los
datos en clasificaciones escalonadas, ordenando juntas ambas muestras y luego compro-
bando que la varianza de los ordenamientos de un grupo no es mayor que el triple de la
varianza del otro. Si las varianzas petmanecen heterogéneas, Zimmerman y Zumbo (1993)
recomiendan llevar a cabo una prueba t para varianzas separadas, la prueba t de Welch, ya
mencionada en el capítulo, en los datos escalonados. Igual que con la prueba t entre suje-
tos, la U de Mann-Wbitney supone que las puntuaciones son independientes entre sí.
Los investigadores desean comparar las actitudes de dos grupos de estudiantes (los que
cursan física y los inscritos en sociología) hacia la caza de animales. A cada uno se pide
que estime su grado de acuerdo con la afirmación "Cazar animales salvajes es cruel". Las
estimaciones se realizaron sobre una escala de 5 puntos, de muy en desacuerdo a muy de
acuerdo, donde una puntuación alta denota una actitud contra la caza.
La hipótesis de investigación es ésta:
HA: Los estudiantes de sociología estarán más contra la caza que los de física.
Con la hipótesis nula siguiente:
H 0 : No hay diferencia entre los estudiantes de sociología y los de física en sus actitu-
des hacia la caza.
Expresada formalmente, la hipótesis nula es que las medianas de ambos grupos no difieren.
Tabla 15.4. Actitudes de los estudiantes de sociología y física hacia una pregunta
relacionada con la caza de animales.
Sociología Física
5 1
4 2
3 3
3 4
5 5
4 2
2 1
5 3
5 4
4 - 2 ~
4 1
3 3
(Continúa)
Análisis de diferencias entre dos niveles de una variable independiente j217
----------------------------------------------------~------~
3 2
5 3
4 3
.. 4
4
5
4
5 3
5 2
5 1
5 2
Media 4.14 2.67
Mediana 4 3
Poder
Los investigadores supusieron un tamaño del efecto grande, establecieron a en 0.05 y, co-
mo planteaban una hipótesis direccional (la gente clasificará la psicología más claramente
como una ciencia después de que hayan escuchado la charla acerca del tema), utilizarían una
probabilidad de una cola. Querían un poder de 0.8. La prueba de Wilcoxon tiene la misma
_ _ __ _ _A_n_ál_is_is_d_e_d_i_
f e_r_
en_c_ia_s_e_n_tr_e_d_o_s_n_iv_e_le_s_d_e_u_n_
a _v_
an_·a_b_le_in_d_e:....
pe_n_d_ie_n_te_ __.f219
eficiencia de poder que la U de Mann-Whitney. De acuerdo con esto, podemos buscar el
tamaño de muestra para una prueba t intrasujetos con un tamaño del efecto de d = 0.8 y po-
der de 0.8 y multiplicar el tamaño de muestra por 1.05. Con las tablas del apéndice XV
encontramos que el tamaño de muestra para la prueba t equivalente debería ser de 11. Por
tanto, el tamaño de muestra requerido para una prueba de Wilcoxon es 11 x 1.05 = 11.55.
Redondeamos esto al número entero más cercano, lo cual da un tamaño de muestra de 12
participantes.
1 1 4
2 1 4
3 2 2
4 2 4
5 3 5
6 2 4
7 3 4
8 4 4
9 5 5
10 4 5
11 2 3
12 3 3
Media 2.667 3.917
Mediana 2.5 4
La prueba de Wilcoxon busca el tamaño de diferencias entre los dos niveles de la VL Cla-
sifica éstas de acuerdo con su tamaño y da a cada una un signo positivo o negativo, consi-
derando si el segundo nivel es mayor o menor que el primero. Luego se suman los rangos
del signo que ocurre menos y el resultado forma la estadística T. En este caso, se realizó
una prueba de Wilcoxon con el resultado de que T = O (pues no había personas para quie-
nes el segundo resultado fuera menor que el primero); los trabajos se aprecian en el apén-
dice VI.
220lL_____________~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a--------------------
Puntuaciones empatadas
En la prueba de Wilcoxon hay dos tipos de puntuaciones empatadas: donde un participan-
te dio la misma puntuación para cada condición y donde las puntuaciones de diferencia de
pa1ticipantes distintos fueron iguales.
Esta prueba descarta los casos en que no hay diferencia entre los dos niveles de la VI,
y el tamaño de muestra incluye sólo a los que sí mostraron una diferencia. Por tanto, en el
presente ejemplo, como cuatro personas no cambiaron su estimación entre las dos ocasio-
nes, el tamaño de muestra se considera 12-4 = 8. Si el rango de puntuaciones posibles es
limitado, habría una proporción alta de esos empates y ello reduciría de modo considera-
ble el poder de la prueba por reducir el tamaño real de la muestra.
Signifkadón estadistka
Muestras pequeñas. Si el tamaño de la muestra es 25, o menor, utilice la tabla del apén-
dice XIV. Con el tamaño de muestra corregido a ocho, sabemos que p < 0.005 para una
prueba de una cola.
Muestras más grandes. Cuando el tamaño de la muestra es mayor que 25 puede utilizar-
se una prueba z para calcular la probabilidad de que T hubiera ocurrido por azar. Si más de
una persona tiene la misma diferencia de tamaño entre los dos niveles de la VI, los progra-
mas de computadora suelen calcular un valor z que permite tales valores empatados. Como
la prueba U de Mann-Whitney, la z corregida para empates es la más exacta. Las operacio-
nes correspondientes para la prueba z se proporcionan en el apéndice VI.
•
____________A_n_á_li_sl_·s_d_e_d_i_fe_re
_ n_c_ia_s_e_n_t_re__
do_s_ n_i_v e_l_e_s_
de__u_
n_a _v_ar_ia_b_l_e_in_d_e~p_e_nd_i_e_nt_e__~¡-221
que forman en la otra variable. Sin embargo, es importante que ninguna persona se cuente
más de una vez; las entradas de la tabla deben ser independientes entre sí.
Por ejemplo, los investigadores han oído que, al parecer, gran número de estudian-
tes mujeres fuman. Quisieran ver si es diferente la proporción de hombres y mujeres que
fuman .
Tamaño del efecto. El tamaño del efecto para esta versión de la prueba x2 es el mismo que
para la x2 de bondad de ajuste de un grupo. La medición del tamaño del efecto dado por
Cohen (1988) es w, con 0.1, 0.3 y 0.5 , donde los valores de w que sugiere constituyen ta-
maños del efecto pequeño, mediano y grande.
Poda Los investigadores desean detectar al menos un tamaño del efecto medio (w = 0.3)
y, de este modo, buscan en las tablas del apéndice XV un tamaño del efecto medio, con
a= 0.05 y gl = 1 (que se explicará más adelante). Observan que para un poder de 0.8, el
tamaño de muestra recomendado es 88. Deciden que les gustaría un número igual de hom-
bres y mujeres para realizar comparaciones de proporciones más simples; así, trabajan con
muestras de 44 hombres y 44 mujeres.
Los investigadores preguntaron en su estudio a los participantes si fuman y colocaron
los resultados en una tabla:
Tabla 15.6. Números de fumadores y no fumadores entre hombres y muj eres en una
muestra.
Fumador 17 21 38
No fumador 27 23 50
Totales 44 44 88
Esta versión de la prueba x2 prueba la hipótesis nula de que el estatus de fumador y el gé-
nero no están interrelacionados (son independientes uno del otro). Hace esto al anotar las
proporciones de hombres y mujeres en la muestra (44 de 88 o 0.5 para cada uno) y las pro-
porciones de fumadores y no fumadores (38 de 88, o aproximadamente 0.43, para fumado-
res; 50 de 88, o 0.57, para no fumadores). Si ambas vmiab1es (género y tabaquismo) no es-
tán relacionadas debe haber la misma proporción de fumadores entre hombres que entre
mujeres (es decir, 0.43 o 43 %). Por tanto, con la hipótesis nula de que la proporción de
hombres y muj eres fumadores es la misma, la frecuencia esperada produciría la tabla 15.7.
222lL______________~I~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it~a~ti_va~e_n~p~si~co~l~og~í~a____________________
Tabla 15.7. Las frecuencias esperadas de fumadores y no fumadores entre hombres y
mujeres no están intervinculadas.
Valores esperados
Fumador 19 19 38
No fumador 25 25 50
Totales 44 44 88
Sin embargo, 17 de los hombres, o 38.64%, fueron fumadores, mientras que 21, o 47.73%,
de las mujeres fumaban.
La prueba x2 compara las frecuencias esperadas con las ocurridas realmente (las observa-
das). Las operaciones correspondientes para el ejemplo se proporcionan en el apéndic_e VI.
El resultado es que x2 = O. 741. Al buscar en la tabla para la distribución de chi cuadrada en
el apéndice XIV se aprecia que la probabilidad de que este resultado, con gl = 1, ocurriera por
azar es de 0.3 < p < 0.5. La computadora reportó la probabilidad exacta como p = 0.3893.
/
--~--__:_A.:n~.á.: . lis~is:. :. .d.: . e:. _.: ._di:. :. .fe:. :.r~e:.:.nc:. :.ia:. :s:. :. .e:. :.n.:. :t:. .:re:. :. .d:. :o:.:s. . :.n:.:.iv:. .:e:.:.le:.:s:. . :..::d e:. . :u:. :.n:.:a:. . :v. :a: . .:ri-=ab:. :l:.:.e. . :.in:. :. .d:. :e~p:.:.en:. :. .d:. :.ie.:. :n.:. :t:.:.e_ _¡j223
mveles de cualquier variable (por ejemplo, el estatus de tabaquismo podia tener los niveles
nunca fumó, ex fumador y actualmente fuma). La regla para obtener los grados de libertad
consiste en restar uno al número de columnas de la tabla y uno al de filas y multiplicar los
resultados:
gl =(columnas - 1 ) x (filas- 1)
(2 - 1) X (2 - 1) = 1 X 1 = }
Pruebas de una y de dos colas y y}. Como se mencionó en el capítulo 14, la probabilidad
que se da en tablas de cbi cuadrada y en programas de computadora corresponde a hipóte-
sis no direccionales. Con una tabla de contingencia mayor que 2 x 2, un resultado signifi-
cativo podría ir en más de dos direcciones posibles. Por ejemplo, si buscamos un estudio
de fumadores que incluya tres estatus posibles de tabaquismo rechazaremos la hipótesis nu-
la de que no hay diferencias entre los géneros sí fumadores, no fumadores o ex fumadores
fueran particularmente altos (o bajos) en cualquier género. Sin embargo, si tenemos una hi-
pótesis direccional y el resultado va en la dirección de nuestra hipótesis, puede dividirse la
probabilidad dada por una hipótesis no direccional entre el número de maneras en que el
resultado podría dirigirse y contar con significación estadística.
El caso más simple para demostrar esto es con la tabla de 2 x 2. Imagine que el inves-
tigador predijo que habría una proporción más alta de fumadores entre las mujeres que entre
los hombres. El resultado, resumido en la tabla 15.6, se encaminó en la direccién predicha
y hay sólo dos formas en que esta tabla de contingencia podría tener significación estadís-
tica: una proporción más alta de hombres fumaba o una mayor proporción de mujeres lo
hacía. De acuerdo con esto, podemos dividir entre dos la probabilidad reportada origi-
nalmente; como resultado, p = 0.1946. Como señalamos en el capítulo 14, si calculó tal
probabilidad se aconsejaría que explicara el proceso porque, si bien legítima, no es una
práctica común. Para evitar la necesidad de explicación, como el resultado se mantuvo no
significativo incluso tras convertirse en una probabilidad direccional, yo simplemente re-
portaría la probabilidad no direccional.
Reporte de los resultados de una prueba x2 . Como es usual, debe reportar la prueba que
se usó; la conclusión que extrajo del resultado y sus pruebas para la conclusión. Por tanto,
yo diría: "Se realizó una prueba 2 de 2 x 2 para comparar las proporciones de fumadores x
y no fumadores entre hombres y mujeres. No hubo una proporción significativamente más
elevada de mujeres que de hombres fumadores (x2 = 0.741, gl = 1,p = 0.3893, N = 88)".
Si deja la probabilidad dada por la computadora o por ur.a tabla no hay necesidad de repor-
tar que es una probabilidad de dos colas.
224lL_______________I_n_ve_s_ti~ga_c_io_·n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_co_L_o~gí_a ____________________
Nueva visita al tamGiio del efecto. El tamaño del efecto w puede calcularse con la ecua-
ción siguiente:
lo.74I
w= f ss
= 0.0918
De acuerdo con Cohen, ése es un tamaño del efecto pequeño. Dado ese tamaño, el poder
fue menos de 0.2. Para alcanzar un poder de 0.8 con tal magnitud, se necesitaría un tama-
ño de muestra de más de 700 participantes.
Corrección para continuidad. La probabilidad de que el resultado de la prueba 2 hubie- x
ra ocurrido por azar se calcula tomando como referencia una distribución particular, la dis-
tribución chi cuadrada. Ésta es lo que se denomina dish-ibución continua, lo cual significa
que podrían existir todos los valores posibles para chi cuadrada. Sin embargo, las pruebas que
x
producen un valor de 2 no pueden generar una gama en verdad continua de valores posi-
bles; ello será particularmente cierto con tamaños de muestra pequeños y un número redu-
cido de categorías. Por tanto, debajo de cierto tamaño de muestra y número de categorías
x
se sugería que la estadística 2 no tenía una distribución representada con exactitud por la
distribución de chi cuadrada.
Yates ideó una forma de corregir la continuidad para una tabla de contingencia de 2 x
2, la cual se cita a menudo en programas de computadora. En el ejemplo de género por es-
x
tatus de tabaquismo, la versión corregida da 2 = 0.417, p = 0.5185. Hace 20 años todavía
se consideraba apropiado reportar la versión corregida de Yates de 2 . Sin embargo, desde x
entonces se ha presentado una polémica para definir si resulta apropiada. Mi consejo estriba
en que, si las versiones corregidas y las no co1Tegidas de la prueba coinciden en la signifi-
cación del resultado, como en el ejemplo de los fumadores, entonces no hay problema: repor-
te la versión incorrecta. Empero, si ambas versiones difieren, repórtelas y haga hincapié en la
discrepancia. El lector puede formar sus propios juicios.
Frecuencias esperadas pequeñas. Otra manera de tratar de evitar el problema de que x2
no se refleje en la distribución cbi cuadrada, en ciertas circunstancias, consiste en tener fre-
cuencias esperadas de tamaño razonable. La regla usual dicta que todas las frecuencias
esperadas en una tabla 2 x 2 deben ser por lo menos cinco. En el caso de tablas mayores
que 2 x 2, al menos 80% de frecuencias esperadas han de ser por lo menos cinco. Tales res-
•
_ _ _ _ _ _A_n_ál_is_is_d_e_d_i_fe_r_en_c_ia_s_e_n_:_tr....:.e_d_o_s_n_iv_e_le_s_d_e_u_n.:...a_v.:...an_·a:.....b:.....le.::..._in....:.d...:.e!:...pe:.....n....:.d_ie:.....n_te.::...____Jfll5
tricciones significan que, aun cuando no utilicemos poder estadístico para guiar el tamaño
de muestra, desearemos un mínimo de cinco participantes por celda en la tabla de contin-
gencia, lo cual implica que un estudio que se analizará con una tabla de 2 x 2 tendrá por lo
menos 20 participantes. En el capítulo 16 se muestra cómo resolver por distintas vías el
problema de frecuencias esperadas pequeñas en tablas de contingencia mayores que 2 x 2.
Prueba de probabilidad exacta de Fisher. Fisher ideó una prueba para hacer frente a las
tablas de contingencia de 2 x 2 con muestras pequeñas. Por desgracia, se aplica sólo cuan-
do todos los totales marginales son fijos (donde los números del total se han especificado
·antes de llevar a cabo el estudio). En el ejemplo de los fumadores, los totales para hombres
y mujeres se fijaron en 44, mientras que para fumadores y no fumadores quedaron libres;
es decir, no se conocieron hasta que se recolectaron los datos. En realidad, es inusual tener
todos los totales marginales fijos y carece de sentido en el ejemplo de fumadores porque
significaría especificar cuántos fumadores y no fumadores hay que incluir en la muestra,
además de cuántos hombres y mujeres. No obstante, en el apéndice VI se proporciona el
método para calcular la prueba de probabilidad exacta de Fisher y en el XIV sus tablas de
probabilidad.
Prueba rápida de tabla de frecuencia de 2 x 2. Una manera preferible de tratar con frecuen-
cias esperadas pequeñas es una versión modificada de la prueba x2 que utiliza la ecuación
siguiente (proporcionada aquí porque no suele estar disponible en programas de compu-
tadora):
(N- 1) X [(A D) - (B C)f
x2 modificada (A+ B) X (C + D)
X
X (A + C)
X
X (B + D)
Como ejemplo, imagine que los investigadores exploran si tener una mascota mejora la es-
peranza de vida de las personas de edad avanzada. Seleccionan a 1O individuos con más de
75 años que no tienen mascota y viven solos. Eligen al azar a la mitad de la gente que ha-
bt'á de cuidar un perro. Después de dos años anotan cuántos sujetos con mascotas y sin ellas
siguen vivos.
•
•
_ _ __ _ _A_n_ál_is_is_d_e_d_i_fe_r_en_c_ia_s_e_n_tr_e_d_o_s_n_iv_e_le_s_d_e_u_n_a_v_ar_ia_b_le_in_d_e;_pe_n_d_ie_n_te_ ___,[227
Tabla 15.10. Número de personas que están de acuerdo o en desacuerdo con que la
psicología es una ciencia, antes y después de escuchar una charla.
Después
De acuerdo En desacuerdo
En desacuerdo 9 3
Antes
De acuerdo 6 o
Para esta prueba interesan sólo quienes han cambiado de opinión. De acuerdo con ello, la hi-
pótesis nula que se prueba es que el número de personas que cambian en una dirección será
el mismo que el de las que cambian en el otro sentido. Si etiquetamos las cuatro celdas
Después
De acuerdo En desacuerdo
En desacuerdo A B
Antes
De acuerdo e D
(A- D) 2
(A+D)
(9 - 0) 2
(9+0)
81
9
9
~a prueba tiene gl = l.
La significación estadística de la prueba de cambio de McNemar. Según las tablas de la
distribución chi cuadrada del apéndice XIV, la probabilidad de que el resultado ocurra por
azar es 0.001 < p < 0.01. Como con las otras pruebas x2 , tal probabilidad es para una hipó-
tesis no direccional. Si hubiéramos planteado una hipótesis direccional de que más personas
cambiarían para estar de acuerdo en que la psicología constituye una ciencia de las que cam-
biarían para estar en desacuerdo con ello, podríamos dividir la probabilidad entre dos. En
este caso, 0.0005 < p < 0.005.
1
~L__________________In_v_e_st_ig~a_c_io_·n__c_u_a_nt_i_
ta_t_iv_a_e_n~p_s_ic_o_lo~g~ía________________________
Resumen
Cuando se comparan dos niveles de la VI puede utilizarse la gráfica siguiente para decidir
cuál es la prueba estadística apropiada (sin embargo, recuerde que si la homogeneidad de·
la varianza no está presente pero se satisfacen los otros requisitos de una prueba t entre su-
jetos, debe usar una tipo t de Welch):
No----
l Nominal
\
Figura 15 .3. Pruebas estadísticas para diseños de más de una variable independiente
con dos niveles.
Introducción
Hasta ahora hemos mostrado el análisis de diseños que incluye una sola variable indepen-
diente (VI) con un máximo de dos niveles. En el presente capítulo se describe cómo reali-
zar análisis de diseños con una sola VI y más de dos niveles.
Pruebas paramétricas
Para ejemplificar, regresaré al caso presentado en el capítulo 9. Los investigadores desean
comparar el recuerdo de los participantes en tres condiciones: utilizando el sistema nemo-
técnico de palabras gancho, .el método de ubicación y la aplicación de ningún sistema ne-
motécnico (la condición control). Para evitar efectos de práctica y los problemas de tener
que igualar listas en grado de dificultad, se elige un diseño entre sujetos.
Los psicólogos tienen ahora un diseño que incluye una variable independiente (tipo
de nemotécnica) con tres niveles: palabras gancho, método de ubicación y condición con-
trol. También se cuenta con una sola VI (número de palabras recordadas). Cuando llegue
el momento de analizar los resultados del trabajo, podrían emplearse las pruebas t para com-
parar pares de niveles. Sin embargo, se efectuarán tres pruebas t: una entre palabras gancho
y método de ubicación, una entre palabras gancho y grupo control y una entre método de
ubicación y grupo control. Este enfoque sería posible, pero un problema estadístico lo vuel-
ve poco aconsejable.
----------------------------------------------------------~229
23QlL_______________I_nv_e_s_tig~a_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_l~og~ía_____________________
La razón de la prueba de significación estadística consiste en que cuando decidimos
aceptar nuestra hipótesis y rechazar la nula asumimos el riesgo de cometer un error tipo
l. Imagine que establecimos a= 0.05. Decimos que si el resultado que encontramos pu-
diera ocurrir realmente por azar, y si repetimos en gran número de ocasiones la investiga-
ción y analizamos los datos cada vez, esperaríamos que en alrededor de 5% de las veces
el resultado sería tan extremo o más extremo que éste y, por tanto, se tomaría estadística-
mente significativo. De este modo, si realizamos más de una vez la prueba aumentamos
la probabilidad de encontrar un resultado significativo, aunque el resultado se daba en rea-
lidad al azar.
Puede tratar de permitirse la realización de varias pruebas si se reducen el nivel de a
y, por ende, el peligro de cometer. un error tipo J. Sin embargo, tales técnicas son más bien
inexactas. Se considera mejor, al menos inicialmente, hacer una sola prueba que compren-
da todos los datos recolectados en una pieza de investigación. Si la prueba inicial demuestra
que hay una diferencia significativa entre los niveles de la variable independiente se justifi-
cará que exploremos más los datos para tratar de identificar las contribuciones específicas
de tal efecto significativo.
La prueba más apropiada para analizar el experimento sobre memoria descrito es el
análisis de varianza (denominado generalmente A NOVA, analysis ofvariance). El ANOVA
puede considerarse una extensión de la prueba t porque compara las medias de los diver- "'-.
sos niveles de la variable independiente y, como sucede con la prueba t, la hipótesis nula
radica en que las medias no difieren. En términos formales, la hipótesis nula es que en rea-
lidad los tres conjuntos de datos del grupo provienen de la misma población y, por tanto,
tienen la misma media. Además, como ocurre con la prueba t, aunque haya una diferencia
entre las medias, si la variación de las puntuaciones intragrupos es grande, no se obtendrá
una diferencia significativa. No obstante, como tratamos con tres y no con dos medias, la
manera de evaluar la diferencia entre ellas consiste en ver cuánto varían.
Para percibir la natUraleza del ANOVA es necesario volver a presentar ciertos concep-
tos y luego aplicarlos a los conocimientos existentes. Ello será de ayuda para leer la tabla
de resumen obtenida con la realización de un ANOVA.
Como se mostró en el capítulo 9, una forma de saber en qué medida una puntuación es
típica o atípica consiste en calcular la distancia que guarda respecto a la media de su grupo
(es decir, su desviación de la media del grupo). Si queremos medir la dispersión en un gru-
po de puntuaciones podemos elevar al cuadrado la desviación de cada una de éstas y sumar
todos los cuadrados respectivos; tal operación se conoce como suma de las desviaciones al
cuadrado y suele reducirse a suma de cuadrados. Si dividimos la suma de los cuadrados
entre los gl apropiados obtenemos la varianza del grupo de puntuaciones, descrita por lo
general como media de cuadrados en el ANOVA. Si la hipótesis nula es correcta, todas las
_______________A_n_á_li_si_s~p_re_l_im_i_na_r_d_e__
d,_·se_ñ_o_s_c_o_n_u_n_a_V_I_d_e_m_a_·s_d_e_d_o_s_n_i_ve_L_es______~f:ZJ1
Imagine que los investigadores seleccionaron a 1Opersonas para incluirlas en cada grupo
del experimento. (Dejaré para más adelante, en este capítulo, el análisis de poder.) Les die-
ron las instrucciones apropiadas y luego les presentaron 20 palabras. Después de 24 horas
les pidieron que dijesen todas las palabras que pudieran, en cualquier orden. La hipótesis
de investigación es que el método de ubicación produce el mejor recuerdo. Sin embargo,
note que el ANO VA no puede probarla directamente. En esta etapa, los investigadores só-
lo pueden preguntar si el recuerdo de los tres grupos difiere de manera significativa. Por
tanto, su hipótesis de investigación tiene otra hipótesis, preliminar, que se prueba primero:
HA: La media de recuerdo de las tres condiciones es diferente,
que tiene la hipótesic; nula
H 0 : La media de recuerdo de las tres condiciones no es diferente.
Formalmente, la hipótesis nula consiste en que son iguales las medias de la población de
las diferentes condiciones. En el caso de tres medias, H 0 sería !lt = !A:2 = !!J·
Si la hipótesis preliminar no está sustentada, la de investigación tampoco lo estará y no
valdrá la pena probarla. Sin embargo, si aquella hipótesis lo está, convendrá llevar a cabo un
análisis adicional (como se describe en el capítulo 18) para ver si la hipótesis de investiga-
ción también está sustentada.
_______________A_n~á~li~si~s~p~re~l~im~i~n~ar_d~e~d~is~en~-o~s_c~o~n~u~n~a_V~I~d~e~m~a~·s~d~e~do~s~n~i_ve~l~e~s____~¡-233
Tabla 16. 1. Medias y desviaciones estándar de recuerdo de palabras para las tres
condiciones de memoria.
12.---------------------------------------~
"'
10
~ 11
"'O
5u 10
~
"'
~ 9
.Cl
10
~ 8
CIJ
~ 7
~
E
.:;:¡
6
z
5 L---------~--------~--------~--------_J
Control Palabras gancho Método de ubicación
Estrategia nemotécnica
Figura 16. 2. Medias y desviaciones estándar de recuerdo de palabras para las tres
condiciones de memoria.
Podemos ver que ~as medias son diferentes. Sin embargo, en la figura se aprecia cierta super-
posición de los tres conjuntos de puntuaciones. Para probar si las diferencias entre las
medias son estadísticamente significativas, aplicaremos un ANO VA a los datos. Véase en el
apéndice VU un ejemplo trabajado. En seguida se advierten los resultados del análisis; el tér-
mino una vía se utiliza para describir un ANO VA realizado en un diseño con una sola VI:
Tabla 16.2. Tabla de resumen de un ANOVA de una vía entre sujetos donde se compara
el recuerdo mediante las tres estrategias nemotécnicas.
-
su gl, obtendrá la media de cuadrados apropiada; ésta constituye los estimados de varian-
za. La columna siguiente proporciona la razón F, que se encuentra en este caso dividiendo
la media de cuadrados para entre grupos entre la media de cuadrados para intragrupo~
media de cuadrados d~rror).
Colas de prueba
Con las pruebas estadísticas presentadas hasta ahora queremos conocer la cola de prueba
por emplear. Sin embargo, cuando se prueban más de dos niveles de variables independien-
tes en un ANOVA no hay elección: la prueba equivaldrá a la de dos colas. Para encontrar
la razón de ello, regresemos a la naturaleza de la hipótesis nula en diseños de investigación
analizados con ANOVA. Dicha hipótesis establece que no difieren las medias de las diferen-
. tes condiciones (pues provienen de la misma población). Según la hipótesis alternativa, sí
difieren (ya que provienen de poblaciones distintas). Con el ANOVA descrito es imposible
probar hipótesis más precisas, como ésta: El recuerdo del grupo control será peor que el
de las otras dos condiciones.
Si piensa en ello, verá que cuando hay tres niveles de una VI, una hipótesis precisa
es sólo una de muchas otras hipótesis direccionales que podrían establecerse, en lugar de
las dos posibles cuando hay sólo dos niveles de una variable independiente. Si deseamos
probar una hipótesis direccional más precisa, primero comprobaremos si se sustenta la no
_ _ _ __ _ _A
_ :n_:á_:li_:_sT_:_
·s...!:p.:...re:..:l.:..:..im
.....:i.:..:.
na:..:r.....:d:..:e_:d:..:i:..:se.:..:._ñ_:_o.:..s_:_co.:..n.:...u.:..:..n_.::a.:...V
_I_.::d:..:
e _m.:..:.a::.:
' s_d:..:e_d::...:o_:_s_n_iv_.::
e_le__s _ _ __¡llli
direccional. En caso afmnativo, podemos explorar más mediante las técnicas descritas en
el capítulo 18. De lo contrario, tendremos hechos escasos para formular una hipótesis di-
reccional.
Tabla 16.3. Extracto de las tablas de probabilidad de a= 0.05 para una razón F.
gl1 ~ \.'\.\..{'~ o G <j
gl2 2 3 4 5 6 7 8 9 10 12 14
26 ~ 3.371 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.09
27 4.21 3.35; 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08
28 14.Wl3.341 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06
Es común que las tablas de significación para razones F vengan en grupo, con una tabla
para cada nivel de significación. Con frecuencia, las tablas están limitadas a a = 0.05,
a= 0.025, a= 0.01 y a= 0.001, o inclus6 un rango más pequeño, como sucede en el pre-
sente libro, que incluye sólo tablas para a = 0.05 y a = 0.0 l. Así, sólo podemos decir que
una razón F alcanza o no alcanza significación estadística y no es posible ser mucho más
preciso que eso.
En la tabla 16.3, los grados de libertad para tratamiento se muestran en la primera fi la
(gl 1), de modo tal que hay una columna dedicada a cada diferente gl de tratamiento. El gra-
do de libertad del término de error se halla en la primera columna, de modo que cada hilera
tiene un gl distinto para el término de error (en este caso, la fuente de varianza intragru-
pos, gl 2). Por tanto, a fin de localizar el valor crítico para que F sea significativo a p = 0.05
buscaremos en la columna para gl = 2 y la fila para gl = 27. Ello revela que el valor crítico
es F = 3.3 5. Como el valor de F encontrado tras nuestro análisis ~ayor que iste, dir.iª:
m.os_que nuestro resultado es estadísticamente sigrlificativo en elni'{~p_::_ 0.05 . Podemos
seguir buscando en las tablas niveles de menor significación, en cuyo caso encontraríamos
que p cae entre 0.01 y 0.05 (es decir: 0.01 < p < 0.05).
236 Investigación cuantitativa en psicología
Por tanto, los investigadores pueden rechazar la hipótesis nula y aceptar la de investi-
gación preliminar de que el recuerdo es diferente en las tres condiciones. Recuerde que te-
nían una hipótesis más específica. Puesto que se ha sustentado la hipótesis de investigación
preliminar, se justifica la aplicación de análisis adicional para evaluar su hipótesis más es-
pecífica. Quiero posponer la descripción del análisis hasta el capítulo siguiente, ya quepa-
ra entonces habré presentado las diversas formas del ANOVA.
Diseños intrasujetos
Los diseños intrasujetos se conocen también como de mediciones repetidas. En uno con
una sola variable independiente puede considerarse que la variación total de los datos tie-
ne dos fuentes principales: diferencias entre los participantes (varianza entre sujetos) y en
éstos (varianza intrasujetos); es decir, la manera en que los individuos varían entre condi-
ciones distintas. La varianza intrasujetos puede subdividirse en varianza entre los niveles
de Y1 (las condiciones, que son la varianza de los tratamientos) y la varianza por la manera
en que los diversos participantes mostraron una pauta distinta de respuesta entre las condi-
ciones (tratamiento por sujetos, conocido también como varianza de error o varianza de
residuo). Un ejemplo de lo último sería si el primer participante ha recordado más palabras
en la condición de palabras gancho, mientras que el segundo ha recordado más en la de ubi-
cación.
De acuerdo con la figura 16.3, podrían calcularse dos razones Fa pa1tir de este diseño:
y
variación de tratamiento
F
variación de error
_______________A_n_á_lis_i_s~p_re_li_m_i_na_r_d_e_d_i_se_ñ_o_s_c_o_n_u_n_a_V_I_d_e_m_á_s_d_e_d_o_s_n_iv_e_le_s____~f:2J7
Tratamiento
por sujetos
(error)
Tabla 16.4. Las medias y las desviaciones estándar del tiempo de la sentencia
(expresada en meses) sugerida por los partfcipantes.
~Cl.l
.§.
·~ 20
e
~
e
Cl.l
"'
~
~ 10
g_
E
Cl.l
i=
Los resultados sugieren que las sentencias recomendadas difieren entre las tres condiciones.
Sin embargo, note que también hay una dispersión alrededor de las medias y gran superpo-
sición entre las tres condiciones. Como es usual, las estadísticas descriptivas sólo pueden
indicar en qué dirección van los resultados; no reflejan la probabilidad de que éstos hubie-
ran ocurrido por azar. Por ende, no podemos decidir entre la hipótesis nula y la de investi-
gación hasta que hayamos aplicado un ANOVA a los datos.
En seguida se muestra la tabla de resumen para el análisis de varianza en el experi-
mento:
Tabla 16.5. Tabla de resumen para el ANOVA de una vía intrasujetos que compara las
sentencias dictadas a delincuentes cuando las decisiones se toman en tres
condiciones.
Fuente gl Suma de cuadrados Media de cuadrados Razón F p
Entre sujetos 9 776.3 86.256 24.491 0.0001
lntrasujetos 20 208.667 10.433
Tratamientos 2 145.267 72.633 20.621 0.0001
Residuo 18 63.399 3.522
Total 29 984.967
Observe que la tabla de resumen del ANOVA de un diseño intrasujetos parece más compli-
cada que la de uno entre sujetos, lo cual se debe a que podemos identificar más fuentes pa-
ra la variación entre todas las puntuaciones.
La primera columna divide inicialmente las fuentes de varianza en dos partes. Existen
la varianza entre sujetos y la intrasujetos. Ésta se subdivide en lo que se debe a Jos trata-
mientos (diferencias entre las condiciones) y el residuo (el error o la varianza que no pue-
de explicarse con las diferencias entre sujetos o entre las condiciones).
La segunda columna informa que los grados de libertad totales son 29; ello se produ-
ce tras anotar cuántas puntuaciones tenemos (tres por cada uno de los 10 participantes) y
restar 1 al resultado. Los 29 gl se dividen inicialmente en 9 para la varianza entre sujetos
(los 10 participantes menos uno) y en 20 para la intrasujetos (la diferencia entre el gl total
y el gl entre sujetos). El gl intrasujetos puede dividirse además en 2 para los tratamientos
(el número de tratamientos menos uno) y en 18 para el residuo (el número de condiciones
menos uno, multiplicado por el número de participantes menos uno: [3 - 1] x [ 1O- 1]).
La tercera columna indica el tamaño de la suma de las desviaciones al cuadrado (suma
de cuadrados) para cada una de las fuentes de varianza; véase en el apéndice VII una des-
cripción de cómo se obtiene esto. La suma de cuadrados total se ha dividido entre lo atri-
buible a la variación entre sujetos e iotrasujctos. Luego, ésta se subdivide en la variación
debida a los tratamientos y al error (el residuo).
~L----------------In_v_e_st_i~
ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
Ahora estamos en posición de calcular los estimados de la varianza a partir de las diver-
sas fuentes (la media de cuadrados, o MC) dividiendo la suma de los cuadrados entre los
grados de libertad apropiados. Tales estimados se muestran en la cuarta columna. Recuer-
de q ue con la hipótesis nula cada uno es un estimado de la misma varianza, la de la pobla-
ción única de puntuaciones, de la que se considera proviene la muestra de puntuaciones.
Según la tabla de resumen (la 16.5), tenemos tres estimados para la varianza de la po-
blación y a partir de ellos se calculan las dos razones F: una para la diferencia entre suje-
tos y otra para la diferencia entre las condiciones.
La MC para el res iduo contiene la variación que no se explica por las variaciones ge-
neral entre sujetos o general entre condiciones. Si los participantes no difieren consistente-
mente en la duración de las sentencias que recomiendan, la MC para sujetos también debe
incluir sólo un estimado de la varianza general de puntuaciones. Un ejemplo de participan-
tes que difiere de manera consistente se tendría si el primer participante siempre diera una
sentencia más rígida que el segundo, sin impmtar la condición experimental. Ello s ignifi-
caría que la puntuación general para la sentencia dada por el participante uno sería mayor
que la del participante dos. Si los participantes difieren de manera consistente, la MC para
sujetos contendrá las variaciones general y entre sujetos. Por tanto, la razón F para sujetos
se encuentra con la MC para entre sujetos entre la MC para el res iduo:
MC entre sujetos
F(sujetos) = MC residuo
Si los partic ipantes no difiere n de manera consistente en sus juicios, F (sujetos) debe ser
aproximadamente igual a 1; si difieren, F(sujctos) será mayor que l. Sin embargo, tenga en
cuenta esto: no es una consecuencia automática que, como una razón Fes mayor que 1, re-
sulta estadísticamente significativa; que el nivel crítico de F sea estadísticamente significa-
tivo depende de factores como el tamaño de la muestra y el número de niveles de la VI.
De igualfT!odo, si las condiciones generales no producen una diferencia en la duración
recomendada de la sentencia, la MC para los tratamientos sería sólo un estimado de la va-
rianza general entre puntuaciones (error). Por tanto, la razón F para tratamientos se encuen-
tra d ividiendo la MC para tratamientos entre la MC para residuos:
MC tratamientos
F(tratamientos) = MC residuo
Nivel de medición
Igual que otras pruebas paramétricas, esta versión del ANO VA es apropiada sólo cuando la
variable dependiente es una medición de intervalo o de razón con por lo menos 20 valores
posibles en la escala.
Homogeneidad de varianza
Como sucede con la prueba t entre sujetos, el ANOYA entre sujetos supone que la varian-
za para la población de puntuaciones de cada una de las condiciones es la misma.
Distribución normal
A semejanza de la prueba t entre sujetos, el ANOYA entre sujetos supone que las puntua-
ciones de cada una de las condiciones provienen de una población que tiene una distri-
bución normal.
Independencia
El ANOVA supone que las puntuaciones de una condición son independientes unas de otras;
en otras palabras: que las de una persona no se han afectado por las puntuaciones de otra.
Ello no implicaría un problema en un experimento sobre recomendaciones de tiempo de
sentencia, pues no incluimos en nuestro análisis las sugerencias de los cómplices. Sin em-
bargo, si hubiéramos atendido los juicios de los participantes después de analizar el tema
en grupos y los hubiéramos incorporado todos en el análisis, cada juicio en una condición
no sería independiente de los demás en un grupo.
triple. Si lo hacen, tal vez haya alguna manera de transformar los datos para reducir la va-
rianza (véase en el apéndice V cómo transformar datos). De modo poco usual, como con la
:a-
prueba t, hay una versión del ANO VA (la fórmula de Welch, F') diseñada para usarse con los
11'-
datos sin homogeneidad de varianza. En el apéndice VII se proporciona la fórmula de Welch
y un ejemplo de su empleo. Si hay tamaños de muestra desiguales, trate los datos como si
111.-
tuvieran varianzas heterogéneas si la varianza mayor es más del doble que la menor.
En cierta medida, también puede contravenirse la suposición de que la distribución es
normal en la población de puntuaciones. Por desgracia, a menudo no sabemos cuál es la
distribución de la población porque tenemos sólo las puntuaciones de la muestra. Reco-
•
miendo producir una gráfica de las frecuencias y, si la distribución difiere marcadamente
•
de la normal en cualquiera de las condiciones, los datos pueden transformarse otra vez
para tomarlos más normales.
Conforme al razonamiento de Zimmerman y Zumbo (J 993), si tiene tanto heterogenei-
dad de varianza como distribuciones no normales convierta los datos en rangos y analice
éstos mediante la fórmula de Welch.
Diseños intrasujetos
Esfericidad (o circularidad)
El ANOVA intrasujetos comprende otra suposición que los datos deben satisfacer: la esfe-
ricidad. Si buscáramos para cada participante la diferencia entre su puntuación en dos de
los niveles de una VI (por ejemplo, la sentencia dada cuando está solo y cuando se encuen-
tra en grupo), tendríamos un conjunto diferente de puntuaciones; cuyas varianzas podría-
mos calcular. Si hallamos la diferencia de las puntuaciones en cada par de niveles de la VI
y calculamos la varianza de cada conjunto de diferencia de puntuaciones estaríamos en po-
¡¡:;._ sición de comprobar si la esfericidad se hallaba presente en los datos. Estaría presente si
11:... las varianzas de las puntuaciones diferentes fueron homogéneas.
244lL_______________I_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a ____________________
Cuando la esfericidad no está presente, hay por lo menos dos maneras de sortear el pro-
blema. Una consiste en utilizar otro tipo de ANOVA, el ANOVA multivariado o MANOVA.
Esta técnica se describe brevemente en el capítulo 21, pero su método de cálculo está más
allá del objetivo del libro. Otro método se deriva del hallazgo de que, incluso cuando la es-
fericidad no está presente, la razón F calculada de un ANO VA intrasujetos todavía es ade-
cuada para la distribución F.
Sin embargo, es necesario ajustar los grados de libertad para permitir la falta de esfe-
ricidad. Programas de computadora como SPSS y SuperANOVA reportan dos de tales ajus-
tes, de modo que vale la pena que conozca algo de ellos; ambos usan el símbolo E (la letra
griega épsilon). La primera es la épsilon de Greenhouse-Geisser (G-G); la segunda, la de
Huynh-Feldt (H-F). La primera es conservadora; en otras palabras, resulta más probable
que evite un error tipo 1 pero que aumente la posibilidad de un error tipo Il. La .segunda es
más liberal.
Al trabajar de nuevo el ANOVA intrasujetos, la computadora reportó que la épsilon G-
G era 0.913 y la H-F 1.134. Si la épsilon H-F es mayor que 1, se trata como si fuera 1, ca-
so en el que los gl originales permanecen inalterados. Para encontrar los nuevos gl utilice
las ecuaciones siguientes:
-
246lL--------------~I~nv~e~s~ti~ga~c~ió~n_c~u~a~nt~it_a~ti_va~e~n~p~si~co~l~og~í~a____________________
112 - 30.467
109.367
= 0.279
En tal caso, 0.279 x 100 = 27.9% de la varianza general en puntuaciones puede explicarse
como si se debiera a las diferencias entre las estrategias nemotécnicas.
Mientras, en el ejemplo de la sentencia
145.267
112 = -----
984.967
= 0.147
Cohen ( 1988) utiliza una medición diferente del tamaño del efecto que puede derivarse de
11 2. Sin embargo, por razones de consistencia he convertido las recomendaciones en valores
de 112 . De acuerdo con ello, establezco que una 112 de 0.01 es un tamaño del efecto peque-
ño, una 11 2 de 0.059 es uno medio y una 11 2 de 0.138 es uno grande. Por tanto, ambos estu-
dios produjeron tamaños del efecto grandes.
•
...
An_á_h_
_______________ ·sl_
·s~p_re_l_im_i_na_r_d_e_d_i_se_ñ_o_s_co_n__
un_a_V_I_d_e_m_a_'s_d_e_d_o_s_n_iv_e_le_s____~~
posible el proceso he seguido a otros autores y proporciono sólo tablas de poder para
ANOVA entre sujetos, donde los valores pueden especificarse de manera más precisa. Tales
tablas resultan utilizables para dar directrices aproximadas de tamaño de muestra y poder
en diseños intrasujetos.
La relación entre t y F
Si analizáramos un diseño experimental con una variable independiente que tiene sólo dos
niveles, podríamos utilizar desde luego una prueba t. Sin embargo, también podemos apli-
\ car un ANOVA a los mismos datos. En realidad, en tales condiciones, y sólo en éstas, nos
dará la misma respuesta en cuanto a la probabilidad. Mas ello es cie.rto sólo cuando em-
pleamos una prueba de dos colas para la prueba t, pues ANOVA prueba únicamente hipó-
tesis no direccionales. En esas condiciones, el valor de la razón Fes el cuadrado del valor
de t. En términos matemáticos:
F t2
Es decir:
t = -JF
Por tanto, si F = 4 con 1 y 15 gl, entonces t = 2 con 15 grados de libertad. Para confirmarlo,
busque los valores críticos de F y ten las tablas respectivas. Verá que cuando a= 0.05, el
valor crítico de F con 1 y 15 gl es F = 4.54. El valor critico equivalente para la prueba de
tde dos colas con 15 gl es 2. 131 o ~4.54.
Tabla 16. 6. La media de las calificaciones dadas al ensayo y el supuesto género del
autor.
Género del autor
Mediana de calificaciones 3 4 4
con tres niveles, el uso de la distribución de chi cuadrada puede ser en verdad liberal, de-
bajo de un tamaño de muestra de 10. Para una VI con niveles de 3 o 4, en la tabla Al4.9
del apéndice XIV se dan probabilidades más exactas para x2F basadas en tamaños de mues-
tra pequeños.
Poder y prueba de Friedman. La eficacia del poder de la prueba de Friedman depende del
número de niveles de la VI: cuanto más pequeño sea el número de niveles, tanto peor será
la eficiencia del poder. En el apéndice VII se dan directrices sobre cómo ajustar el tamaño
de muestra necesario para el ANOVA paramétrico intrasujetos a fin de obtener el poder de
un tamaño específico de prueba de Friedman. Por ejemplo, cuando la VI tiene sólo tres ni-
veles, el tamaño de muestra para la prueba de Friedman tendría que ser casi una vez y me-
dia superior al del ANOVA paramétrico.
Datos nominales
Diseños entre sujetos: prueba de contingencia de :x!
Cuando una tabla de contingencia tiene más de dos niveles en una VI, el análisis es bás i-
camente igual para uno que para dos niveles. Por tanto, la prueba apropiada es la de con-
tingencia de x2 (conocida a veces como prueba de independencia), descrita en el capítulo
15. Por ejemplo, si la VI fuera del tipo fumador (con fumador, ex fumador y no fumador)
y el género fuera la VD, tendríamos una tabla de contingencia de 3 por 2. En realidad, los
términos VI y VD no son adecuados para la prueba de x2, pues ninguna se ha manipulado;
la prueba busca indagar si la pauta de una variable es diferente para distintos niveles de otra
variable (por ejemplo, ¿difiere la relación entre hombres y mujeres en cada categoría?).
_ _ _ __ _ _A
_ n_á_h_·s¡_·s_,_p_re_l_im_i_na_r_d_e_d_i_ un_a_V_I_d_e_m_a_·s_d_e_d_o_s_n_iv_e_le_s_ ___,j251
se_ñ_o_s_co_n_
Recuerde que las frecuencias deben ser independientes (cada persona aparecerá sólo
en una categoría) y que no más de 20% de las frecuencias esperadas han de ser menores
de 5; véase en el capítulo 15 una explicación más completa. Si demasiadas frecuencias
esperadas se encuentran debajo de 5 es posible combinar categorías para variables que tienen
más de dos niveles. Por tanto, si las categorías de ex fumadores tenían frecuencias espera-
das demasiado pequeñas, podría formarse una nueva categoría que combinara ex fumadores
y no fumadores. Esto tendría sentido sólo si los investigadores estuvieran particularmente
interesados en comparar a quienes fuman ahora con quienes no lo hacen. Si les interesara
comparar a quienes han fumado en algún momento con quienes nunca lo han hecho tendría
más sentido combinar a ex fumadores con fumadores.
Resumen
Cuando hay más de dos niveles de una variable independiente no se considera apropiado
usar una serie de pruebas de la diferencia entre pares de tales condiciones. En cambio, co-
mo etapa preliminar, se aconseja ver si hay una diferencia general entre las condiciones. El
análisis puede realizarse con la forma apropiada del de varianza (ANOVA), o su equivalen-
te para datos nominales (fig. 16.5). Sin embargo, recuer~e que si no está presente la homo-
geneidad de la varianza pero se cumplen los otros requisitos de un ANO VA paramétrico en-
tre sujetos, habrá de usar la prueba F de Welch.
Nominal
Figura 16. 5. Pruebas estadísticas para diseños con una variable independiente con más
de dos niveles.
Si hay una diferencia general entre las condiciones, puede buscarse su fuente precisa utili-
zando técnicas referidas en el capítulo 18.
En el capítulo siguiente se verá el análisis de diseños con más de una variable indepen-
diente.
17
Análisis de diseños con más
de una variable independiente
Introducción
En muchos experimentos de psicología no sólo nos interesan los efectos de una sola varia-
ble independiente (VI), sino también los de dos o más. La razón principal para esperar eso
consiste en que podemos plantear hipótesis acerca de que dichas variables tienen efectos con-
juntos (es decir, que éstas interactúan entre sí). En el presente capítulo se ofrecen ejemplos
completos donde intervienen dos VI y luego se describe cómo esto puede extenderse a si-
tuaciones que incluyen más de dos de tales variables.
También se analiza cómo evaluar el tamaño del efecto y aplicar un análisis de poder en
tales diseños. En el apéndice VIII se presentan ejemplos desarrollados de cada una de las
etapas.
--------------------------------------------------------~253
~~----------------ln_v_e_st_ig~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
100 ~---------------0
90
-D- Invertida
-<>- Correcta
80
70+------------------+----------------~
Conocido Poco conocido
Reconocimiento
También habría interacción si las caras conocidas se reconocieran con más lentitud que las
no conocidas cuando se presentan de cabeza.
130
o 120
e-o
·-
·O e
~
110
~~
á'l"'
.._V
-D- Invertida
Q¡"'O 100
-o.,. -<>-Correcta
&.E
e·v; 90
cu·cu
i=~
.S 80
70
Conocido Poco conocido
Reconocimiento
Es importante notar que si la tendencia a que los rostros familiares se reconozcan más rá-
pidamente fuera cierta en el mismo grado, sin importar la orientación, no habría interac-
ción, aun cuando las orientadas de manera correcta se reconocieran con mayor rapidez que
las invertidas. Si las líneas que representan los dos niveles de una de las VI son casi para-
lelas, resultará improbable que haya una interacción entre éstas.
:.~----------------------~------------------
_________________A_na_'L_is_is_d_e__
di_se_ñ_o_s_c_o_n_m_a_'s_d_e_u_n_a_v_a_r_ia_b_le_l_·n_d_ep~e_n_d_ie_n_t_e______~¡-255
130
<::
•O <::
:g 120
"8 ~ 110
~
....
VI
Q) -{]- Invertida
Q)
""O
-o
VI
100
-o- Correcta
8.~
E 90
Fg
·¡¡¡
Q.¡ ' Cl.>
80
Pruebas paramétricas
Dos variables independientes entre sujetos
La versión más simple del ANO VA, con dos VI, para cálculo e interpretación es donde am-
bas VI son entre sujetos.
Para el primer ejemplo ampliaré el caso entre sujetos del capítulo anterior. Esta vez
imagine que los investigadores no sólo desean conocer el efecto de la estrategia nemotéc-
nica sobre el recuerdo, sino que quieren también explorar el de la naturaleza de la lista de
palabras por recordar. Como antes, una variable independiente es la estrategia nemotécni-
ca, con grupos que no reciben capa itación (el grupo control), que se les capacita con el
uso de palabras gancho o con el método de ubicación. Se introduce una segunda VI, la na-
turaleza de la lista, con dos nivele : una lista de palabras vinculadas conceptualmente (ar-
tículos que se encuentran en la cocina) y palabras que no lo están. Tal diseño significa que
tenemos seis condiciones (tabla 1 .1 ).
Tabla 17. 1. Condiciones relacionadas con un diseño para la prueba de una estrategia de
memorización y el tipo de lista de palabras.
El diseño del experimento es totalmente entre sujetos, esto es, cada participante se halla sólo
en una condición. Por tanto, hay seis grupos. Un diseño del todo entre sujetos se denomi-
na en ocasiones factorial.
256l~ _______________l_nv_e_s_ti~ga_c_io_'n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
Pueden analizarse los datos de tal tipo de diseño con una versión del análisis de varian-
za (ANOVA). En este caso, es un ANOVA de dos vías porque hay dos variables indepen-
dientes: naturaleza de la lista y estrategia nemotécnica.
Un ANOVA de dos vías probará tres hipótesis; el uso de números ayuda a distinguir
las hipótesis.
H 1: Las medias para los niveles de la primera VI son diferentes.
Con la hipótesis nula
H 01 : Las medias para los niveles de la primera VI no son diferentes.
H 2 : Las medias para los niveles de la segunda VI son diferentes.
Con la hipótesis nula
H 02: Las medias para los niveles de la segunda VI no son diferentes
H 3: Las pautas de las medias para una VI difieren entre los niveles de la otra VI.
Con la hipótesis nula
H03 : La pauta de medias para una VI no difiere entre los niveles de la otra VI.
La tercera hipótesis trata con la interacción entre las VI.
Los investigadores llevan a cabo el experimento con cinco participantes en cada con-
dición. Calculan las medias (tabla 17.2) y las grafican (fig. 17.4).
Tabla 17.2. Media de recuerdo para participantes que muestra efectos del tipo de lista
y la estrategia nemotécnica.
Estrategia nemotécnica
Lista Control Palabras gancho Método de ubicación Totales
Si observamos las medias de columna de la tabla 17.2, veremos las de cada estrategia ne-
motécnica, sin importar cuál lista se presente. Ello sugiere que hay una diferencia entre las
estrategias y que el mejor recuerdo lo muestran quienes usan el método de ubicación (9.7
palabras), seguidos por quienes emplean palabras gancho (9.5) y por Jos que no utilizan es-
trategia, el grupo control (8. 7).
________________A_n_á_lis_is_d_e__
di_se_ñ_o_s_c_on__
m_á_s_d_e_u_na__ in_d~ep~e_n_d_ie_n_
va_n_·a_b_le__ te______~¡257
"'m 12
"....
m
"o 10
:rl....
"'m.... 8
.o
m
¡¡¡ ---+--- Vinculadas
c. 6
Q)
----- Desvinculadas
"e
Q) 4
E
•::J
e:
Q) 2
"'6
10
Q) o
::E Control Palabras gancho Método
de ubicación
Estrategia nemotécnica
De observar la fila de medias de la tabla 17 .2, se verán las medias de los dos tipos de lis-
ta, sin importar la estrategia nemotécnica utilizada. Ello sugiere que quienes ven la lista de
palabras vinculadas recuerdan más (10.73 palabras) que quienes observan la desvinculada
(7.87).
Por último, la media de cada uno de los seis grupos (llamada a veces celda de medias)
de la tabla 17.2 y su posición relativa en la figura 17.4 sugieren que hay una pauta diferen-
te entre ambas listas para las esrrategias nemotécnicas. Al parecer, quienes se encuentran
en el grupo control tienen un recuerdo particularmente malo en comparación con quienes
aplican las otras dos estrategias nemotécnicas cuando la lista comprende palabras desvincu-
ladas. Sin embargo, con la otra lista el grupo control no era peor que el con·espondiente a
quienes utilizaban las otras dos estrategias para recordar. Tal diferencia de las dos pautas
sugiere que hay una interacción entre las variables independientes; el desempeño relativo de
los participantes en las tres condiciones nemotécnicas depende del tipo de lista utilizada.
Dentro de grupos
Entre grupos
(error)
Tratamiento 1 Interacción
entre
tratamientos
De regreso al ejemplo, como es usual, queremos saber si las impresiones que las estadísti-
cas de resumen dan se sustentan por las estadísticas inferenciales. Por tanto, aplicaremos
un ANOVA de dos vías entre sujetos, cuyos resultados se proporcionan en la tabla 17.3. A
veces, cuando se describe el ANO VA de varias vías (es decir, con más de una VI), el núme-
ro de niveles de cada VI se incluye en la descripción. De acuerdo con eUo, el análisis actual
es un ANOVA de dos vías de 2 x 3.
Tabla 17.3. Tabla de resumen para un ANOVA de 2 x 3, dos vías, entre sujetos.
Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
•
26QlL_______________I_nv_e_st_ig~a_c_ió_n_c_u_a_nt_it_a_ti_va__en~p_si_co_lo~g~ía_____________________
Como sucede con el ANOVA de una vía, si una hipótesis nula es con·ecta, la razón F para
ella es la razón entre dos estimados de la misma varianza. Es decir, la varianza en una so-
la población de puntuaciones inafectada por las manipulaciones experimentales. Por tanto, la
razón F será casi l. Sin embargo, si la hipótesis nula resulta incorrecta, el estimado de va-
rianza entre grupos apropiado contendrá una cantidad adicional de varianza debido al efec-
to del tratamiento o tratamientos dados. En este caso, la razón F será mayor que l .
Note que la razón F para el tipo de lista está muy arriba de 1, mientras que las razones
F para la estrategia nemotécnica y la interacción se hallan cerca de esa cifra. Como es común,
aún debemos identificar las posibilidades de que cada uno de tales resultados haya ocurri-
do por azar.
La sexta columna muestra la probabilidad de cada razón F A partir de ello podemos
ver que, en general, las listas produjeron recuerdos significativamente distintos; que, en ge-
neral, los tipos de nemotécnica no produjeron un recuerdo significativamente diferente; y
que las listas y las estrategias nemotécnicas interactuaron para producir una diferencia sig-
nificativa.
Técnica de enseñanza
Género Seminario Curso
Hombre 10 10
Mujer 20 20
Con esos datos proporcionales resulta legítimo aplicar el análisis de medias ponderadas.
Una segunda razón posible para un diseño desequilibrado estriba en que los participan-
tes no estuvieran disponibles para tratamientos en particular, pero no hubiera una razón sis-
temática para su falta de disponibilidad; es decir, no hay conexión entre el tratamiento a
que se les asignó y la falta de datos provenientes de ellos. En tales circunstancias. resulta
legítimo el método de las medias no ponderadas o de análisis de mínimos cuadrados.
Una tercera razón posible para un diseño desequilibrado sería que hubiera un vínculo
sistemático entre el grupo de tratamiento y la falla al obtener datos de los participantes; ello
se vuelve más probable en un cuasiexperimento. Por ejemplo, si la investigación se rela-
ciona con delincuentes asignados a diferentes gmpos con base en la gravedad de sus delitos.
Si el diseño carecía de más de un tipo de delincuente, aunque el desequilibrio no fuera un
reflejo de la población, entonces, en este caso de autoselección de los participantes, ningu-
na de las tres opciones resolvería el problema.
Por las dificultades con los diseños desequilibrados, a menos que trate con muestras
proporcionales, algunas personas recomiendan la eliminación aleatoria de puntos de datos
de los tratamientos que tienen más que otros. Como alternativa, pueden reemplazarse da-
tos faltantes con la media del gmpo, o incluso con la media general. Si coloca la media del
262l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a____________________
grupo puede mejorar artificialmente cualquier diferencia entre condiciones; si utiliza la me-
dia general para sustituir datos faltantes podría oscurecer cualquier diferencia genuina entre
grupos. Si se emplea cualquiera de dichos métodos, los gl totales (y, como consecuencia,
el de error) deben reducirse en uno por cada punto de datos estimado.
Preferiría eliminar datos, pero lo recomiendo sólo si tiene un tamaño de muestra razo-
nable por el efecto que la eliminación de datos tendrá en el poder estadístico de la prueba.
Igual que ocurre con el diseño entre sujetos, el ANOVA probará tres hipótesis: dos efectos
principales y una interacción.
Los investigadores recolectan los datos de cinco participantes y producen una tabla (ta-
bla 17 .6) y grafican los resultados (fig. 17 .6).
rtl 22
"(j
<::
...,
(])
<:: 20
(])
V>
--+--
(])
"~
o (])
V>
18 Novato
O."'
E <lJ - D- Experimentado
(]) E
·--
..., 16
O)
"rtl
14
:0
(])
~ 12
Solo Computadora Cara a cara
Contexto
Al parecer, un acusado novato recibiría una sentencia más corta que uno experimentado,
pero ambos obtendrían una pena más fuerte si el juez conoce las recomendaciones de otros.
Que las líneas para ambos tipos de procesados resulten casi paralelas sugiere que no hay
interacción entre el tipo de acusado y el contexto en que se planteó la sentencia.
Segmentación de la varianza
en un ANOVA de dos vias fntrasujetos
En diseños con dos variables independientes intrasujetos, como en el diseño de una vía in-
trasujetos, hay dos fuentes principales de varianza: entre e intrasujetos.
La varianza intrasujetos puede dividirse adicionalmente en varianza debida a la
Cada una de las interacciones que incluye sujetos representa un término de error que habrá
de usarse en el cálculo de la razón F
~L________________In_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
Tratamiento 1
por
tratamiento 2
Tratamiento 1
por sujetos
(error 1) Tratamiento 1
Tratamiento 2 por tratamiento 2
por por sujetos
sujetos (error 2) (error 3)
MCacusado
F (acusado)
MCacusado por sujeto
MCcontexto
F (contexto)
MCcontexto por sujeto
Como es habitual, en cada caso la hipótesis nula supone que la variación obedece sólo a di-
ferencias aleatorias intrasujetos, en tanto que, si la liipótesis nula resulta incorrecta, la MC
de tratamiento tendrá variaciones debidas a éste.
266l~ _______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_c_ol_o~gí_a____________________
La sexta columna indica la probabilidad de que cada efecto de tratamiento haya sido un
evento al azar. A partir de ello podemos apreciar que hubo un efecto principal significativo
del tipo de acusado (F(l,4 ) = 93 .612, p = 0.0006, MCacusado = 104.533) y un efecto signifi-
cativo de contexto (F(2 ,8) = 46.099,p = 0.0001, MCcontexto = 38.8), pero no una interacción
significativa entre tipo de acusado y contexto (F(2,8) = 1.455, p = 0.2892, MCinteracción =
1.733).
Esfericidad
El término esfericidad se presentó en el capítulo anterior y se refiere a la necesidad de que
los diseños intrasujetos tengan homogeneidad de varianza entre las puntuaciones de dife-
rencias. Las columnas con los rótulos G-G (de Greenhouse-Geisser) y H-F (de Huynh-
Feldt) de la tabla 17.7 muestran dónde para compensar la posible falta de esfericidad se han
hecho ajustes a los grados de libertad y a los efectos que los ajustes tienen en la probabili-
dad de una razón F dada. Como las probabilidades mostradas para los ajustes concuerdan
con las probabilidades sin ajustar, no hay un problema de esfericidad.
Los resultados del experimento podrían analizarse más si se comparan las medias para
identificar la fuente del efecto principal significativo del contexto. Recuerde que un resul-
tado significativo en unANOVAno especifica las contribuciones precisas a esa significación
si hay más de dos niveles en la variable independiente. En el caso del tipo de acusado, co-
mo participan sólo dos medias, sabemos que la diferencia significativa obedece a las sen-
tencias más elevadas que se aplican a los delincuentes habituales. En el capítulo siguiente
se indicará cómo llevar a cabo el análisis adicional necesario.
mayor entre las evaluaciones. Por tanto, están prediciendo un efecto del estimado del IQ de
los padres y una interacción entre género e IQ de los padres; y recolectan los estimados
de cinco hombres y cinco mujeres. Los resultados se muestran en seguida:
Tabla 17.8. La media de los estimados hechos por hombres y mujeres respecto
al IQ de los padres.
Padres
Padre Madre Totales
Hombre 115 103 109.0
Mujer 109 108 108.5
Totales 112.0 105.5
116
114
Vl
....
Q)
'O
.gc.
Vl "' 112
---
E-2
--+---
"'Vl
102
Hombre Mujer
Género del estimador
Figura 17.8. Media de estimados de IQ hechos por hombres y mujeres respecto aliQ
de los padres.
Los resultados sugieren que los hombres estiman que el IQ de su padre es mucho más ele-
vado que el de la madre, pero las mujeres consideran que el IQ de su padre sólo es ligera-
mente superior que el de la madre. Por tanto, existe en apariencia un efecto principal del
IQ del padre, aunque no concuerda del todo con la hipótesis, mientras que hay una interac-
ción entre género e IQ de los padres que sí concuerda.
Varianza
total
1\
Entre grupos
Sujetos Tratamiento 1 Tratamiento 2
Tratamiento 2 por
dentro por sujetos
(tratamiento 1)
de grupos tratamiento 2
dentro
(error 1) de grupos
(error 2)
La etapa siguiente consiste en aplicar un ANOVA de dos vías mixto sobre los datos para
indagar si los efectos son estadísticamente significativos (tabla 17.9).
A_na_'l_is_is_d_e_d_i_se_ñ_o_s_c_o_n_m_á_s_d_e_u_n_a_v_a_n_
_________________ ·a_b_le_i_n_de~p_e_n_d_ie_n_te______~¡-269
F(padre)
MCpadre pOr sujetos dentro de grupOs
fijo. Ello limita las conclusiones extraídas de los resultados; no podemos generalizar con
seguridad los efectos de los niveles usados a los posibles efectos de otros niveles. Si ha se-
leccionado de modo aleatorio los niveles y desea generalizar, recomiendo que lea las expli-
caciones dadas en Myers y Well (1991), Howell (1997) o Winer, Brown y Michels (1991).
Poder y ANOVA
Las tablas de poder usadas para un ANO VA de una vía (apéndice XV) sirven para estimar
el poder y el tamaño de la muestra requerido para un ANOVA de varias vías. Sin embargo, el
poder de cada razón F puede estimarse por separado. Si trata de encontrar el tamaño de
muestra necesario para alcanzar un nivel determinado de poder, incluirá el mayor tamaño
de muestra que sugiere su análisis de poder.
Pruebas no paramétricas
Por lo general, no están disponibles en computadora las pruebas estándar para un ANOVA
de varias vías con datos que no se adecuan a las suposiciones del ANO VA paramétrico. Sin
embargo, Meddis (1984) describe el ANOVA de dos vías para datos al menos ordinales y
para datos nominales. Además, Neave y Worthington (1988) detallan pruebas que pueden
evaluar las interacciones entre esas dos variables. También resulta factible utilizar técnicas
más avanzadas (modelación logarítmica lineal y regresión logística) sobre tales datos, las cua-
les se estudiarán de manera breve en el capítulo 21, pero su uso pleno escapa del objetivo
del presente libro.
Resum en
El ANOVA de varias vías (para diseños con más de una VI) permite que se evalúe la in-
teracción entre las variables independientes, además de los efectos principales de cada una
de ellas. Más allá del ANOVA de dos vías, la interpretación empieza a complicarse y se di-
ficulta la graficación de los resultados.
Se ha presentado el análisis preliminar para ANO VA de una y de dos vías. En el capí-
tulo siguiente se explican los tipos de análisis que pueden efectuarse para dar seguimiento
a los hallazgos de un ANOVA a fin de probar hipótesis más específicas que los investiga-
dores suelen plantear.
18
Análisis subsiguiente después
del ANOVA o de x2
Introducción
En los dos capítulos anteriores se estudió la primera etapa del análisis cuando el diseño
respectivo tiene una sola variable independiente (VI) con más de dos niveles o más de una
VI. Como se indicó, el análisis preliminar plantea la pregunta ¿parecen diferir las medias
de los niveles de una o más VI? Si es así, tal vez no resulte tan obvia la fuente de la dife-
rencia. Por tanto, para identificarla se realiza análisis adicional. Sin embargo, pese al título
del capítulo, los métodos descritos en él pueden utilizarse sin haber evaluado que las razo-
nes F de un ANOVA eran estadísticamente significativas.
En el capítulo se describen tres tipos de análisis subsecuente: contrastes, pruebas de
tendencia y efectos simples.
Contrastes
Pruebas paramétricas
Los contrastes son comparaciones entre medias en el caso de pruebas paramétricas. Para
analizarlas, regresaré al experimento de recuerdo de palabras descrito en el capítulo 16, que
supone un grupo que usa palabras gancho, uno que utiliza el método de ubicación y uno con-
trol. Se encontró una media de recuerdo significativamente distinta para las tres condicio-
nes. Los tipos de contraste realizables resultan casi infinitos. La distinción principal es entre
contrastes por pares, donde usted compara dos medias a la vez. y otros tipos de contraste,
digamos una comparación de la condición control con la media de las otras dos condiciones.
272
·s~s~ub~s~ig~u~ie~n~t~e~d~e~sp~u~é~s~d~e~l~A~N~O~VA~o~d~e~x~2__________~¡:273
____________________A~n~á~li~Sl~
La familia de contrastes
Un grupo de contrastes suele describirse como una familia de ellos. Las pruebas de contras-
tes ajustan el nivel de probabilidad de modo que ésta se relacione con dicha familia (la
razón de error por familia, EF) y no con el contraste individual (razón de error por con-
traste, EC). Por tanto, la probabilidad de la familia de contrastes se establece en a= 0.05.
Cómo se realicen los ajustes depende de la naturaleza y el tamaño de tal familia. Como regla
Wll
básica, trate la familia como los contrastes relevantes para una sola razón F del ANOVA
llf
original. Por ello, en un ANO VA de dos vías habrá tres familias de contrastes: una para cada
uno de los efectos principales y una para la interacción.
La prueba que realiza un ajuste demasiado amplio y, en consecuencia, disminuye en
gran medida la posibilidad de cometer un error tipo I se describe como conservadora. Re-
cuerde que una prueba conservadora aumenta la posibilidad de cometer un error tipo II. Es
111.
importante que elija la prueba de contraste correcta y, por ello, el ajuste correcto a fin de
evitar la reducción innecesaria del poder de la prueba.
son las más separadas es como si hubiera realizado las tres comparaciones posibles. Por
tanto, la familia de contrastes será en este caso de tres y el ajuste del nivel de a se hará tam-
bién conservador. Sin embargo, si antes de mirar los datos he planeado efectuar un contras-
te entre las medias de los grupos control y el método de ubicación, la familia de contrastes
contendrá sólo uno y no habrá ajustes del nivel de a.
Otra distinción entre contrastes planeados y no planeados estriba en que si son planea-
dos, resulta del todo legítimo conducirlos, aunque no baya sido estadísticamente signifi-
cativa la razón F original del ANO VA. Los contrastes no planeados deben llevarse a cabo
sólo cuando la razón F sea estadísticamente significativa, pues son exploratorios en vez de
probar una hipótesis específica.
Antes de presentar las pruebas de contraste específicas trataré un último concepto: la
ortogonalidad.
Ortogonalidad
Recordará que el ANOVA toma la variación general de las puntuaciones de un estudio y
trata de identificar sus fuentes; en otras palabras, segmenta la varianza de las puntuaciones.
Los contrastes segmentan de manera similar la varianza. La cantidad de varianza identifi-
cable como debida al tratamiento puede dividirse en fuentes específicas de varianza, cada una
basada en un contraste diferente.
Si va a dividir la varianza general en partes, de modo que cada una evalúe una porción
de la varianza, el contraste se describirá como ortogonal. En la figura 18.1 se encuentra una
representación esquemática de la varianza explicada por un tratamiento determinado, por
ejemplo, la estrategia nemotécnica: el rectángulo representa la varianza general para el tra-
tamiento y cada círculo la varianza explicada por un contraste. Los dos contrastes son or-
togonales porque explican partes diferentes de la variación general de las puntuaciones.
Cuando la varianza explicada por un contraste incluye parte de la varianza explicada por
otro, los contrastes son no ortogonales. En seguida se muestra el caso donde dos contras-
tes son no ortogonales porque tratan de explicar parte de la misma varianza:
Varianza explicada
por los contrastes
1y 2
Varianza explicada
por contraste entre Varianza explicada
control y palabras por el contraste 2
gancho (contraste 1)
Una consecuencia de limitar sus contrastes ortogonales radica en que el número de contras-
tes aplicables debe ser igual a la cantidad de grados de libertad existentes en el tratamien-
to. Por tanto, en el caso del experimento de recuerdo, como el tratamiento (condición de
memoria) tiene dos gl, pueden conducirse sólo dos contrastes para que siga siendo ortogonal.
Sin una descripción matemática suficiente resulta dificil comprender cómo se com-
P':leba que un conjunto de contrastes es ortogonal. La comprobación se presenta en el
apéndice IX. Sin embargo, aunque los expertos en estadística consideraban importante que
los contrastes se mantuvieran ortogonales, ya no es así y todas las pruebas de contrastes
mencionados en el capítulo pueden llevarse a cabo legítimamente con contrastes no orto-
gonales. Por tanto, debe poder comprenderse el resto del capítulo sin consultar dicho apéndi-
ce. No obstante, resulta preciso conocer la noción de ortogonalidad, pues algunas pruebas
de contrastes son más conservadoras cuando éstos son no ortogonales.
El contraste más simple y usado con mayor frecuenc ia es el contraste por pares, donde
se comparan dos medias. Por consiguiente, la descripción del presente capítulo habrá de
restringirse a los contrastes por pares. La manera de efectuar contrastes más complejos se
detalla en el apéndice IX.
Los tres contrastes por pares descritos en el capitulo se basan en un valor de t que lue-
go se compara con un valor crítico de t para ver si es estadísticamente significativo. El mé-
todo de cálculo de t cambia si los datos provienen de un diseño entre o intrasujetos.
276l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~ía_____________________
Contraste de datos de diseños entre sujetos. Para los diseños entre sujetos, utilice la ecua~
ción siguiente:
media 1 - medí~
Ec. 18.1
media 1 - medí~
f Ec. 18.2
donde n es el tamaño de la muestra ~el grupo que produce una de las medias.
Varianzas heterogéneas
Si los grupos para el ANOVA no tienen varianzas similares no son apropiadas las ecuacio-
nes anteriores. Conforme la regla básica expuesta en el capítulo 16, si la varianza más gran-
de no es más del triple de la varianza más pequeña·tendremos suficiente homogeneidad de
varianza para utilizar las ecuaciones anteriores siempre que los tamaíios de la muestra sean
iguales. Si tenemos falta de homogeneidad, se aconseja para contrastes por pares utilizar la
prueba t para varianzas separadas (prueba t de Welch) que se explica en el capítulo 15 y en
el apéndice VI. Con tamaños de muestra desiguales, la varianza más grande no debe ser
mayor del doble de la más pequeña para que se considere homogénea.
Contrastes en datos de diseños intrasujetos. Si el diseño es intrasujetos y los datos care-
cen de esfericidad (en el capítulo 16 se explica el término), una vez más ninguna de las
ecuaciones anteriores resultará correcta. Para estar seguro, en el caso de contrastes por pares,
debe calcularse por tanto la t de cada contraste mediante la ecuación estándar para un diseño
intrasujetos con dos niveles, dada en el apéndice VI y referida en el capítulo 15. Myers y
Wcll ( 1991) señalan que en su mayoría, si no todos, los programas de computadora utilizan
esa versión de t para contrastes en diseños intrasujetos. La opción no se halla disponible
NO_V_A__o_d_e~x~2__________~¡-277
____________________A_n_á_li~si~s~s~ub~s~ig~u_ie_n_t_e_d_e~sp_u_é_s_d_e_l_A_
para una de las pruebas, la de Scheffé; ésta no se recomienda para contrastes por pares por-
que se considera demasiado conservadora para tales contrastes.
Tabla 18.2. Tabla de resumen para el ANOVA de una vía entre sujetos en los datos
de recuerdo.
Suma de Media de
Fuente gl cuadrados cuadrados Prueba F p
Entre grupos 2 30.467 15.233 5.213 0.0122
lntragrupos 27 78.9 2.922
Total 29 109.367
Por tanto, si deseamos comparar la condición del método de ubicación con la condición
control tendríamos las cifras siguientes:
media 1 9.6
media2 7.2
n 10
MCerror = 2.922
glerror = 27
y podemos usar la ecuación 18.2 porque el diseño es entre sujetos y los grupos tienen el
mismo tamaño de muestra.
ltl
27Bl~ _______________l_nv_e_st_ig~a_c_ió_n_c_u_a_nt_lt_a_ti_va__en~p-sic_o_lo~g~ía_____________________
9.6-7.2
t(27) = -;:::===
~(~)x2.922
\ 10
= 3.139
t de Bonferroni
La t de Bonferr0ni (conocida a veces como prueba de comparación múltiple de Dunn) con-
sidera el número real de co;:-.trastes que se realizarán. Es más apropiada cuando ha planea-
do sus comparaciones y se mantienen al mínimo. Se toma conservadora sí los contrastes
no son ortogonales. El ajuste que realiza se basa en una ecuación que, cuando la ex. original
se establece en 0.05 o en una cifra menor, se simplifica aproximadamente a la división de
ex. entre el número de contrastes por conducir. El nivel de ex. del ajuste es para cada contras-
te. Sin embargo, resulta más común expresar el nivel de ex. de la familia. En el apéndice XIV
se presentan los niveles de ex. para la familia de contrastes.
Elija el número de contrastes por efectuar. Busque el valor de t crítico en las tablas de
correcciones de Bonferroni para contrastes en el apéndice XIV para ese número de contras-
tes, utilizando el gl de la MCerror apropiado para el tratamiento que investiga; en el caso de
un diseño entre sujetos con homogeneidad de varianza, el gl apropiado para una prueba t
con \ arianzas independientes cuando hay heterogeneidad de varianza, o el gl para la prue-
ba t estándar intrasujetos en el caso de un diseño intrasujetos. Para que el contraste sea esta-
dísticamente significativo, la t calculada para el contraste será igual o mayor que la t crítica.
A continuación se presenta una parte de la tab.Ia AXIV 1O del apéndice XIV:
Tabla 18.3. Extracto de las tablas de Bonferroni para una razón de error por familia
de o: = 0.05 .
Número de contrastes
gl de error 2 3 4 5 6 7 8 9 10 12 15
25 2.385 2.566 2.692 2.787 2.865 2.930 2.986 3.035 3.078 3.153 3.244
26 2.379 2.559 2.684 2.779 2.856 2.920 2.975 3.024 3.067 3.141 3.231
27 2.373 2.552 2.676 2.771 2.847 2.911 2.966 3.014 3.057 3.130 3.219
28 2.368 2.546 2.669 2.763 2.839 2.902 2.957 3.004 3.047 3.120 3.208
29 2.364 2.541 2.663 2.756 2.832 2.894 2.949 2.996 3.038 3.110 3.198
30 2.360 2.536 2.657 2.750 2.825 2.887 2.941 2.988 3.030 3.102 3.139
---
___________________An~á~li~si~s~su~b~s~ig~u~
ie~n~te~d~e~s~p~
ue~·s_d~e_I_A_N~ o~d~e~x~2 __________~¡279
OV._A~
t de Dunnett
La t de Dunnett (conocida a veces también como d) suele usarse cuando una media espe-
cífica (digamos, la de un grupo control) se contrasta con otras, una por una. Es menos con-
servadora que la t de Bonferroni porque no supone que los contrastes sean ortogonales.
En primer lugar, busque el valor crítico de t, con el gl de error (o el de la prueba t de
Welch para diseños entre sujetos con varianzas heterogéneas o el de la prueba t intrasuje-
tos en diseños intrasujetos), en la tabla para la t de Dunnett del apéndice XIV, y compare
la t calculada para el contraste con el valor crítico. Si la t calculada es igual o mayor que el
valor crítico, resultará estadísticamente significativa.
En seguida se presenta un extracto de la tabla AXIV.ll del apéndice XIV.
Tabla 18.4. Extracto de las tablas t de Dunnett para una razón de error por familia
de a= 0.05.
gt de error 3 4 5 6 7 8 9 10 11 12 13 16 21
24 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 2.94 2.97 3.00 3.07 3.16
30 2.32 2.47 2.58 2.66 2.72 2.77 2.82 2.86 2.89 2.92 2.95 3.02 3.11
Si se supone que se conducen dos contrastes, cada uno con 27 grados de libertad, tenemos
un valor crítico entre 2.32 y 2.35, pues la tabla 18.4 no da valores para gl = 27. Ello con-
cuerda con la pauta de resultados sugeridos por la t de Bonferroni: el contraste entre las
condiciones de ubicación y control fue estadísticamente significativo, mas no entre las con-
diciones de palabras gancho y control.
28Ql~_______________l_nv_e_s_
ti~ga_c_ió_n_c_u_a_nt_it~a~ti_v~a~e_n~p_si~co_l_
og~í_a____________________
t de Scheffé
La t de Scheffé es muy conservadora y permite realizar cualquier tipo de contraste post hoc.
Resulta suficientemente conservadora para considerar irrelevante su aplicación si la razón
F original no era estadísticamente significativa. Hay una cantidad confusa de formas de
calcular y expresar la prueba de Scheffé; en ciertas ocasiones como un valor t y en otras
como una razón F Sin embargo, todas dan la misma protección contra la comisión de un
error tipo J. Aquí he dado una versión. En el apéndice IX se ofrecen otras tres porque los
programas de'computadora las producen.
Tratado como una prueba t, podemos tomar el valor calculado de t y comprobarlo me-
diante tablas F estándar (véase el apéndice XN; sí, me refiero a las tablas F). Utilice la
ecuación siguiente para encontrar el valor crítico de t:
En otras palabras, tome el valor crítico de F que dan las tablas F para el gl de tratamiento
y el de error (es decir, los grados de libertad originales para la razón F que intentamos ex-
plicar) y multiplíquelo por los grados de libertad del tratamiento. La raíz cuadrada del re-
sultado es el valor crítico con el que se evaluará el valor calculado de t.
En seguida se muestra la parte relevante de las tablas F del apéndice XIV:
27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.08
28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.06
t crítica = ~
,Y2
Compare después el valor de t calculado para el contraste con la t crítica. Una comparación
será significativa sólo cuando el valor para la t calculada sea igual o mayor que la t crítica.
La siguiente tabla es parte de la estadística de rango estudentizado (q) de la tabla
AXIV.l2, del apéndice XIV:
.. . 3.49 3.53
t cntlca esta entre r:: y -r
'1/2 ' '2
= entre 2.468 y 2.496
En este caso, sólo el contraste entre el método de ubicación y las condiciones control re-
sulta estadísticamente significativo en p < 0.05.
Tukey-Kramer
La prueba Tukey-Kramer es para contrastes por pares entre sujetos cuando los tamaños de
muestra para los dos grupos no son iguales. Utiliza una variante de la ecuación 18.1 para
contrastes:
media1 - media 2
t Ec. 18.3
donde n 1 y n 2 son los tamaños de las dos submuestras que intervienen en el contraste.
La t crítica se encuentra exactamente de la misma manera que en el método DHS de Tukey.
----------~A~na~·l~is~is~s~u~bs~ig~u~ie~n~te~d~es~p~u~és~de~l~A~N~O~V~A~o~d~e~x~2_ _ _ _ _~¡2i3
Pruebas no paramétricas
Por lo menos datos ordinales
Una fo nna de contrastar dos niveles de una variable independiente a la vez, siguiendo un
ANO VA de una vía de Kruskal-Wallis o un ANOVA de dos vías de Friedman, sería efectuar
'
284lL_______________I_nv_e~s~ti~ga~c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l~og~í~a____________________
la prueba apropiada a cada contraste para una VI con dos niveles. Por tanto, una prueba U
de Mann-Whitney se utilizará para contrastes en diseños entre sujetos, y una de rango con
signo de Wilcoxon para pares equiparados para contrastes en diseños intrasujetos. Empe-
ro, se necesitaría ajustar el nivel de a, utilizando un ajuste de Bonferroni al dividir el nivel
de a entre el número de contrastes que se hace. Por tanto, para cuatro contrastes la rela-
ción de error por contraste (EC) se vuelve:
EC = 0.05
4
= 0.0125
También hay pruebas específicas de contraste para estos datos si todos los niveles de la VI
tienen cinco o más participantes y la prueba estadística original es estadísticamente signi-
ficativa. Hay dos tipos de tales pruebas: uno se usa cuando se contrasta cualquier par de ni-
veles de la Vl y el otro es análogo a la t de Dunnett porque se emplea para contrastar una
condición control con otro nivel de la VI. Incluyo la primera técnica en el apéndice IX.
Quienes deseen aprender la segunda pueden consultar a Siegel y Castellan ( 1988).
Datos de categorías
Cuando se analiza una tabla de contingencia que representa más que una tabla de 2 x 2, hay
varias maneras de que el resultado sea estadísticamente significativo; por ejemplo, si los
investigadores buscan la proporción de hombres y mujeres fumadores, no fumadores y ex
fumadores. Puede aplicarse análisis adicional si se secciona la tabla de contingencia en va-
rias subtablas de 2 x 2. Por tanto, los investigadores podrían centrarse en fumadores en
comparación con no fumadores y en otras comparaciones más específicas que las propor-
cionadas por el análisis original.
El análisis es más especializado y se proporciona por tanto en el apéndice IX, en lugar
de incluirlo aquí.
Pruebas de tendencia
Las pruebas de tendencia constituyen una extensión de los contrastes entre medias y usan
un procedimiento muy similar. Están diseñadas para probar si un grupo de medias forma una
sola pauta o una tendencia. Su uso más apropiado es cuando los niveles de la variable inde-
pendiente que se prueban son cantidades más que categorías. Por ejemplo, los investigado-
res plantean la hipótesis de que los tiempos de reacción serán más lentos como resultado de
la cantidad de alcohol consumido. Predicen que el erecto del alcohol incrementará el tiem-
po de reacción en una cantidad regular; es decir, que hay una tendencia lineal de que el
tiempo de reacción aumente con el alcohol consumido.
------------------~A~n~á~li=sl=·s~s=ub~s~ig~u~ie~n~t=e~d~e~sp~u~é=s~d~e~l~A~N=O~VA~o~d~e~x~2__________~¡:285
En el ejemplo, se coloca a 24 pruticipantes en tres grupos de igual tamaño. A cada uno
de éstos se da una cantidad diferente de alcohol: una, dos o tres unidades. A cada parti-
cipante se asigna luego una tarea en que debe detectar la presencia de un objeto en una pan-
talla de computadora.
Pueden probarse varias tendencias posibles, pero el número depende del número de
medias consideradas y es igual que el gl del tratamiento que se analiza. Por tanto, en el caso
de tres medias hay dos tipos de tendencias posibles: lineal y cuadrática. En seguida se
muestran las pautas que constituirán tendencias lineales y cuadráticas:
10
...,
~
e 8
~
:0
e
~
a.
~
"O 6
~
:0
"' 4
~
2
Uno Dos Tres
Niveles de la variable independiente
10
3 8
e
~
:0
e
~
a. 6
~
"O
~
.CJ
-~ 4
~
2
Uno Dos Tres
Niveles de la variable independiente
..
~L________________In_v_e_st_i~ga_c_io_'n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~í____________________
a __
e
Q¡
'5 8
e
Q¡
a.
Q¡
-e 6
Q¡
:0
"'
·e 4
~
2
Uno Dos Tres Cuatro
Niveles de la variable independiente
Figura 18.5. Tendencia cúbica.
190
180
e
:2
o~
t{ ~ 170
~ ~
QJ QJ
-o-o 160
8.~
E·¡:;
150
~~
140
130
Uno Dos Tres
Unidades de alcohol
Tabla 18.10. Tabla de resumen del ANOVA entre sujetos sobre los efectos del alcohol en
los tiempos de reacción.
Que las medias no formen una linea perfectamente recta sugiere que la tendencia podría ser
de un tipo no lineal.
Para un análisis de tendencia con tres medias y tamaños de muestra iguales debe crear
una suma de cuadrados (SC) para la tendencia que prueba, de acuerdo con la ecuación si-
guiente:
setendencia =
n X ( (coefl XX¡) + (coef2X x2)+ (coef3x x3)
coef; + coef; + coer;
r
donde n es el número de participantes en cada grupo
coef1, coef2 y coef3 son los coeficientes designados para probar una tendencia
particular
x x
i ¡. 2 y 3 son las medias de los tres grupos
En el apéndice IX se presenta la ecuación general para las pruebas de tendencia de la que
ésta se ha derivado. Una tabla de los coeficientes obra en el apéndice XVI. En seguida se
muestran los coeficientes para tendencias que incluyen tres medias:
Tabla 18. 11. Coeficientes para análisis de tendencias con tres medias.
...
288l~_______________l_n_ve_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
2
8 X (C-1 X 151.25) +(O X 163.38) + (1 X 168.75))
c-v + co) + (1)
2 2
2450
2
1 225
Cada prueba de tendencia siempre tiene 1 grado de libertad. Por tanto, MCtendencia también
es 1 225.
La razón F para MCtendencia se encuentra dividiendo MCtendencia entre MCerror' que en
este caso es 159.185 (de la tabla 18.10). Por tanto,
F(l,ZI) = 7.695
Podemos utilizar las pruebas F estándar para evaluar la significación estadística de tal re-
sultado. La F crítica para la prueba de tendencia es 4.32, en cuyo caso hay una tendencia
lineal s ignificativa en el estudio entre la cantidad de alcohol consumido y los tiempos de
reacción.
Los coeficientes para las pruebas de tendencia se han elegido de modo que las pruebas
de tendencia segmenten la suma de cuadrados del tratamiento en fuentes de variación sepa-
radas; son ortogonales. En otras palabras, si agrega la suma de cuadrados de todas las prue-
bas de tendencia permisibles el resultado será el mismo que el de la suma de cuadrados de
tratamiento.
Podemos saber por tanto si vale la pena buscar otras tendencias. Como la suma de cua-
drados general para el consumo de alcohol fue 1 285.75 (tabla 18.1 O) y la suma de cuadra-
dos para la tendencia lineal 1 225, la suma de cuadrados para cualquier tendencia restante
(en este caso cuadrática) es
1285.75 - 1225 = 60.75
Como el gl para cualquier tendencia es 1, la MC para una tendencia cuadrática también se-
rá 60.75 y así la razón F para esta tendencia sería:
60.75 = 0.382
159.185
que no es estadísticamente significativo. De acuerdo con ello, concluiremos que hay sólo
una tendencia lineal significativa.
Efectos simples
Cuando hay una interacción entre dos variables independientes vale la pena trata¡; de explo-
rar más la naturaleza de aquélla. Regresemos al ejemplo del capítulo 17, donde se mostró a
VA__o_d_e~x~2 __________~¡2i9
An_á_h_.sl_·s_s_ub_s~ig~u_ie_n_te__de_s~p_ue_·s_d_e_l_A_N_O_
____________________
los participantes una lista de palabras y se les pidió que recordaran el mayor número de
ellas. Las dos VI eran tipo de lista (con palabras vinculadas o desvinculadas) y estrategia
nemotécnica (método de ubicación, palabras gancho o condición control). Un método de
análisis de la interacción entre ambas VI consiste en separar los efectos del tratamiento de una
de esas variables para cada uno de los niveles de la otra. En el ejemplo, ello significaría
buscar los efectos de la estrategia nemotécnica en el recuerdo de palabras vinculadas y en el
recuerdo de palabras desvinculadas. También podría significar la búsqueda del efecto del
tipo de lista en el recuerdo de quienes usan el método de ubicación, palabras gancho y en
el grupo control. Cada uno de estos análisis se describe como un efecto simple.
Algunos libros aconsejan buscar efectos simples sólo cuando hay una interacción sig-
nificativa. No estoy de acuerdo porque en ocasiones se encuentra información útil cuando
la interacción no es significativa, como el descubrimiento de la pauta de un efecto princi-
pal significativo que se reproduce sólo en ciertos niveles de la segunda VI. Sin embargo, si
la interacción está lejos de ser estadísticamente significativa no vale la pena buscar Jos
efectos simples. El método utilizado para encontrar los efectos simples varía si la variable
que se considera es intrasujetos o entre sujetos. Seré más específico y diré que debe utili-
zar una técnica cuando el diseño es totalmente entre sujetos y otra cuando es del todo in-
trasujetos o combinado (es decir, tiene algunas VI intrasujctos).
Tabla 18. 12. Tabla de resumen del ANOVA correspondiente a un ANOVA de 3 x 2, dos
vías, entre sujetos.
Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
Lista 1 61.633 61.633 37.354 0.0001
Nemotécnica 2 5.600 2.800 1.697 0.2045
Lista por nemotécnica 2 11.467 5.733 3.475 0.0473
Residuo 24 1
39.600 1.650
Eso nos indica que hubo una interacción significativa entre tipo de lista y estrategia nemo-
técnica.
Si la varianza más grande no es mayor que el doble de la más pequeña, podemos continuar
el procedimiento. En este caso, 2.3 es menos del doble de 1.3. Observe que en esta situa-
ción las varianzas deben estar más cerca de lo que tenían que estar para realizar el ANOVA
inicial. Consulte en Myers y Well (1991) un análisis acerca de los problemas de heteroge-
neidad de varianza cuando se realizan efectos simples.
Para analizar éstos, formaremos una razón F para cada efecto simple. Cuando el dise-
ño es completamente entre sujetos y hay homogeneidad de varianza, dicha razón para cada
nivel de una de las VI se forma a partir de la ecuación siguiente:
F = MCnivel de VI
Por tanto, en el caso del ejemplo anterior, si buscamos el efecto simple de la estrategia nemo-
técnica en palabras desvinculadas, buscaríamos la MC para palabras desvinculadas y la divi-
diríamos entre la MC de error de la interacción original (es decir, MCresiduo). Los grados de
libertad apropiados para la razón F, como siempre, serían los de la MC para el nivel, en el ca-
so de palabras desvinculadas (2), y los del término de error de interacción original (24).
Para simplificar el proceso, puede encontrar la MC para cada nivel si ejecuta un ANOVA
de una vía únicamente en los datos del nivel que le interesa. En este caso, sólo incluiría los
datos de los participantes a quienes se hubieran mostrado palabras desvinculadas. La tabla
de resumen siguiente corresponde a un ANO VA de una vía entre sujetos que compara el re-
cuerdo para las tres estrategias nemotécnicas en las listas desvinculadas:
Tabla 18. 14. ANOVA de una vía entre sujetos en estrategia de nemotécnica para listas
desvinculadas.
Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
Nemotécnica 2 16.533 8.267 4.679 0.0315
Residuo 12 21.200 1.767
--
------------------~A~na~'l=is=is~s=u~bs~ig~u~ie~n=te~d~es~p=u~és~d~e~l~A~N=O~VA~o~d~e~x~2----------~~
A partir del análisis podemos ver que la MCdesvinculado es 8.267 con gl = 2. El término de
error para el efecto simple es el mismo que el usado por el ANOVA de dos vías: 1.650 con
gl = 24 (tabla 18.12).
Por tanto, el efecto simple para palabras desvinculadas es:
8.267
F (2, 24) 1.650
5.010
La consulta de las tablas F indica que la razón F crítica para p = 0.05 con gl de 2 y 24
es 3.4. En este caso, podemos señalar que, para palabras desvinculadas, el recuerdo di-
fiere significativamente entre las tres estrategias nemotécnicas (F(2 ,24) = 5.010, p < 0.05,
MCdesvinculado = 8.267).
El análisis podría repetirse para palabras vinculadas:
Tabla 18.15. ANOVA de una vía entre sujetos en estrategia de nemotécnica para listas
vinculadas.
Suma de Media de
Fuente gl cuadrados cuadrados Valor de F Valor de P
Nemotécnica 2 0.533 1
0.267 0.174 0.8425
Residuo 12 18.400 1 1.533
Aquí,
F = MCvinculado
vinculado MC
error
0.267
1.650
= 0.162
Como tal valor de Fes menor que 1, resulta claro que no es estadísticamente significativo.
Ahora tenemos una imagen más nítida de lo que produjo la interacción significativa en el
ANOVA de dos vías. La estrategia nemotécnica afecta el recuerdo cuando las listas están
vinculadas, pero no cuando no lo están.
Sería posible ahora realizar comparaciones sobre las medias de las condiciones des-
vinculadas para identificar incluso de manera más específica la fuente del efecto signifi-
cativo.
292lL_______________I~n_ve~s~ti~ga~c~io~·n_c~u~a~n~ti~ta~t¡~·v~a~e~n~p~si~co~l~o~gí~a____________________
Segmentación de las sumas de cuadrados en efectos simples
En el análisis de efectos simples usted toma la suma de cuadrados para la interacción y el
tratamiento del ANOVA original de dos vías y divide eso en partes separadas para cada
efecto simple. Al buscar en el ANO VA original de dos vías, la suma de cuadrados para la
interacción es 11.467 y para nemotécnica 5.600. Tras agregar todas, se obtiene una suma
de cuadrados de 17.067. Tenga en cuenta que la suma de cuadrados para las palabras des-
vinculadas es 16.533 y para las vinculadas 0.533. La suma de todo esto da 17.066 (que
difiere de 17.067 sólo porque se han redondeado las cifras).
Tabla 18. 16. Tabla de resumen para el ANOVA de dos vías intrasujetos para los efectos
del tipo de acusado y el contexto en que se decide la duración de la
sentencia sugerida.
'ü
e
"'
....e
(!) 22
Q.>
"O
"'
(!)
20
e Vi' ~Novato
•O
(!)
18
'u -D- Experimentado
VI
(!)
.."'::::>. . .S 16
"O
Q.>
"O 14
"'Q.>
'5
:E 12
Solo Computadora Cara a cara
Contexto
A continuación se muestran los efectos simples que comparan los tipos de acusados para
cada uno de los tres contextos:
Tabla 18.17. ANO VA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden solos).
Sujeto 4 2A 0.6
Tabla 18. 18. ANOVA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden
mientras ven en la pantalla de una computadora las decisiones de otros
jueces).
Tabla 18.19. ANOVA de una vía intrasujetos de los efectos del tipo de acusado en la
duración de la sentencia sugerida (para participantes que deciden en
presencia de otros jueces).
Suma de Media de Valor Valor
Fuente gl cuadrados cuadrados de F de P G-G H·F
Sujeto 4 1.4 0.35
Experiencia 1 48.4 48.40 29.333 0.0056 0.0056 0.0056
Experiencia por sujeto 4 6.6 1.65
A partir de esos efectos simples podemos ver que, cual sea el contexto, al acusado expe-
rimentado se dictará una sentencia significativamente más fuerte que a un novato. Como
hubo sólo dos niveles en cada efecto simple, pudimos aplicar el análisis con pruebas t in-
trasujetos.
Diseños combinados
El ejemplo del capítulo 17 respecto a este diseño fue de hombres y mujeres que daban las
evaluaciones del IQ de su madre y de su padre. Cuando busque los efectos simples de la
variable intrasujetos (padre), debe realizar un ANOVA de una vía entre sujetos sobre la va-
riable entre sujetos para cada nivel de la variable intrasujetos. Por tanto, llevará a cabo un
ANOVA de una vía entre sujetos en cada nivel de padre. Cuando busque los efectos sim-
ples de la variable entre sujetos (género), practicará un ANOVA de una vía intrasujetos en
cada uno de los niveles de la variable entre sujetos. Por tanto, conduciría un ANOVA de
una vía entre sujetos en cada nivel de género. Tales recomendaciones tienen por objeto
simplificar el análisis. Quienes deseen saber más acerca de ello leerán en la explicación
de Howell ( 1997) una manera más completa de buscar efectos simples en las circunstan-
cias referidas.
La predicción original de los investigadores fue que hombres y mujeres evaluarían de
modo diferente a sus padres. La gráfica de las medias sugirió que había una interacción en-
tre el género y el IQ del padre (fig. 18.8).
Sin embargo, la razón F para la interacción no alcanzó significación estadística.
Tabla 18.20. Tabla de resumen de un ANOVA de dos vías combinado.
Suma de Media de Valor Valor
Fuente gl cuadrados cuadrados de F de P G-G H-F
Género 1 1.250 1.250 0.007 0.9376
Sujeto (grupo) 8 1530.000 191.250
Padre 1 211.250 211.250 5.633 0.0450 0.0450 0.0450
Padre por género 1 151.250 151.250 4.033 0.0795 0.0795 0.0795
Padre por sujeto (grupo) 8 300.000 37.500
------------------~A~n~á~l~~·s~is~s~u~bs~ig~u~i~en~t~e~d~e~sp~u~é~s~d~e~l~A~N~O~VA~o~d~e~x~2----------~~
116
"'....q¡
"O 114
"'c.
q¡
"O 112
r;!
q¡
"O 110 -+---Padre
"'
o
"O
---Madre
"'
E 108
·¡:¡
"'
Q¡
Q¡ 106
"O
"'
'6
Q¡ 104
~
102
Hombre Mujer
Género de quien estima
Figura 18.8. Media de evaluación deliQ de los padres por hombres y mujeres.
El efecto simple de las evaluaciones de IQ realizadas por mujeres produjo el resultado si-
guiente:
Tabla 18. 21. ANOVA de una vía intrasujetos de los juicios de mujeres sobre el IQ de sus
padres.
Tabla 18. 22. ANO VA de una vía intrasujetos de los juicios de hombres sobre el IQ de sus
padres.
Los investigadores se ven forzados a concluir que los efectos simples par.a hombres y mu-
jeres no muestran diferencia significativa en sus evaluaciones del IQ de sus madres y pa-
dres. No obstante, parece que hay un posible efecto que vale la pena investigar más.
Mi consejo estribaría en repetir la investigación con un tamaño de muestra mayor para
dar más poder a la prueba. Tenga en cuenta que al analizar los efectos simples habremos
basado cada ANOVA en cinco evaluadores. El tamaño del efecto (11 2) del padre evaluado
por hombres es 0.196, un tamaño del efecto grande de acuerdo con los criterios de Cohen.
Sin embargo, con el tamaño de muestra pequeño la prueba sólo tendría un poder de alrede-
dor de 0.29. Para alcanzar un poder de 0.8, con este tamaño del efecto, necesitamos alre-
dedor de 16 evaluadores hombres. El tamaño del efecto para evaluadores mujeres es de
0.007, pequeño.
O.~S = 0.0167
Resumen
Después de aplicar un ANOVA, a menudo los investigadores desean explorar aún más los
datos. Los contrastes permiten comparar medias para investigar hipótesis más específicas
de las que se prueban con unANOVA. Los contrastes pueden planearse antes de que se rea-
lice el ANOVA, o no planearse y conducirse una vez que se hayan examinado las medias.
Puede aplicarse una variante sobre contrastes (análisis de tendencia) cuando los niveles de
una variable independiente son cuantitativos más que cualitativos. El análisis de tendencia
permite que las pautas entre las medias se exploren para ver si hay una tendencia entre los
------------------~A~n~á~h~·s~is~s=u=bs~ig~u~i=en~t=e~d~e=sp~u=é=s~d~e~l~A~N=O~VA~o~d~e~x~2__________~¡:297
niveles de la VI. Como en el caso de los contrastes no planeados, es apropiado llevar a cabo
un análisis de tendencia sólo si la razón F original resulta estadísticamente significativa.
El análisis de efectos simples permite ahondar más en el examen de la interacción en-
tre dos VI. Aísla un nivel de una VI a la vez para detectar cómo varían los niveles de la otra.
Los efectos simples pueden resultar estadísticamente significativos, aunque no lo sea la
razón F de la interacción original.
El análisis introducido en el presente capítulo y en el anterior intentan responder si la
media de la variable dependiente difiere entre niveles de una VI. En los dos capítulos si-
guientes se explicarán técnicas para analizar relaciones entre dos o más variables.
19
Análisis de relaciones 1: correlación
Introducción
Los investigadores se interesan a menudo en la relación entre dos o más variables. Por ejem-
plo, quizá quieren saber cómo se relaciona la variable IQ con la correspondiente a ingresos.
En el capítulo se explican las medidas, incluida la conelación, utilizadas para cuanti-
ficar la relación entre las variables y cómo interpretar esas medidas. Se analizan las formas
básicas de correlación para las distintas formas de datos. Luego se amplían tales técnicas y
el uso de la correlación para indagar la confiabilidad y la validez de medidas.
Correlación
Dos variables están correlacionadas si hay cierta fonna de predecir la relación cmtre ellas.
Si las personas de IQ bajo tuvieran ingresos bajos, las de IQ medio ingresos medios y las de
IQ alto ingresos altos, entonces, si conociéramos el IQ de un individuo podríamos prede-
cir, con cierto grado de exactitud, su ingreso. Éste constituiría un ejemplo de correlación
positiva; cuando una variable crece, la otra también. Por otro lado, si se investiga la rela-
ción entre el tamaño de la familia y el ingreso, encontraríamos que los individuos de fami-
lias grandes tienen ingresos bajos, los de familias medianas ingresos medios y los de familias
pequeñas ingresos altos. Se podría predecir entonces con cierto grado de exactitud el ingreso
de alguien a partir del tamaño de su familia. Sin embargo, el ejemplo sería el de una corre-
lación negativa (o inversa); cuando una variable aumenta, la otra disminuye.
Una medida de la relación entre dos variables es la covarianza entre ellas.
298
• _________________________
A_n_ál_is_is_d_e
__re_l_ac_i_on_e_s_l_:_co_r_re_l_a_ci_ó_n______________~¡-299
Covarianza
Imagine que en el ejemplo del IQ y el ingreso se encontró la información siguiente para
una muestra de cinco personas:
Participante IQ Ingreso
1 85 12 000
2 90 11 000
3 95 15 000
4 100 16 000
5 110 20 000
Media 96 14 800
DE 9.618 3 563.706
La covarianza, como su nombre sugiere, es una medida de cómo varían juntas dos varia-
bles. Para encontrarla se calcula cuánto se desvía la puntuación de cada persona en una va-
riable de la media para la variable y el resultado se multiplica por cuánto se desvía de su
media su puntuación en la otra variable.
Así, para la primera persona esto sería:
(85- 96) X (12 000- 14 800) = 30 800
Repítalo para cada persona y sume los resultados; ello es igual a 131 000. Para tener cuen-
ta del tamaño de la muestra, divida entre el número de personas que proporcionaron las me-
didas menos uno. En este caso, la covarianza es
13 1000 = 32750
5-1
En consecuencia, necesitamos una medida que tenga en cuenta las varianzas, la cual se
conoce como coeficiente de correlación.
Coeficientes de correlación
El coeficiente de correlación (r), conocido como coeficiente de correlación producto mo-
mento de Pearson, puede hallarse mediante la ecuación siguiente:
Covarianza entre dos variables
r = ------~--~~-----
XDE1 DE2
donde DE1 y DE2 son las desviaciones estándar de las variables.
En ese caso, para el ejemplo del IQ y el ingreso:
32 750
r = 9.618x3563.706
= 0.9555
El efecto de dividir entre las desviaciones estándar es limitar, matemáticamente, el dominio
de r de manera que las mayores correlaciones positiva y negativa que pueden lograrse son
+1 y - 1, en ese orden. Si r está cerca de O significa que no hay relación entre las variables.
-1 o 0.5
La forma exacta de la distribución depende del tamaño de la muestra o, para ser precisos,
de los grados de libertad de r, que son dos menos el tamaño de la muestra porque r se basa
en las medias de las dos variables. Cuanto mayor sea la muestra, tanto más próxima estará
la distribución de contar con una distribución normal. En el apéndice XIV se dan las proba-
bilidades para r (cuando la hipótesis nula es p = O) y lo siguiente es un extracto de esa tabla
(cómo encontrar la probabilidad de r, cuando la hipótesis nula no es p = O, se explica des-
pués en este capítulo):
Tabla 19.2. Extracto de las tablas de probabilidad para r (cuando la hipótesis nula
es p = 0).
Probabilidades para la prueba de una cola
0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005 1
gl = n- 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
0.3090 0.5878 0.8090 0.9511 0.9877 0.9969 0.9995 0.9999 1.0000 1.0000
2 0.2000 0.4000 0.6000 0.8000 0.9000 0.9500 0.9800 0.9900 0.9980 0.9990
3 0.1577 0.3197 0.4919 0.6870 0.8054 0.8783 0.9343 0.9587 0.9859 0.9911
4 0.1341 0.2735 0.4257 0.6084 0.7293 0.8114 0.8822 0.9172 0.9633 0.9741
Observe que en esa tabla se dan las probabilidades para las pruebas de una y de dos colas.
La hipótesis nula es que no hay relación lineal entre las dos variables en la población. La
habría si se creara un diagrama de dispersión entre ambas variables y los puntos del dia-
grama formaran 1,1na línea recta.
Como había cinco participantes, gl =: 3. En ese caso, la probabilidad de una cola es
p = 0.0056. Respecto al resultado se informaría: había una correlación positiva significa-
tiva entre IQ e ingreso (r = 0.9555, gl = 3, p = 0.0056, prueba de una cola).
3Q2lL--------------~I~nv~e~s~ti~ga~c~ió~n~c~u~a~nt~it~a~ti_va~e~n~p~si~co~l~og~í~a____________________
La predicción de una correlación negativa entre las variables también sería una hipó-
tesis direccional. Un ejemplo sería si la hipótesis de investigación fuera
HA: hay una correlación negativa entre el tamaño de la familia y el ingreso.
Con la hipótesis nula
H 0 : no hay relación entre el tamaño de la familia y el ingreso.
Para encontrar la probabilidad de una correlación negativa obvie el signo negativo y lea
la tabla como si el resultado hubiera sido una correlación positiva; una correlación de
r = -0.9555 tiene la misma probabilidad que una correlación de r = 0.9555.
Interpretación de r
Causalidad y correlación
Una trampa por evitar con la correlación, pero en la que se cae a menudo, es suponer que,
como dos variables están correlacionadas, una afecta a la otra o provoca que varíe. Un ejem-
plo muestra los peligros de tal razonamiento. Durante el año se correlacionan el consumo
de helado y el número de ahogamientos. Ello no significa que consumir helado conduzca
al ahogamiento. La relación se produce aquí por el hecho de que cada variable está asocia-
da al tiempo: cuanto más cálido sea el clima, tanto mayores probabilidades habrá de que
las personas consuman helado, vayan a nadar y, por tanto, se pongan en Jiesgo.
Incluso, cuando hay un eslabón causal entre dos variables no sabemos cuál es la cau-
sa y cuál el efecto. Si el estado socioeconómico (ES) y la aparición de enfermedad mental
estuvieran relacionados positivamente, no sabríamos si el ES de las personas afecta la pro-
babilidad de desarrollar una enfermedad mental o si la presencia de ésta modifica su ES.
Como se ha dicho en los capítulos anteriores, la causa y el efecto se identifican mejor
mediante experimentos donde los investigadores manipulan la variable o variables inde-
pendientes y buscan los efectos de las manipulaciones en la o las VD.
co_r_re_ l_a_c i_ó_n______________~~
__________________________A_n_á _lis_i_s _d_e_r_e _la_c_io_n_e_s_l:__
Naturaleza de la correlación
Sin importar cuáles correlaciones se investigan, es trascendental producir un diagrama de
. dispersión de la relación entre las dos variables y considerar aspectos de éstas. Ello se de-
be a que, en ciertas situaciones, puede producirse una correlación importante cuando hay
poca o ninguna relación (una correlación espuria) y, en otras, podría haber una relación que
no se descubre mediante r.
En seguida se muestra la pauta que cabría esperar cuando hay una correlación positi-
va alta entre dos variables:
22 000
20000 o
18 000
o
...
VI
QJ
on 16 000 o
E o
14000
12 000 o
o
10000
80 90 100 110 120
IQ
Figura 19.2. Diagrama de dispersión para una correlación positiva alta (r = O. 9555).
En el diagrama puede trazarse una línea, conocida en ocasiones como línea del mejor ajus-
te, para ilustrar la relación entre las dos variables. Dicha línea es la que pasa por los pun-
tos de datos con la distancia mínima entre ella y los puntos.
22 000
20000 o
18000
oVI
~
on
16 000 o
E o
14000
12 000 o
o
10 000
80 90 100 110 120
IQ
Figura 19.3. Línea del mejor ajuste en un diagrama de dispersión de una correlación
positiva alta (r = O. 9555).
~~----------------ln_v_e_st_ig~a_c_io_·n_c_u_a_n_ti_ta_t_iv_a_e_n_p~s_ic_o_lo~g~ía______________________
Observe que, en el caso de una correlación positiva, la línea va de la esquina inferior iz-
quierda a la superior derecha de la gráfica.
En seguida se muestra el diagrama de dispersión que cabria esperar de una correlación
negativa alta:
7r--------------------------------------,
o o
-1 ~---,----~----~----~----,-----~--~
10000 12000 14000 16000 18000 20000 22000 24000
Ingreso
24000
22000 o
o o
20000 8 o
o
o 18000
VI
....
Q)
""
.E
16000
14000 o
o
12000 o
10000
30 32 34 36 38 40 42
Talla de zapato
Figura 19.5. Diagrama de dispersión para una correlación baja entre dos variables.
------------------------~A~n~ál~is~is~d~e~re~l~ac~i~on~e~s_l_:_co_r_re~l~ac~i~ó~n--------------~~
colas). Observe que si bien la computadora produjo la mejor línea de ajuste, no representa
m en forma satisfactoria los datos.
40000
o
o 30000
..."'
(])
on
E o
o o
20000 8 o
o
o
o
o
10000
30 40 50 60
Talla de zapato
En este caso, la adición de una persona cambió la correlación de una negativa muy baja a
una positiva grande estadísticamente significativa (r = 0.666, gl = 9,p = 0.0252, prueba de
dos colas).
30000
o o
o
20000 8 o
5l o
!!:
Oll
E ~ o
10 000
o o
10 20 30 40 50
Talla de zapato
Figura 19.7. Diagrama de dispersión obtenido cuando ~e combinan las muestras de dos
poblaciones.
J06lL_______________I_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a__________
Otra situación que podría producir una correlación significativa sería si la muestra incluye-
ra un intervalo irrazonablemente grande en una o en ambas dimensiones. Por ejemplo, si
se incluyeran los niños en el estudio del ingreso y la talla de zapato.
En la figura 19.7 la correlación se volvió grande, positiva y significativa (r = 0.912,
gl = 13,p < 0.0001, prueba de dos colas). En el diagrama de dispersión se observa que, en
realidad, se incluyeron las muestras de dos poblaciones, ninguna de las cuales mostraría
por sí misma la correlación.
o o
-1
12 14 16 18 20 22 24 26 28 30 32 34
Ingreso (en miles)
Figura 19.8. Diagrama de dispersión de una relación no lineal.
La correlación se da aquí como r = ~.0243 (gl = 8, p = 0.947, prueba de dos colas). Note
que el diagrama de dispersión forma una curva con forma de U. Abajo de un ingreso de
alrededor de 22 000 dólares hay una relación negativa entre el tamaño de la familia y el in-
greso. Arriba de alrededor de 26 000 hay una relación positiva. Es evidente que hay una
relación, pero no puede representarse con una linea recta. El coeficiente de correlación pro-
ducto momento de Pearson (r) es una medida de las relaciones lineales o de línea recta. El
análisis de las relaciones no lineales queda fuera del objetivo del libro. Esa forma de rela-
ción no lineal se describe como polinómica. En ciertas circunstancias pueden transformar-
se una o ambas variables en una relación no lineal para que la relación se vuelva lineal y
entonces pueda aplicarse a Jos datos lar de Pearson. Ello se estudia en el apéndice V.
Rango demasiado restringido. El rango de puntuaciones de una o ambas variables puede
restringirse al menos de dos maneras. La primera es consecuencia de la naturaleza de la co-
rrelación; ambas variables deben tener cierta variabilidad porque, de otro modo, no·puede
tenerse una correlación.
r ----------------------~A~na~·t~is~is~d~e~r~e~la~c~io~n~es~l:~c~or_r~el~a~ci~ó~n--------------~~
Si en el ejemplo del TQ y el ingreso todos los sujetos de la muestra hubiesen tenido
1 un IQ de 100, la correlación sería r = O, pues no tiene sentido preguntar si el ingreso varía
con el IQ si éste no lo hace. (Recuerde la ecuación para r: como la covarianza de IQ y el
ingreso serán O, r debe ser 0.)
1 Puede ocurrir un segundo problema cuando se ha muestreado sólo parte del rango. Por
1 ejemplo, si se practicara nada más el muestreo de los ingresos de las personas con un IQ
en el rango de 120 a 150, quizá no haya relación entre el ingreso y el IQ, en tanto que en
el de 85 a 115 podría darse muy bien una.
Para reiterar, cuando calcule la correlación entre dos variables construya y considere
siempre un diagrama de dispersión de éstas para ver si la relación es lineal y no la afectan
puntos alejados o gmpos separados de puntuaciones o resultados. Asimismo, considere
siempre el rango muestreado de cada variable para verificar si las restringió artificialmen-
te y ocultó así una posible relación, o bien amplió tanto Jos rangos que se creó u.na relación
artificial.
91.298
El tamaño del efecto es una medida de la cantidad de la varianza de una variable explicable
mediante la varianza de la otra. En el ejemplo, afmnaríase por consiguiente que 91 .298%
de la varianza del ingreso se explica conforme la varianza del IQ. En otras palabras, me-
nos de 9% de la varianza del ingreso no se explica en términos de la varianza del IQ.
Cohen ( 1988) prefiere usar r como medida del tamaño del efecto y aquí seguiremos su
convención en las tablas de exponentes para r. Cohen juzga que r = 0.1 constituye un ta-
maño de efecto pequeño, r = 0.3 uno mediano y r = 0.5 uno grande en la investigación psi-
cológica. Convirtiéndolos al porcentaje de varianza explicado, se tiene que 1% es un TE
pequeño, 9% uno mediano y 25% uno grande.
Poder y correlación
En el apéndice XV se proporcionan las tablas de poder para 1: En la tabla 19.3 se reprodu-
ce parte de éstas.
3o8l Investigación cuantitativa en psicología
Tabla 19.3. Extracto de las tablas de poder parar, cuando a"' 0.05, para una prueba
de una cola (* denota que el poder es mayor de O. 995).
En la tabla se observa el poder que se logra para cierto efecto y tamaño de muestra. Así, si
deseáramos lograr uno de 0.8 en a = 0.05 con una hipótesis direccional, necesitaríamos
entre 600 y 700 participantes para detectar un TE pequeño, entre 60 y 70 participantes para
uno mediano y entre 20 y 25 para uno grande.
~ 20
"'
ctl
'ü
"'
"O 10
e
"'E
'"z o
- 1.0 0.0 1.0 2.0
Recodificación de género
Figura 19.9. Línea del mejor ajuste para la relación entre el género y el número de
cigarrillos fumados (entre fumadores).
La línea del mejor ajuste corta los niveles de las VI en sus medias. Por consiguiente, ínter-
seca a los hombres en 20.5 y a las mujeres en 13.2.
El coeficiente de correlación es r = -0.4478, lo cual muestra una relación media a gran-
de entre el género y el hábito de fumar. Si a las mujeres se hubiera identificado como O y
a los varones como 1, la correlación habría sido positiva.
Para encontrar la probabilidad de la correlación de punto biserial se usa el mismo mé-
todo que para probar la probabi lidad de 1: Si la hipótesis fuera que habría una relación ne-
gativa entre el género y el hábito de fumar (ello significa, dada la clasificación de varones
como O, que éstos fuman más que las mujeres), podría realizarse una prueba de una cola.
Así, con r = - 0.4478, gl = 18, la probabilidad es p = 0.0239, prueba de una cola.
El análisis de la correlación de punto biserial muestra que la distinción entre pruebas
diseñadas para buscar diferencias entre grupos y las que buscan relaciones entre las varia-
bles es un poco artificiaL En el capítulo próximo se retomará el tema.
Correlación biserial
En el ejemplo anterior, el género es auténticamente dicotómico. Sin embargo, a veces la di-
cotomía se ha impuesto a una variable que no lo es en realidad; por ejemplo, si se coloca a
las personas en dos grupos: viejo y joven. En estos casos hay una variante de la correlación
de punto biserial conocida como correlación biserial. Este método se usa rara vez; en par-
te, porque su cálculo y uso conllevan ciertos problemas cuando las distribuciones no son
normales y, por consiguiente, los lectores interesados deben consultar a Howell ( 1997). Co-
mo alternativa, en tal situación sería perm isible usar phi o la phi de Cramer, que se descri-
ben después en este capítulo como "Correlación y datos nominales".
_________________________ re_la_c_io_n_e_s_l_:_co_ r_re_l_ac_i_ó _n ______________~¡:311
A_n_ál_is_is_d_e__
Tabla 19.5. Tiempo durante el que los alumnos han estudiado psicología y su opinión
acerca de si es una ciencia.
- 1 1 1 1 111111
J12l~ _______________l_n_ve~s~ti~ga_c_io_'n_c_u_a_n_ti_ta_tl_·v_a_e_n~p_si_co_l_o~gí_a____________________
La rho de Spearman y la tau de Kendall pueden calcularse convirtiendo las puntuaciones
de una variable en rangos, si bien ese procedimiento no es necesario con la tau de Kendall.
Como de costumbre en tales pruebas, las puntuaciones del mismo valor (empates) reciben
el rango medio. Así, como dos participantes habían estudiado psicología durante un año,
ocupan los primeros dos rangos y se les asigna la media de ellas: 1+ 2 = 1.5. Véase la des-
2
cripción de la prueba de rangos con signo de Wilcoxon para pares igualados en el apéndi-
ce VI para una explicación completa de datos ordenados por rango.
Tabla 19.6. Años durante los cuales se ha estudiado psicología y opinión acerca de si es
una ciencia, más los rangos.
Años de estudiar Evaluación Rango Rango
Participante psicología de la psicología de años de la evaluación
1 1 1 1.5 1.5
2 2 1 3.5 1.5
3 3 2 5.5 3.5
4 4 3 7.5 6
S 5 4 9.5 8
6 1 3 1.5 6
7 2 3 3.5 6
8 3 2 5.5 3.5
9 4 5 7.5 10
10 5 5 9.5 10
11 6 5 11 10
La rho de Spearman
El cálculo de la rho de Spearman produce el mismo resultado que si las puntuaciones de
cada variable se convirtieran a los rangos para esa variable y se calculara la correlación
de producto momento de Pearson. Sin embargo, en una versión de rho se supone que nin-
guna puntuación es la misma en una variable específica y éste es un valor comúnmente
dado por las computadoras. En el apéndice X se da un ejemplo resuelto.
Con la ecuación simplificada, rho = 0.77.
Observaciones empatadas. Cuando no hay empates en los datos ambas versiones de la rho
de Spearman generan el mismo resultado. Sin embargo, cuando dos o más puntuaciones
son las mismas en cierta variable, la ecuación simplificada es incorrecta y hay una versión
de rho que corrige los empates y produce el mismo resultado que se obtendría de aplicar el
procedimiento de la correlación producto momento de Pearson a los rangos. En el presente
..
________________________ l: _c_or_r_el_a_ci_ó_n______________~~
A_na_'l_is_is_d_e_r_e_la_c_io_n_es__
ejemplo hay más de un estudiante en cada uno de los primeros cinco años y más de una
persona dio las valuaciones 1, 2, 3 o S. El valor de rho con los empates corregidos es igual
1 a O. 762. La versión de rho respecto a la cual usted debe informar es la que corrige los
empates.
Probabilidad de la rho de Spearman. Con una muestra de 100 o menos participantes, uti-
lice la tabla de probabilidades del apéndice XIV. Cuando el tamaño de la muestra es supe-
rior a 100, hay una ecuación que convierte rho en un valor t y permite usar las tablas de t
para verificar la probabilidad.
Como alternativa, cuando el tamaño de la muestra es mayor que 100 hay una aproxi-
mación z utilizable para calcular la probabilidad de rho que, si bien menos precisa que la
conversión de rho en t, podría usarse si se tiene acceso a tablas de z más detalladas. En el
apéndice X se presentan las ecuaciones para convertir rho en t y z. La probabilidad de es-
te resultado, como una prueba de una cola, es 0.0025 < p < 0.005. Sobre el resultado debe
informarse: se encontró una correlación positiva estadísticamente significativa entre el
tiempo que los alumnos han estudiado psicología y su opinión acerca de si es una ciencia
(rho = O. 762, 0.0025 < p < 0.005, prueba de una cola. N = 11). Si el tamaño de la mues-
tra fue tan grande para justificar el uso de una prueba t o z para encontrar la probabilidad,
informe respecto al valor de t o z.
La tau de Kendall
La tau de Kendall difiere de la rho de Spearman. Ésta ordena numéricamente las puntuacio-
nes originales (o rangos) para una variable y examina el orden creado para la otra variable.
...
'
J14l Investigación cuantitativa en psicología
~------------------~------------~----~--------------------
Si ambas variables tuvieran una relación positiva perfecta, el orden de las puntuaciones en
la segunda debería ser de la evaluación menor a la mayor y ninguna estaría fuera de lugar.
En el ejemplo anterior, si tomamos la evaluación de la psicología como una ciencia, se ve
que el participante 6 había estudiado psicología sólo durante un año y, sin embargo, le dio
una puntuación de 3, en tanto que los participantes 2, 3 y 8 la habían estudiado durante mu-
cho más tiempo pero le asignaron una evaluación menor. La tau de Kendall tiene que ver
con el cálculo de cuántas puntuaciones están fuera de lugar con relación a cada persona. Si
no hay puntuaciones fuera de lugar, tau = l. Si todos los rangos posibles están fuera de lu-
gar, tau = - 1, que es la misma pauta dada por otros coeficientes de correlación; una corre-
lación positiva perfecta es + l y una inversa perfecta - l.
Si se analizan de nuevo los datos del ejemplo anterior mediante la tau de Kendall, se
obtiene el resultado tau = 0.564.
Observaciones empatadas. Como sucede con la rbo de Spearman, hay un ajuste para los
empates, que da en este caso un valor de tau = 0.639. Véase en el apéndice X un ejemplo
resuelto.
Probabilidad de tau. A semejanza de la rbo de Spearman, existe una aproximación a la
distribución normal para la tau de Kendall. Sin embargo, ésta ofrece la ventaja de que tal
aproximación es exacta para las muestras pequeñas. Así, si el tamaño de la muestra es lO
o menos, se usa la tabla respectiva del apéndice XIV. Para muestras mayores se aplica la
aproximación z mostrada en el apéndice X. La probabilidad en el ejemplo presente puede
calcularse mediante la prueba z, pues la muestra tiene tamaño mayor que 1O. Ello da un
valor de z (ajustado para los empates) de z = 2.738, con una probabilidad de una cola de
p = 0.0031. Para informar acerca del resultado se utiliza el mismo formato que para la rho
de Spearman.
Los niveles de poder de tau y de rho se dan en ténninos de su eficacia de poder respecto a
su equivalente paramétrico, la correlación del producto momento de Pearson. Para lograr
el mismo nivel de poder al usar la rho de Spearman o la tau de Kendall, se encuentran el
tamaño de la muestra necesario para el tamaño del efecto y el poder requeridos para la r de
Pearson y se multiplica el tamaño de la muestra por l. l. Por ej emplo, si buscáramos unta-
maño del efecto medio (r = 0.3) con una prueba de una cola y un nivel alfa de 0.05 y de-
seáramos un poder de 0.8, precisaríamos de 68 pa1ticipantes. Por ello, si usáramos la rho
de Spearman o la tau de Kendall necesitaríamos 68 x 1.1 = 74.8 o 75 participantes para lo-
grar el mismo nivel de poder.
:..
J16l~ _______________ln_v_es_tl~·g_ac_io_'n_c_u_a_nt_it_a_ti_va__en~ps_ic_o_lo~g_ía____________________
Howell (1997) señala que el coeficiente de contingencia está limitado de dos maneras: nun-
ca puede tener el valor 1, debido a cómo se calcula; y el valor máximo que puede tener
está acotado por el número de celdas en la tabla de contingencia, por lo cual sólo puede al-
canzar 0.707 con una tabla de 2 x 2.
(;2
Phi = f f¡
Phi se limita al análisis de tablas de 2 x 2, pero hay otra versión que no: la phi de Cramer.
. ~
Pht de Cramer = ~ ~
0.741
Coeficiente de contingencia =
0.741 + 88
~0.00835
0.091
Phi = ~0.741
88
~0.00842
0.092
(r) realizada sobre los mismos datos y que los valores recomendados para tamaños del efec-
to pequeño, medio y grande para w son los mismos (0.1, 0.3 y 0.5, respectivamente) que
los recomendados para r.
Las cifras de la matriz de correlación son los coeficientes de correlación entre pares de va-
riables. La correlación para cierto par de variables se da en el punto donde la columna
rotulada con el nombre de una variable se encuentra con la fila identificada con el de la
otra. En la primera columna se muestran las correlaciones con las matemáticas y en la se-
gunda las del inglés. Ello refleja que la correlación entre las aptitudes para matemáticas e
inglés es r = 0.888, que con gl = 8 es estadísticamente significativa con p < 0.0005 (prueba
de una cola).
Observe que la diagonal de la esquina superior izquierda a la inferior derecha de lama-
triz contiene la cifra 1 en cada celda, pues se trata de la correlación de cada variable con sí
misma. También note que la parte superior derecha de la matriz está vacía, ya que todas las
celdas en esa parte representarían correlaciones que ya se muestran en la matriz. Algunos
programas de computadora dan toda la matriz, pero el presente formato facilita la lectura.
La matriz indica que hay una correlación grande entre las aptitudes para las matemáti-
cas y el inglés, pero hay también una correlación grande entre cada aptitud y la edad. La
ecuación para calcular el coeficiente de correlación de aptitud en matemáticas e inglés re-
moviendo el efecto de la edad es
~'mi.e = 1 2 2
-v(l - r.") x (1-1;..)
A_na_'l_
________________________ is_
is_d_e_r_e_la_cl_
·o_ne_s_l_:_c_or_~_l_
ac_i_ón______________~~
donde rm i.e es la correlación entre la aptitud para matemáticas y para inglés, removiendo
el efecto de la edad
rmi es la correlación entre la aptitud para matemáticas y para inglés
rme es la correlación entre la aptitud para matemáticas y la edad
·- rie es la correlación entre la aptitud para inglés y la edad
Por consiguiente,
0.888-0.748 X 0.862
r . =
mt.e ~(1 - (0.74W) x (1- (0.862)2 )
= 0.723
Para evaluar la significación estadística de una correlación parcial, lea las tablas estándar
de r, pero con tres grados de libertad menos que el tamaño de la muestra. En las tablas de
r vemos que la correlación entre la aptitud para matemáticas y la aptitud para inglés con el
efecto de la edad removido todavía es estadísticamente significativo (0.01 < p < 0.025,
gl = 7, prueba de una cola).
Una manera de ver las correlaciones original y parcial entre las aptitudes en matemáticas
e inglés es notar que la primera sugiere que la varianza de la capacidad para inglés explica
(0.888? x 100 = 78.85% de la varianza de la aptitud para matemáticas. Sin embargo, a la
varianza de la edad explica (0.748? x 100 = 55.95% de la varianza de matemáticas y
(0.862)2 x 100 = 74.30% de la varianza de la aptitud para inglés. La correlación parcial
elimina la parte de la varianza de la aptitud para inglés que se explica en términos de la va-
rianza de la edad y la parte de la varianza de la aptitud para matemáticas ex¡)licable por
la edad, y considera la cantidad de Yarianza compartida restante; es decir; (0.723)2 x 100 =
52.27%.
Es posible remover los efectos de más de una variable en una relación. Por ejemplo,
podríamos remover el efecto del nivel socioeconómico y la edad. Ello se estudia en el apén-
dice X.
rm(i.e) =
donde rm(i.c) es la correlación semiparcial entre la capacidad para matemáticas y para in-
glés, ya removida la relación entre la capacidad para inglés y la edad
r mi es la correlación entre la capacidad para inglés y matemáticas
r me es la correlación entre la capacidad para matemáticas y la edad
ric es la correlación entre la capacidad para inglés y la edad
En el ejemplo:
0.888-0.748 X 0.862
r m(i.e)
~(1 - (0.862)2 )
0.4798
Expresada como el porcentaje de varianza (0.4798) 2 x 100 = 23.02%, esa correlación se-
miparcial puede interpretarse como muestra de que la capacidad para inglés explica 23.02%
adicional de la varianza de la aptitud para matemáticas, además de la varianza de la apti-
tud para matemáticas explicada por la edad.
donde Taumi.c es la correlación entre matemáticas e inglés con el efecto de la edad ya re-
movido
'tmi es la correlación entre matemáticas e inglés
't¡e es la correlación entre inglés y edad
'tme es la correlación entre matemáticas y edad
------------------------~A~n~ál~is~is~d~e~re~l~ac~i~on~e~s_l~:~co~r~re~l=a~ci=ó~n______________~¡:i21
Así,
0.786-0.593 X 0.723
Taumi.e
~(1 - (0.593i) X (1 - (0.723)2 )
0.357
~0.309
0.6422
Grupos ;ndepend;entes
Los investigadores predijeron que los adultos tendrían una idea más exacta de su habilidad
para recordar (su metamemoria) que los niños. Diseñaron una medida de metamemoria que
dieron a un grupo de 30 adultos y a uno de 30 niños. Asimismo, probaron los recuerdos rea-
les de ambos grupos. Se obtuvieron los resultados siguientes: la correlación para la meta-
memoria de los niños y la memoria real fuer = 0.5; y la correlación para la metamemoria
de los adultos y la memoria real, r = 0.8. Antes de introducir la ecuación para la prueba,
cabe analizar una complicación.
Como estamos probando la diferencia entre dos coeficientes de correlación, no un coe-
ficiente de correlación c~ntra la hipótesis nula de que la correlación es cero, la distribución
no se distribuye normalmente. Fisher creó una manera de transformar r en r', que tiene una
distribución normal y petmite usar una prueba z para comparar las correlaciones. (De mo-
do confuso, esa transformación se describe a veces como Zr de Fisher. Sin embargo, se pre-
fiere r' para evitar confusión con las pruebas z.)
322lL______________~I~nv~e~s~ti~ga=c~io~·n~c=u~a~nt~it=a~tl~·v~a~e~nLp~si~co=l~og~í~a____________________
En el apéndice XVI se proporciona la r' equivalente para distintos valores de r y la
ecuación creada por Fisher para quienes desean una transformación más exacta cuando no
está tabulado el valor de r.
La ecuación para comparar dos coeficientes de correlación independientes es
z =
1 1
---+--
n,- 3 n2 - 3
= 2.02
Al buscar la probabilidad de una cola de ese valor en las tablas de z (apéndice XIV) se en-
cuentra que p = 0.0217. Por consiguiente, los investigadores concluyen que los adultos tie-
nen metamemorias más exactas que los niños.
Grupos no ;ndepend;entes
La ecuación para la diferencia entre los coeficientes de correlación no independientes di-
fiere de la anterior y, por su complejidad, incluí su explicación en el apéndice X.
se correlacionan, r = 0.4, y quieren ver si los segundos tienen una correlación significati-
vamente menor que los primeros.
Esa forma de comparación es similar a la de dos correlaciones independientes y usa la
ecuación siguiente:
r' - p'
z = --
fS
donde r' es la transformación de Fisher del coeficiente de correlación de la muestra
p' es la transformación de Fisher del coeficiente de correlación de la población
n es el tamaño de la muestra (en este caso, el número de pares de gemelos)
Una p de 0.7 se convierte en p' = 0.867 y una r de 0.4 en r' = 0.424. Por consiguiente,
0.424- 0.867
&
z =
= - 1.83
Los investigadores supusieron que los gemelos criados aparte tenían una correlación menor
(por supuesto, antes de reunir los datos) y que así se justificaba el uso de las probabilidades
de una cola en las tablas de z; recuerde obviar el signo negativo al leerlas. La probabilidad de
tal resultado (o de uno más extremo) ocurrido por casualidad se da como p = 0.0336 y, por
tanto, se justificaba que los investigadores rechazaran la hipótesis nula de que las correla-
ciones no diferían y concluyeran que los gemelos monocigóticos criados aparte muestran
menos similitud en la puntuación de extraversión que los otros gemelos.
•
J24l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_va__e_n~p_si_co_l~og~í_a_____________________
Medidas de acuerdo entre más de dos personas
A veces, los investigadores desean conseguir jueces independientes para evaluar los obje-
tos a fin de proporcionar una escala no prejuiciada por sus propios puntos de vista. Por
ejemplo, si los psicólogos quisieran considerar el vínculo entre el atractivo fisico de alguien
y la conducta altruista de otros hacia éste, necesitarían una medida de atractivo fisico . Para
no usar sus juicios, podrían presentar a ciertos jueces los materiales que descaran emplear
en su estudio (por ejemplo, fotografias) y pedirles que los clasificaran según su concepto
de atractivo fisico. Antes de utilizar los criterios como base de su escala, sería importante
conocer cuán bien concuerdan los jueces porque, si hay falta de acuerdo, ello haría pensar
que la medida no era confiable. Mediante el coeficiente de concordancia de Kendall puede
evaluarse el grado de acuerdo entre los jueces.
Tabla 19. 11 . Ordenamiento por rango del atractivo dado por los jueces a cinco
fotografías.
Fotografía
Juez A B e D E
Uno 1 2 3 4 5
Dos 2 1 4 3 5
Tres 3 2 1 5 4
Cuatro 1 3 2 4 5
Ordenamiento por rango total (R) 7 8 10 16 19
Media de R 1.75 2 2.5 4 4.75
Mediante la tabla AXIV.l7 del apéndice XIV se encuentra que ese nivel de W es estadísti-
camente significativo y que p < 0.01. Por tanto, podemos concluir que hay un grado de
acuerdo entre los jueces acerca del atractivo de las personas representadas en las fotogra-
fías. Así que podrían usarse las evaluaciones medias de cada fotografía para proporcionar
el orden de atracción de las cinco.
W no puede tener valores negativos. Varía entre O, lo cual significaría ningún acuerdo
entre los jueces, y +1, que denotaría un acuerdo perfecto entre ellos.
El coeficiente de concordancia de Kendall también permite a un juez dar la misma cla-
sificación a dos objetos. En tal caso, hay una ecuación modificada para calcular W que se
ajusta para tales empates. En el apéndice X se proporcionan la ecuación y un ejemplo re-
suelto.
Confiabilidad de test
Hay tres tipos de confiabilidad del test que los investigadores podrian querer evaluar, se-
gún el uso por dar a una medida: test-retest, forma alternativa (o paralela o equivalente) y
la consistencia interna.
Confiabilidad test-retest. Si un test se diseña para medir algo considerado relativamente
fijo, como algunas personas consideran el IQ, se querrá una medida que producirá los mis-
mos resultados de una ocasión a la siguiente. Para comprobarlo, los diseñadores de una
prueba se la darán a un grupo de personas en dos ocasiones; Kline (1993) recomienda que
se pruebe por lo menos a 100 personas y que el lapso sea de tres meses mínimo entre las
ocasiones. Puede usarse la correlación de producto momento de Pearson para correlacionar
los resultados de las dos ocasiones. Kline (1993) ver = 0.8 (o?= 0.64) como un mínimo
debajo del cual no querriamos ir; recuerde: esto significa que 64% de la varianza de los re-
sultados de la prueba en una ocasión se explica por la de los resultados de la otra ocasión.
Confzabilidad de mitad dividida. La prueba o test puede dividirse en dos partes de varias
maneras. Una sería correlacionar las mitades primera y segunda. Sin embargo, comq mu-
chas pruebas de desempeño incrementan la dificultad de los elementos a medida que avan-
za la prueba, ello no sería idóneo. Una opción es tratar todos los elementos con número par
como una mitad de la prueba y los de número impar como la otra. Una vez más, la r de
Pearson podría emplearse para tal propósito (y luego elevar al cuadrado para obtener un
coeficiente de confiabilidad). Una crítica al respecto radica en que esa medida de confiabi-
lidad se afecta en parte por el número de elementos de una prueba: cuantos más elementos
haya, tanto más confiable aparecerá la prueba. Spearman y Brown produjeron un ajuste que
tomó en cuenta lo anterior (véase en el apéndice X la ecuación de ambos).
Otra crítica sobre el método simple de mitad dividida se refiere a la un tanto arbitraria
asignación de.elementos en las dos mitades. Para evitarla se creó un coeficiente de confia-
bilidad que es el equivalente de haber llevado a cabo todas las posibles mitades divididas
(alfa de Cronbach). Kline (1993) hace notar que alfa nunca debe ser menor de 0.7. Por otro
lado, según Pedhazur y Schmelkin (1991), el usuario de la medida determinará cuán con-
fiable debe ser la prueba conforme a las circunstancias del estudio. No obstante, vale la pena
señalar que el nivel 0.7 se cita con tanta frecuencia, que tendría que argumentarse mucho
para bajar de él, en particular si esperara conseguir que se publique su estudio basado en la
medida. (En el apéndice X se incluye la ecuación para el alfa de Cronbach.)
Una opción ante el alfa de Cronbach, el Kuder-Richardson 20 (KR 20), está disponi-
ble cuando la prueba implica preguntas que tienen sólo dos respuestas posibles, conocidas
como elementos binarios o dicotómicos; por ejemplo, sí/no, correcto/incorrecto o verdade-
ro/falso. (En el apéndice X se proporciona la ecuación para KR 20.)
- 11 11 11111•
J28lL-------------~I~nv~e~st~i~ga~c~ió~n_c~u~a~nt~it~a~ti_va~en~p~si~co~l~og~ía~-------------------
están de acuerdo. Dos profesores podrían calificar un conjunto de ensayos y no dar la misma
calificación a ninguno y aun así podría mantenerse perfecta la correlación entre sus califica-
ciones. Ello ocurriría si un profesor diera 10 puntos más a cada ensayo que el otro; recuer-
de que la correlación informa sólo sobre la dirección en que las dos medidas se mueven una
respecto a otra. Una medida que resuelve ambos problemas es la kappa de Cohen (K) . (En
el apéndice X se incluyen la ecuación y un ejemplo resuelto para la kappa de Cohen.)
Validez
La correlación también sirve para verificar aspectos de la validez de una medida al evaluar
el grado de similitud entre una medida de un concepto y la que está construyéndose. Un
ejemplo sería si los investigadores correlacionaran su medida de depresión con los juicios
clínicos de los psiquiatras.
Resumen
Un coeficiente de correlación describe la relación entre dos variables. Además, puede usar-
se para encontrar la significación estadística de una relación. Es necesario producir un dia-
grama de dispersión de los datos para las dos variables y pensar sobre la naturaleza de la
muestra que se prueba; de otra forma, se corre el riesgo de pasar por alto una relación por-
que es no lineal o de sugerir una relación que es un artefacto de la muestra.
El grado en que una prueba o test producirá la misma puntuación de una ocasión a otra,
su confiabilidad, y el grado en el que los jueces acuerdan la forma de utilizar un sistema de
puntuación, confiabilidad entre jueces, puede determinarse mediante pruebas basadas en la
correlación. Además, ciertos tipos de validez de una medida pueden verificarse mediante
la correlación.
En el capítulo siguiente se presenta otra forma, afín, de analizar las relaciones: la re-
gresión.
20
Análisis de relaciones 11: regresión
• Introducción
El análisis de regresión constituye otra manera de describir y evaluar relaciones entre las va-
riables. Empero, a diferencia de la correlación, se supone que una es la variable dependiente
(VD) o de criterio y otra u otras son independientes o predictoras. El análisis de regre-
sión se considera una forma de representar modelos, ya que se elabora un modelo matemá-
tico de la relación entre las variables. La regresión permite plantear predicciones específicas
a partir de la variable o variables independientes (VI) respecto a la VD en casos individuales.
En la regresión simple interviene sólo una VI, mientras que la múltiple permite utilizar más
de una a fm de predecir la dependiente y mejorar así la exactitud de la predicción. En este
capítulo se estudia únicamente la regresión lineal; es decir, con la relación entre variables
que, cuando se representa en un diagrama de dispersión, se muestra mejor como una recta.
La regresión no lineal excede los alcances del libro.
Se presupone que usted efectuará los cálculos necesarios mediante una computadora.
Con el presente capítulo se intenta ayudarle a entender la regresión y a interpretar los resul-
tados. Algunos de los aspectos más simples de las matemáticas se incluyen en el apéndice XI.
Regresión simple
Remóntese al ejemplo de la aptitud para las matemáticas, la aptitud para inglés y la edad
expuesto en el capítulo anterior. Supóngase que los investigadores desean, primero, prede-
cir la capacidad respecto a matemáticas a partir de los conocimientos de inglés. En otras
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ __ _ _ _ _ ___J 3·29
3JOlL---------------'~n~ve=s~ti~ga~c~io=·n~c=u=a~n=ti=ta=tl=·v~a~e~n~p~si~c=ol=o~gí~a____________________
palabras, consideran el dominio de tal idioma una VI y la aptitud para las matemáticas una
VD. Ello no significa que se crea que la aptitud para inglés determina la correspondiente a
matemáticas; sólo permite a los investigadores ver cuán precisas son las predicciones que
pueden formular acerca de la aptitud de alguien para matemáticas si se conoce su aptitud
para el inglés. Para hacerlo, encontraron la recta que sintetiza mejor la relación entre am-
bas variables (la línea del mejor ajuste). En seguida se aprecian el diagrama de dispersión
de los puntos de aptitud para matemáticas y conocimientos de inglés y la línea del mejor
ajuste:
90
80
111
~ 70
u
¡:;
-~ 60 o o
...E
~
Q)
50
E
~
'- 40
~
Q.
"·¡:;...
::J
30
Q. 20
<
10
o
o 10 20 30 40 50 60 70 80
Aptitud para inglés
Figura 20. 1. Relación entre las aptitudes para matemáticas y para inglés.
Los ejes de la gráfica se prolongaron a propósito más de lo necesario para mostrar los da-
tos; las razones se aclaran después. La línea del mejor ajuste es la recta que da la distancia
mínima entre sí misma y los puntos de la gráfica.
Si desea averiguar qué valor se predice respecto a la aptitud para matemáticas de un
niño con puntuación de 30 en una prueba de aptitud para inglés, busque primero en el eje
horizontal (aptitud para inglés) el valor 30. Trace luego una linea vertical desde tal valor has-
ta la línea del mejor ajuste. Dibuje después una línea horizontal desde el punto donde en-
contró la linea del mejor ajuste hasta el eje vertical (la aptitud para matemáticas). El punto
que toque en el eje vertical será el valor predicho sobre la aptitud para matemáticas.
La figura 20.2 hace pensar que alguien con puntuación de 30 en inglés tendría una de
alrededor de 32 en matemáticas.
------------------------~A~n~á~li~si~s~d~e~r~e~la~cl~·o~n~es~ll~:~re~g~re~s~ió~n~------------~f:3J1
tl 90-
o
so -
le o
V>
70 o o
a: "'
u
·.;;
·-m:.
•lO 60 o o
E
...,Ql 50
"'
E
o
"'.... 40
"'
0..
30
"¡:;...,
::;:¡
0.. 20
<
10
o-,
o 10 20 30 40 50 60 70 80
Aptitud para inglés
Quienes tienen conocimientos matemáticos suficientes saben que cualquier recta de una
gráfica puede representarse mediante una ecuación prototipo, la cual permite especificar
cualquier punto de la recta. Se logra con ello una predicción más precisa que al intentar leer
la gráfica.
A menudo se sigue la convención de llamar Y a un valor del eje vertical y X a uno del
horizontal. La ecuación para una recta de una gráfica tiene siempre esta forma:
Y predicha = a + b x X
donde a es el valor de Y cuando la línea del mejor ajuste corta el eje Y (ordenada al origen)
il- b es una medida de la inclinación de la línea del mejor ajuste (pendiente)
A veces, a y b se denominan coeficientes de regresión.
(En algunas versiones de la ecuación se usan letras diferentes para representar los dis-
tintos elementos de la ecuación e, incluso, puede cambiarse el orden. Sin embargo, sigue
siendo la misma ecuación.)
"'- Cuanto mayor es·el valor de la pendiente, tanto más pronunciada es ésta. Intuitivamen-
te, cuanto más grande es el número por el que usted multiplica el valor horizontal para ob-
tener el vertical, tanto más rápido crecerá éste respecto de aquél.
Otra forma de ver la ecuación de la regresión es la siguiente:
VD predicha = a + b x VI
J32lL______________~I~n~ve=s~ti=ga~c~io=·n~c~u=a~n~tit=a=t¡~·v~a~e~n~p~si~co~l~og~í~a____________________
En este caso:
Aptitud para matemáticas= 4.28832 + 0.94891 x aptitud para inglés
Así, la ecuación de la regresión predice que si un niño tuvo puntuación de 50 en la prueba
de inglés, entonces:
Aptitud para matemáticas= 4.28832 + 0.94891 x 50
= 51.734
65
60 o
"'u<O
·.;:;
·<O
E 55
...,C1l
<O
E
e 5o
<O
a.
·ªo.
"O
45
<(
40 o
35+-~~~T-~~~~~~~~~~~~~~-+
45 46 47 48 49 50 51 52 53 54 55
Aptitud para inglés
Figura 20.3. Amplificación del área que rodea las puntuaciones de 50 para inglés.
ésta de la VD en la que puede ser explicable por la VI y la varianza que sigue sin explicar-
se (residuo). La razón F está formada por:
Tabla 20. 1. Resumen del análisis de varianza en una regresión simple con aptitudes para
inglés como predictor y para matemáticas como variable dependiente.
•
334 Investigación cuantitativa en psicología
Ese valor es el mismo (permitiendo los errores introducidos por redondeo) que el dado por
el coeficiente de correlación.
En el apéndice XI se examinan otras similitudes entre regresión y correlación.
Regresión múltiple
La regresión múltiple puede considerarse una generalización de la regresión simple a situa-
ciones donde hay una variable dependiente y más de una independiente (o predictor). En el
ejemplo de aptitud para matemáticas, podrian medirse varios factores, digamos IQ y estado
socioeconómico, así como aptitud para inglés y edad. Entonces, podria buscarse qué com-
binación de tales variables predice mejor la aptitud para matemáticas. Así se podría ser
capaz de explicar más de la varianza de la aptitud para matemáticas y tener con ello un mo-
delo mejor que permitiría predecirla con mayor precisión. Una regresión múltiple se expre-
sa tanto en términos de una ecuación que relaciona las VD y las VI como por un coeficiente
R de correlación múltiple.
•
• ________________________A_n_á_li_si_s_de__re_L_
ac_io_n_e_s_ll_:_re~g~re_s_io_·n______________~¡385
Ahora, si se supiera que un niño obtuvo 50 en la prueba de inglés y que su edad era de 150
meses (12.5 años), el modelo predeciría esto:
Aptitud para matemáticas= 16.979 + 1.012 x 50-0.107 x 150
= 51.529
Ese valor es ligeramente más cercano al valor real de 50 predicho sólo mediante aptitud
para inglés, pero no muy cercano. Veamos el coeficiente de correlación múltiple (R) y el
análisis de varianza:
Tabla 20. 2. Resumen de una regresión múltiple con la aptitud ~ara matemáticas
como variable dependiente y la aptitud para inglés y la edad como
independientes.
Cuadrado Cuadrado
Casos R de R de R ajustado
10 0.889 0.79 0.729
significa que por agregar la edad en la ecuación se ha explicado 78.96 - 78.84 =0.12% de
la varianza de la aptitud para matemáticas. El valor de 0.12%, o bien, 0.0012 (como pro-
porción de la varianza) constituye el cuadrado de la correlación semiparcial de la aptitud
para matemáticas y la edad, y la aptitud para inglés no se considera en la edad. Según lo
anterior, la regresión puede verse como sigue:
R2 ajustada
Tabla 20.3. Matriz de correlación de las aptitudes para matemáticas e inglés, la edad,
el ES y eliQ.
El primer paso del análisis de regresión identificó la aptitud para inglés como la VI que ex-
plica la mayor parte de la varianza. Esa fase del análisis es igual que la regresión simple
referida antes.
Las tres variables restantes se evaluaron. Se observó que el ES tenía la mayor correla-
ción parcial con la aptitud para matemáticas y por eso se agregó al modelo.
Correlación
Variable parcial
Edad - 0.075
ES 0.403
IQ - 0.177
-
re_l_ac_i_on_e_s_ll_:_re~g~re_s_io_·n______________~j339
________________________A_n_á_li_si_s_de__
Se observó que las dos variables restantes explicaban poco la varianza restante y por ~so
se rechazaron. La aptitud para inglés y el ES explican 82.3% de la varianza de la aptitud
para matemáticas; con agregar la edad y el IQ se habría explicado sólo O. 71% más.
Tabla 20.5. El segundo (y último) paso del análisis de la regresión múltiple gradual en
que se consideró el ES en el modelo.
Variables de la ecuación
Variable Coeficiente E. est. Coef. est. F que se elimina
Ordenada al origen - 7.68
Inglés 1.055 0.193 0.987 29.899
ES 2.053 1.762 0.21 1.358
Error estándar (e. est.) es el error del coeficiente de la regresión. Cuanto menos eficaz re-
sulte la VI como predictor de la VD, tanto mayor será el error estándar. Además, cuanto
más se correlaciona una VI con las otras del modelo, tanto mayor es el error estándar. El
error estándar del coeficiente de regresión se usa para encontrar la significación estadísti-
ca del coeficiente de regresión y un intervalo de confianza (véase en el apéndice XI el cálcu-
lo respectivo). La intercorrelación entre variables independientes se analiza después, en el
apartado "Multicolinealidad".
340 Investigación cuantitativa en psicología
•
Análisis de relaciones 11: regresión ¡341
----------------------------------------~~----------------~
~ = bxDEx
DE_.,
Multicolinealidad
Si la correlación entre algunas variables independientes es muy alta, por ejemplo, 0.8 o
más, los valores predichos resultan más inestables. Puede contrarrestarse lo anterior si se
crea una combinación de variables independientes, ya <;ea agregándolas o aplicando el aná-
lisis de componentes principales, técnica similar al análisis factorial pero que, aparte de la
descripción incluida en el capítulo 21, queda fuera del objetivo del libro. Los lectores inte-
resados deben consultar a Stevens ( 1996) y Tabachnick y Fidell ( 1996).
La técnica PRESS
Como a menudo usted no tendrá información suficiente para dividirla, puede usar otra
técnica, PRESS, que repite la regresión anulando un elemento y recalculando el valor pre-
dicho para él a partir de los datos restantes. Entonces puede calcularse una versión de R2 ,
basada en PRESS; si es notablemente distinta de R2 original, cuestionaría la confiabilidad
de la última.
Residuos
Un residuo es la diferencia entre el valor predicho para la VD y el real. Se mencionó que
la aptitud de un individuo para matemáticas era 55.335, pero la calificación real fue 50. En
este caso, el residuo sería 50 - 55.335 = -5.335. Los residuos pueden estandarizarse median-
te una transformación que les da una media de O y una DE de l. Ello significa que puede
tratarse cada residuo del mismo modo que un valor z para señalar cuán extremo es éste. Por
ello pueden analizarse los residuos estandarizados para ver si alguno se considera extremo,
para lo cual se necesitaría una investigación extensa. En seguida se aprecia que ninguno qe
Jos residuos, tomado del análisis del ejemplo, está fuera del rango ± 1.8 y, por consiguien-
te, se halla en el intervalo normal, pues no son mayores que 3 DE de la media:
Tabla 20.6. Aptitud para matemáticas, aptitud para matemáticas predicha, residuo y
residuo estandarizado obtenidos a partir de la regresión de aptitud para
inglés y ES sobre matemáticas.
Gráfica de residuos
La gráfica de residuos requiere el trazo del diagrama de dispersión entre los valores predi-
chos de la variable dependiente y los residuos estandarizados. No debe mostrar pauta evi-
dente alguna, lo cual revela que los residuos son aleatorios.
2~~--~--~--~--~--._--~~
o
.g"' 1.5
:S o
·e
!U
-o
e:
~ 0.5
~ o
"'o o
o ···············.................... .................. .
::>
-o
·¡¡¡
o o
& ~.5
o o
o o
-1
40 45 50 55 60 65 70 75 80
Valor predicho respecto a la aptitud para matemáticas
Figura 20.4. Gráfica de los residuos de la regresión de la aptitud para inglés y ES sobre
la aptitud para mate máticas.
La gráfica anterior no muestra relación evidente alguna entre las dos medidas. En ciertas
formas podría sugerir que se violaron los supuestos de la regresión.
Varianza heterogénea. El ejemplo de referencia muestra mayor varianza de Jos errores en
cuanto a los valores predichos más altos, lo cual hace pensar que el modelo será mejor para
predecir los valores más bajos de la VD. Homocedasticidad es el término con que se deno-
ta que un conjunto de residuos tiene varianza homogénea, y heterocedasticidad, cuando la tie-
ne heterogénea.
o
~ 1.5
-o
!U o
N
'¡ij o
-o
e: o
~ 0. 5
Q) o
"'o::> o ............ ........................................ ....
-o
·¡¡¡ o o
& ~.5 o
o o
e
1 +----~--....--~....----.-----.-----,--~--+
~ ~ ~ ~ 60 ~ ro w
Valor predicho para la variable dependiente
Figura 20. 5. Ejemplo de varianza heterogénea de los residuos a partir de un análisis
de regresión.
Análisis de relaciones 11: regresión
----------------------------------------~~----------------~
íJ45
Curvilinealidad. El ejemplo sugiere que el modelo subestimará los valores medios de la
VD y sobreestimará los de los extremos.
"' 1.5
o
"O
:3
·e
"'e
"O
o
t!<11 0.5 o o
o
"'o o
-5 o
·¡¡;
& o o
-0.5
o
o
o
40 45 50 55 60 65 70 75 80
Valor predicho para la variable dependiente
Figura 20.6. Ejemplo de la relación curvilínea entre los residuos y los valores predichos
de la VI a partir de un análisis de regresión.
2 0.81278 0.51997
3 0.28688 0.16515
4 0.01375 0.16558
5 0.00295 0.16918
6 0.01829 0.02039
7 0.02793 0.18091
8 0.00986 0.06081
9 0.49073 0.16635
10 0.08160 0.23512
Tabla 20.8. Resumen del ANOVA de una vía entre sujetos sobre el recuerdo d e una
lista de palabras en grupos con auxiliares nemotécnicos.
Sin embargo, se usan variables ficticias para distinguir los tres grupos:
Tabla 20.9. Información relacionada con las palabras recordadas mediante estrategias
nemotécnicas donde se usaron variables ficticias para identificar los
grupos.
Tabla 20. 1O. Resumen del análisis de regresión de los tres grupos gue intentaron
recordar palabras.
Nótese que la suma de cuadrados de la regresión es igual que la suma de cuadrados entre
grupos del ANOVA de una vía y que la suma de cuadrados del residuo es igual que la su-
ma de cuadrados intragrupos.
Por consiguiente, el ANO VA puede tratarse como un ejemplo de análisis de regresión.
Los dos son modelos descritos por lo que se denomina modelo lineal general, como lo son
tres técnicas abordadas en el capítulo siguiente: análisis de covarianza (ANCOVA), ANOVA
multivariado (MANOVA) y ANCOVA multivariado (MANCOVA). En el libro no se por-
menorizan dichas técnicas. Los lectores que desean mayor información deben consultar a
Howell (1997). La posible moraleja de tales cuestiones consiste en que buscar diferencias,
como con el ANOVA, y relaciones, como con la regresión, son dos maneras de ver lo mis-
mo. Uno puede preguntarse !>i hay una diferencia a l recordar palabras entre los tres grupos
con estrategias nemotécnicas o si hay una relación entre el tipo de estrategia nemotécnica
empleada y el recuerdo de palabras.
Resumen
Es posible explorar las relaciones entre las variables mediante el análisis de regresión. La
regresión simple se usa si hay sólo una variable independiente y la múltiple cuando hay dos
_________________________A
_n_á_li_si_s _d_e_r_e_
la_c_ ll _
io_n_es__ :_re~g~re_s_io_
' n________________~¡-3.49
1" o más. Este análisis cumple dos funciones: identificar cuánto de la varianza de la VD pue-
de explicar la variación de la o las VI y elaborar un modelo de la relación entre la variable
dependiente y la o las VI a fm de permitir así que la VD sea predicha para unos valores es-
pecíficos de las VI.
lllU A veces se considera que la regresión múltiple es un ejemplo de estadística multivaria-
da. En el capítulo siguiente se presentan otros tipos de estadísticas multivariadas y se ex-
plica brevemente su empleo.
21
Análisis multivariado
Introducción
La definición rigurosa del análisis multivariado es que más de una variable dependiente (VD)
interviene en el análisis. Sin embargo, el autor ha incluido en este capítulo cuatro técnicas
que no cumplen con la defmición: el análisis de covarianza, la modelación logarítmico-li-
neal, el análisis logit y la regresión logística. A fin de aplicarlas, debe aprender más de ellas
de lo que se explica en esta obra.
La mayoría de los psicólogos entienden menos las técnicas descritas en el capítulo que
muchas de las tratadas en los anteriores. En parte, ello se debe a que a menudo no se estudian
en los cursos de métodos de investigación de nivel licenciatura, excepto quizá como materia
optativa avanzada en el último año. Para entender cómo se calculan se requieren conoci-
mientos de matemáticas que muchos estudiantes no poseen, y la mayor parte de las técnicas
no se abordan en los libros de texto de licenciatura. Además, sus resultados son a veces más
dificiles de interpretar. Quizá esos factores contribuyan a que las técnicas referidas se usen
mucho menos que las de una y de dos variables explicadas en los primeros capítulos.
Otro factor que se suma a lo anterior es que el número de participantes debe ser gran-
de para que los resultados de las técnicas multivariadas tengan cierta validez. Por ejemplo,
por cada variable predictora incluida en un análisis discriminante debe haber al menos 20
participantes.
El objetivo del capítulo consiste en que el lector cobre conciencia de la función de cada
técnica descrita y advierta las restricciones en su uso. As1 podrá juzgar cuándo son útiles.
Además, con la información del capítulo será capaz de interpretar y criticar otras investí-
350 •
A_na_·l_is_is_m_u_l_ti_va_n_·a_d_o__________________~~
_____________________________
gaciones en las que se hayan empleado las técnicas. Este capítulo no lo capacitará para apli-
car las técnicas descritas; quienes desean emplearlas deben consultar Stevens (1996), Tabacb-
nick y Fídell (1996) o las referencias más específicas mencionadas a lo largo del capítulo.
también quedarían incluidos en el modelo. Recuerde, sin embargo, que con el ANOVA es
posible hallar una interacción con significación estadística sin tener un efecto principal que
la presente. El método que se aplica en el análisis se describe como una solución hacia
atrás; se empieza con el modelo completo, es decir, incorpora todos los posibles 'factores y
luego se eliminan de manera selectiva algunos de ellos hasta que se encuentra la solución
óptima. Es análogo a la solución hacia atrás de la regresión múltiple.
En seguida se dan los datos que se desea analizar con modelación logarítmico-lineal.
Tabla 21. 1. Cantidad de hombres y mujeres que fuman y si fuman sus padres.
Género de los participantes
Masculino Femenino
Padres fumadores Fumador No fumador Fumador No fumador
Sí 30 6 40 6
No 12 68 6 32
El modelo log-lineal que mejor se ajustó a los datos fue uno que incluía las interacciones
género por padres fumadores y participantes fumadores por padres fumadores. Se exclu-
yó la interacción tres vías y la interacción de participantes fumadores y género. El modelo
se probó estadísticamente, con el resultado que x2 = 0.225, gl = 2, p = 0.894. Observe que en
este caso se prueba el ajuste de un modelo, no una hipótesis nula. Entonces, si ésta hubie-
ra tenido significación habría tenido que rechazarse el modelo. Este resultado puede inter-
pretarse como muestra de que cualquier nexo entre el género y ser fumador es explicable en
términos de los vínculos entre los factores padres fumadores y participantes fumadores y
entre padres fumadores y el género del participante. En Agresti ( 1990; 1996) encontrará
los detalles de cómo efectuar la modelación log-lineal.
T 2 de Hotelling
La T 2 de Hotelling puede considerarse una generalización de la prueba t a situaciones donde
hay dos niveles de una VI pero más de una VD. Por ejemplo, se presentaría cuando se com-
- paran los efectos de dos técnicas terapéuticas. Sin embargo, en lugar de considerar sólo una
medida de resultado, podría verse cuán satisfechos estaban los clientes con el tratamiento,
en qué grado sentían que tenían el control de sus vidas y lo angustiados que estaban.
•
m_u_lt_iv_a_ri_a_do____________________~¡:i53
______________________________A_n_á_lis_is__
o bien, b) más de una variable independiente. Entonces, podrían compararse tres o más técni-
cas terapéuticas sobre varios resultados. También se usa para aplicar el ANO VA intrasujetos.
Tabla 21. 2. ANO VA de una vi a entre suj etos que compara la edad en que aprenden
a leer los alumnos de sendas escuelas: una de mujeres, otra de hombres
y una mixta.
El ANOVA hace pensar en una diferencia entre las escuelas con respecto a las edades en
que se aprende a leer. No obstante, supongamos que se sabe que dicha edad se correlacio-
naba con el IQ en la muestra (r = 0.64 1); sería entonces sensato volver a examinar las eáa-
des en que se aprende a leer mientras se controla el IQ para ver si se conservan las diferencias
entre las escuelas; ANCOVA hará esto .
...
J54lL_______________I~n~ve~s~ti~ga~c~io~·n~c~u~a~n~ti~ta~tl~·v~a~e~n~p~si~c~ol~o~gí~a--------------------
Tabla 21.3. Análisis de covarianza que compara la edad en que se aprende a leer en
sendas escuelas: una de mujeres, otra de hombres y una mixta, con
control del JQ.
Suma Media
Fuente de la variación gl de cuadrados de cuadrados F $ig. de F
Efectos principales
de escuela 2 11.600 5.800 1.262 0.300
El ANCOVA muestra que ya no hay diferencia con significación estadística entre las es-
cuelas y que el covariado, IQ, explicaba la discrepancia mostrada en el ANOVA de una
vía original.
El análisis discriminante permite ver si los perfiles de evaluación entregados por las
dos razas difieren en forma significativa. Si es así entonces usted puede seguir explorando
para averiguar qué contribuyó a la diferencia.
Huberty (1994) designa el segundo enfoque análisis discriminante predictivo. Un ejem-
plo de su uso es cuando una institución quiere distinguir a quienes tendrán éxito en la ca-
pacitación y los que no con base en sus perfiles delineados por una prueba de personalidad.
Si el análisis logra su objetivo, los alumnos exitosos tendrían perfiles similares entre sí pero
diferentes de los de quienes fracasaron . Entonces, podrían usarse las maneras en las que di-
fieren los perfiles de los dos grupos para descubrir en quienes solicitan capacitación quiénes
tienen más probabilidad de tener éxito.
Exploración de relaciones
Cuando se buscan relaciones entre variables hay dos forma s básicas de hacerlo. Primero,
igual que con la correlación y la regresión, se averigua cualquier relación entre las medi-
das que se han tomado: las variables observadas. Esto presupone que las variables se han
medido de modo directo e, implícitamente, que las medidas usadas no están sujetas a error.
También pueden verse las medidas como indicadores de ciertas variables de orden supe-
rior: las latentes. Así, más de una de las variables observadas podría estar midiendo la misma
variable latente.
Regresión logística
La regresión logística se considera una versión más manejable de análisis logit porque la
restricción en los niveles de medición no es tan rigurosa. Por tanto, las variables predicto-
ras no tienen que ser categóricas y aunque se supone que la VD es discreta, es posible re-
codificar otras variables de manera que formen una escala discreta. Además, antes del
análisis las VI se codifican de nuevo como dicotómicas, ficticias, como se explicó en el ca-
pítulo anterior. El paralelismo de la regresión logística y la múltiple es grande. Es posible
poner todas las VI en el modelo - usando la entrada directa- a fin de especificar el orden
(en el análisis secuencial) o delegar la responsabilidad en la computadora usando regresión
hacia atrás, hacia delante o por pasos. En Agresti (1990; 1996) se encuentran los detalles
de cómo efectuar el análisis logit y la regresión logística .
•
'
J56l~ _______________l_nv_e_s_ti~ga_c_ió_n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
AnáUsis de conglomerados
En el análisis de conglomerados se supone que los elementos -digamos, los participan-
tes- pueden clasificarse en cierto tipo de jerarquía. Se empieza por formar pares de parti-
cipantes, los más cercanos en alguna dimensión (o combinación de dimensiones), y luego
las combinaciones (o conglomerados) de esos pares y se continúa formando combinacio-
nes de orden SUP.erior hasta que todos los elementos están en un conglomerado. Por ejem-
plo, uno podría estar interesado en clasificar a los pacientes que han proporcionado sus
puntuaciones en varias pruebas. A veces usan esta técnica quienes aplican cuadriculas de
repertorio derivadas de la teoría del constructo personal de Kelly (véase capítulo 6). Permite
al investigador ver si los elementos (por ejemplo, los individuos) a quienes evalúa una per-
sona forman conglomerados con base en los constructos atribuidos a ellos. De esta mane-
ra, un analista podría averiguar la clase de individuos que una persona considera semejantes
a alguno de sus padres. El análisis discriminante empieza con el conocimiento del grupo al
que se pertenece y busca la combinación de medidas que distinguen los grupos, mientras que
el análisis de conglomerados indaga posibles grupos con base en las medidas. De hecho, el
análisis discriminante se usa a veces para explorar más la naturaleza de las agrupaciones
que se identificaron con el análisis de conglomerados.
Correlación canónica
La correlación canónica es una extensión de la regresión múltiple a situaciones donde hay
más de una VD y más de una VI. Por ejemplo, podría considerarse la correlación entre el
nivel A, Iocus de control, motivación de logro y varias medidas de inteligencia como VI y
los resultados de diferentes cursos que cada estudiante tomó como las VD. Contraria a la
regresión múltiple porque hay más de una VD, en la correlación canónica hay más de una
posible relación entre las VI y VD que podría identificarse.
AnáHsis de trayectoria
El análisis de trayectoria se conoce a veces como regresión múltiple jerárquica. Permite a
los investigadores observar dire<.;ta e indirectamente las relaciones entre las variables. La
regresión múltiple juzga cuán bien un conjunto de VI predice una sola VD, en tanto que en
el análisis de trayectoria puede tenerse la misma variable como una VD en una etapa del
modelo y como una VI en otra. En el modelo simple de la figura 21.1, personalidad e IQ se
consideran predictores de la hoja de servicios de una persona en un empleo anterior. Además,
también predicen el desempeño de la misma persona en el empleo actual, directamente y
por medio de su empleo previo. Por consiguiente, un análisis de regresión considera el empleo
anterior como una VD, y la personalidad y el IQ como VI, y para una segunda regresión el
empleo presente es una VD, y la personalidad, el IQ y el empleo anterior como las VI.
______________________________A_n_ál_is_is__
m_u_lt_iv_a_ri_ad_o____________________~¡:357
Personalidad
Desempeño
actual
IQ
Es usual poner lo que se llama coeficientes de trayectoria en cada una de éstas. De ordina-
rio son coeficientes de regresión estandarizados y así dan una idea de la importancia rela-
tiva de trayectorias dadas en el proceso de la predicción.
Un riesgo de este análisis radica en que los investigadores olviden lo que se les ha dicho
acerca de las técnicas de correlación: que no pueden identificarse relaciones causa-efecto.
Hay la tentación de considerar la flecha en un diagrama de trayectoria como la dirección
de una causa. Igual que en la regresión, sólo señala el grado en el que una variable puede
usarse para predecir otra.
Por ejemplo, si hubiera 20 vinos y se pidiera a los participantes que los compararan por
pares y evaluaran cuán semejantes saben se tendrían 190 juicios por cada participante. Podría
ejecutarse un programa de EMD con los datos. El resultado podría ser que se tuvieran dos
dimensiones, una de sequedad/dulzura y otra de variación entre blanco y tinto.
El siguiente es un ejemplo con algunos datos reales. Se tomó la distancia en millas en-
tre lO ciudades inglesas y se corrió un programa de EMD con los datos. El resultado es el
que se ofrece a continuación:
·+····+ ····+····+····+····+····+····+······
2.1 ·+ +
: Cambridge
Londres
1.0 ·+ +
Nottingham:
Leeds
0.0 ·+··················· ···················
·········+
: Birmingham
Stoke : Gloucester
Manchester
Liverpool
-1.0 ·+ +
Exeter :
·2.1 ·+ +
Al principio parece erróneo que Cambridge quede al norte de Manchester, lo cual se debe
a que se pidió a la computadora que encontrara las dimensiones, pero no se le indicaron los
conceptos norte y sur. Gire la página 90 grados en el sentido de las manecillas del reloj.
Ahora ya puede ver que Liverpool, Manchester y Stoke están en el noroeste, Gloucester y
•
A_na_'l_is_is_m_u_l_ti_va_n_·a_d_o__________________~~
_____________________________
Figura 21.3. Resultados de un análisis del componente principal sobre seis preguntas .
•
J60lL-------------~I~nv~e=s~ti~ga~c~ió~n~c=u=a~nt~it~a=ti_va~e~n~p~si=co~l~og~í~a____________________
Análisis factorial
El análisis factorial puede considerarse una extensión del ACP en la que se plantean su-
puestos diferentes con respecto a las posibles pautas entre las variables. Es una técnica que
ha provocado grandes polémicas y cuya aplicación ha contribuido a desacuerdos entre los
investigadores; por ejemplo, en la investigación sobre la naturaleza de la inteligencia. Basta
una anécdota para manifestar la esencia polémica de la técnica. El autor preguntó a un ma-
temático, profesor titular de estadística, si abordaría el análisis factorial. Contestó que no,
pues no creía en él. Es difícil imaginar una respuesta similar si se pregunta por cualquier
otro procedimiento matemático, por ejemplo, el álgebra.
Tanto el análisis factorial como el del componente principal exigen al investigador to-
mar ciertas decisiones sobre cómo llevar a cabo el análisis, las cuales afectarán los resulta-
dos de éste. Por consiguiente, cualquiera que informe acerca de tales análisis debe reportar
las opciones que escogió para realizarlo. Sin esa información el lector ignora cómo se ob-
tuvieron los resultados. Es importante porque pudiera trastocar un aspecto tan fundamen-
tal como cuántos factores se seleccionaron.
A diferencia del análisis factorial, el ACP mantiene la información de modo que las
correlaciones entre las variables originales puedan reconstruirse por completo a partir de
las relaciones entre los factores. Comprende toda la varianza de las puntuaciones, en la que
se incluye toda la que es propia de la variable y la varianza del error. Por ende, el ACP
resume las variables en un conjunto de componentes (posiblemente menor). El análisis fac-
torial, en cambio, sólo intenta explicar la varianza que comparten las variables, con la su-
posición de que esas variables son indicadores de variables latentes o factores.
•
______________________________A_n_á_lis_is__ ____________________~¡-361
m_u_lt_iv_a_ri_a_do
Extr • extraveJ>ión
Neur ~ neuroticismo
Raz. num. = razonamiento numérico
Raz. verb. = razonamiento verbal
Resumen
Hay varias técnicas multivariadas que extienden las analíticas (tratadas en el resto del libro)
a fin de abarcar situaciones en las que se incluye más de una variable dependiente u otros con-
juntos de datos más complejos. Es más complicado conducir e interpretar estas técnicas que
las otras, y requieren tomar más decisiones sobre cómo tratar los datos. Tales decisiones
puede tomarlas el investigador o un programa de computadora; pueden estar sujetas a uso
inadecuado o aprovechar la oportunidad y dar una solución sólo aplicable a los datos da-
dos y no proporcionar un modelo confiable. Debe informarse acerca de todas las decisiones
tomadas por un investigador o una computadora con objeto de que el lector pueda ubicar
los resultados en el contexto de esas decisiones. Por lo general, se requiere un tamaño mucho
más grande de muestra, tanto para seguridad como para obtener un análisis confiable, que
en la técnica univariada equivalente.
En el siguiente capitulo se explica cómo realizar un metaanálisis, un método cuanti-
tativo para combinar los resultados de la investigación a partir de estudios relacionados
con objeto de producir una medida general del tamaño del efecto y de la probabilidad es-
tadística .
..
J62l~_______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________ 10
Variables Variables
dependientes predictoras Covariados Test
1 1+ sí ANCOVA
>1 1 (2 niveles) - T2 de Hotelling
>1 1+ - MANOVA
>1 1+ sí MANCOVA
1 (nominal) >1 (nominal) - Modelo log-lineal
1 1+ - Análisis discriminante
22
Metaanálisis
Introducción
El metaanálisis es el equivalente cuantitativo de la recensión de artículos publicados, pero
con tres ventajas respecto a ésta. En primer lugar, permite a quien reseña cuantificar las ten-
dencias presentadas en las publicaciones, combinando los tamaños de los efectos y las pro-
babilidades encontradas en varios estudios. En segundo, por combinar los resultados de
diferentes estudios se incrementa el poder de la prueba estadística, en cuyo caso es posible
que, tras combinarse, varios hallazgos no significativos y con la misma tendencia se tomen
significativos. En tercer sitio, el proceso de preparar los resultados de trabajos anteriores
para realizar el metaanálisis obliga a leer los estudios con mayor detenimiento que el que
dedicaría quien lleva a cabo una reseña narrativa.
En el presente capítulo se describen las etapas del metaanálisis. Las ecuaciones nece-
sarias para realizarlo figuran en el apéndice XIII, donde se incluye también un ejemplo de
cada etapa, el cual se basa en un metaanálisis sobre el dolor pélvico crónico (McGowan,
Clark-Carter y Pitts, en prensa).
------------------------------------------~----------_J 363
J64lL_______________I~n_ve~s~ti~ga~c~io~·n~c~u_a_nt_i~ta_tJ_'v_a_e_n~p_si_co_l_o~gí_a____________________
Identificación de la investigación
La fase siguiente del metaanálisis, como sucede con la reseña narrativa, consiste en identi-
ficar las investigaciones relevantes. Esto puede hacerse mediante los sistemas estándar de
resúmenes; por ejemplo: PsychLit, Psychological Abstracts y Social Science Citation
Index. Los textos recogidos en ellos podrían aportar más artículos a sus listas de referen-
cias. Internet constituye otra fuente de material y de personas interesadas en el campo de
la investigación. Además, el metaanalista puede escribir a autores conocidos por su traba-
jo en el área para ver si tienen algún estudio aún no publicado cuyos resultados valga la pena
divulgar.
El proceso de referencia demuestra la complejidad del área. En él puede verse la gama
de diseños utilizados, los grupos usados como controles, los rangos de edades considera-
dos y si se ha trabajado con niños o con adultos. Por ejemplo, en los estudios acerca de la
naturaleza del dolor pélvico se utilizan diferentes grupos de comparación. Se han hecho
comparaciones entre las mujeres con dolor pélvico sin causa discernible y las que presen-
tan una causa fisica identificable. Además, se ha comparado a las personas con ese dolor
con las que sufren otros tipos de dolor crónico y con quienes no lo padecen.
Los artículos recolectados muestran también las medidas que se han tomado; es decir,
las variables dependientes (VD) utilizadas. Por ejemplo, en el caso del dolor pélvico las
medidas van desde la ansiedad y la depresión hasta la experiencia de abuso sexual infantil.
.
Si los investigadores no responden, nos veremos forzados a cuantificar informes tan
vagos como "los resultados fueron significativos". En el apéndice XIII se presentan formas
de trabajar con esto.
...
J66l~ ______________l_nv~e~s~ti~ga~c~ió~n_c~u_a_nt_it_a_ti_va~e_n~p_si_co_l_og~í~a____________________
supondría que nuestro metaanálisis soslaya hallazgos no significativos y que por ello da
una falsa impresión de significación. Más adelante se mencionan las formas estándar para
considerar dicho problema. En esencia, en ellas se calcula cuántos estudios no publicados
con hallazgos no significativos debe haber para poner en duda los hallazgos del metaaná-
lisis. Si el número es demasiado grande, no hay problema del archivero; si es pequeño, los
resultados del metaanálisis se verán con mayor cautela.
Los estudios con más participantes tienen así mayor influencia en los resultados del meta-
análisis que los de muestras menores.
Probabilidad
Producción de una medida estándar de ·probabilidad
La medida estándar para calcular la probabilidad recomendada por el autor es la puntua-
ción z. En el apéndice XIIJ se presentan las ecuaciones para convertir diferentes estadísti-
cas inferenciales en una puntuación z.
.... -
_______________________________Met_a_an_a_'h_.sl_·s______________________~~
__
Intervalos de confianza
Resulta útil calcular e indicar el intervalo de confianza del tamaño del efecto combinado.
En él se tiene en cuenta el total de participantes de todos los estudios del metaanálisis. Re-
cuerde que un intervalo de confianza es una estimación, basada en datos de una muestra,
sobre el sitio en que podría estar el parámetro de la población. Si el intervalo de confianza
del tamaño del efecto no contiene un cero, cabe confiar en que se ha detectado un efecto
• real. Por ejemplo, si un intervalo de confianza refleja que el tamaño del efecto de la rela-
ción entre género y tabaquismo en cierta cantidad de estudios fue de -0.1 y +0.4 (donde un
valor negativo denota mayor proporción de mujeres fumadoras, y uno positivo, mayor pro-
porción de varones), entonces, como esa gama incluye la posibilidad de que el tamaño del
efecto sea cero, podría poner en tela de juicio que haya una diferencia real entre las con-
ductas de tabaquismo de cada género.
Comparación centrada
,
Una manera de trabajar con un conjunto de estudios no homogéneo es buscar una base con-
sistente de la falta de homogeneidad y probarla con estadística. Por ejemplo, un metaaná-
lisis de la relación entre el género y las capacidades matemáticas podría revelar que los
estudios presentan resultados heterogéneos. En el metaanálisis cabe plantear la hipótesis de
que eso se debe al tipo de aptitudes matemáticas valoradas en cada estudio. Entonces, será
factible clasificar los estudios de acuerdo con el tipo de habilidades matemáticas valoradas
para ver si producen resultados significativamente diferentes. Tal técnica rebasa el objeti-
vo del libro. Quienes deseen realizar una comparación centrada deben consultar la obra de
Rosenthal (1991) .
•
~~----------------ln_v~e~st_íg~a_c_ió_n_c_u_a_n_ti_ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
· Tamaño
del Número
Número Total efecto critico
Grupos de de combinado Intervalo z p N fracaso· del
comparados estudios participantes (r) de confianza combinada combinada éxito archivero
Dolor pélvico
contra
controles
Resumen
Para realizar un metaanálisis se identifican todos los estudios disponibles relacionados con
el área que se explora. Éstos deben clasificarse de acuerdo con su diseño y con las varia-
bles dependientes que se utilizan en ellos. Se deciden cuántos metaanálisis se necesitan
para describir plenamente el área. Pueden calcularse un tamaño del efecto y una probabili-
dad combinados para cada metaanálisis. Además, debe calcularse la heterogeneidad de cada
una de tales medidas. Cuando se identifica la heterogeneidad del tamaño del efecto, se elimi-
nan estudios del metaanálisis basta identificar un conjunto homogéneo. Se presentan en
el informe tanto las probabilidades combinadas de todos los estudios y del conjunto homogé-
neo como el tamaño del efecto combinado del conjunto completo de estudios y del homo-
géneo. Todas las decisiones sobre la inclusión y la exclusión de estudios se plantean de
manera explícita en el informe respectivo.
En el capítulo siguiente se explica cómo presentar informes de investigación.
23
Cómo presentar la investigación
Introducción
El investigador debe comunicar cuatro puntos a quien lea o escuche un recuento de su tra-
bajo: qué hizo, cómo lo hizo, por qué lo hizo y qué encontró. Un lineamiento indica que el
autor se expresará con toda claridad según el medio elegido y el público que, razonable-
mente, espera que lo lea o escuche.
·Por lo anterior, un informe escrito para una publicación académica diferirá de una ex-
posición verbal ante una concurrencia del mismo tipo. Un informe escrito para académicos
diferirá también de uno dirigido a otro tipo de personas. Además, es necesario atender las
convenciones existentes, pues el público podría tener ciertas expectativas respecto al nivel
de detalle que se presentará y en qué parte del recuento habrá de exponerse.
Hay cuatro tipos de público, cada uno de los cuales exige un método de exposición dis-
tinto. En primer lugar está el público en general, para el que es necesario hacer el mayor
número de concesiones, explicar y modificar la terminología e incluso simplificar la estruc-
tura de los enunciados. En segundo lugar está el público de legos con preparación acadé-
mica, el cual también requiere que se le explique la terminología. En tercer sitio están las
personas de la misma disciplina que el investigador, quienes quizá necesiten sólo que se
les aclaren ciertos aspectos del área concreta abordada. Finalmente, están los colegas del
mismo ámbito del investigador, a quienes se realizan concesiones mínimas.
372
__________________________C_ó_
m_o~p_r_
e_
se_n_ta_r_l_a_i_
nv_e_s_
ti~ga_c_io_'n________________~¡-373
Lenguaje no sexista
Para muchas personas ya no es aceptable que se considere neutral el pronombre él y no refe-
rido sólo a varones. Una forma de evitar la necesidad de mencionar explicitamente el género
de alguien es con el plural. Por ejemplo: Los investigadores estudiaron el efecto de la es-
trategia nemotécnica en el recuerdo y seleccionaron tres grupos ... De esa manera, ellos se
utiliza en lugar de él o ella. No obstante, en ocasiones el psicólogo desea referirse a una
persona en concreto. Si bien algunos emplean el plural por creerlo pronombre neutral y sin-
gular, su uso es incorrecto y puede molestar a ciertos lectores. En este caso estimo preferi-
ble recurrir a la fórmula él o ella y no él (ella) . Por ejemplo: Cada participante recibió
capacitación para utilizar la estrategia nemotécnica; posteriormente, se pidió al o a la
participante que recordara tantas palabras como le fuese posible.
Informe escrito
Hay muchos tipos de informe escrito: por ejemplo, puede elaborarse para incluirlo en una
publicación académica, en una revista destinada a profesionales como The Psychologist, en
un periódico o en una revista popular, para un organismo patrocinador o para un cliente.
Por lo general, se pide a los estudiantes que adopten un estilo similar al de las publicacio-
nes académicas cuando presenten sus investigaciones. Me centraré en los informes escritos
para el público académico. Para comenzar, describiré el informe de un experimento o de un
cuasiexperimento y explicaré algunas variaciones del tema.
El titulo
El título reviste gran importancia, pues con frecuencia será lo primero que vean todos los
lectores del informe y podría encontrarse en el índice de contenido de una publicación o
como entrada en una lista de publicaciones. Por ello, en él debe indicarse de qué trata la in-
vestigación para que los lectores decidan si quieren conocerla. Ha de ser breve e indicar
asimismo el área de estudio y detaflar más la subárea. Un título como fl¡forme sobre un ex-
perimento de psicología social constituye un ejemplo extremo de lo que no debe hacerse.
Es cierto que informa acerca del área global de la investigación, pero no va más allá. La
mayor parte de ese título reSulta redundante: el lector sabe que se trata de un informe, puede
averiguar que atañe a un experimento si revisa la síntesis y la psicología social representa
ün área muy vasta. En general, como los lectores tienen intereses más específicos, eligen
lo que han de estudiar con base en el tema de la investigación. Por ello, un mejor título sería
Los efectos de la presencia de terceros en la conducta altruista.
Según otro principio, el título debe reflejar de modo adecuado el contenido del infor-
me. Ello podría parecer obvio, pero un uso descuidado de la terminología quizá desoriente
al lector. Un colega se vio inundado de solicitudes de copias de un artículo en cuyo título
estaba la palabra biorretroalimentación, cuando el texto trataba simplemente acerca de la
retroalimentación.
La sintesis
La síntesis es un resumen muy breve de la investigación que se divulga; recomiendo usar
no más de 100 palabras. Si el trabajo está registrado en alguna base de datos como Psych-
Lit, dicha parte podría constituir la única información que Jos lectores tengan acerca de él,
aparte del títu lo. Quienes se hayan interesado tras leer el titulo irán a la síntesis y, según lo
que ahí encuentren, decidirán si prosiguen. La brevedad de la síntesis significa que de-
be incluir sólo detalles esenciales. El autor ha de indicar lo que hizo. cómo lo hizo y qué
encontró; por qué lo hizo resulta menos importante en esa sección. No creo que el lector
necesite conocer, al revisarla. la hipótesis del estudio. También sugiero omitir las referen-
cias en la síntesis, pues los detalles de éstas no se hallarán disponibles para quien cuente
sólo con la síntesis y el título. Sin embargo, si el trabajo citado es suficientemente conoci-
do, parece razonable hacer referencia a él. Por ejemplo : En el experimento se estudió el
__________________________C_ó_ln_o~p~r_e_se_n_t_ar_l_a_i_nv_e_s_ti~ga_c_io_'n________________~¡-J75
Los errores comunes entre los estudiantes incluyen que éstos dan demasiados detalles acer-
ca del diseño, del número y de la naturaleza de los participantes (en ocasiones cuando tales
pormenores son innecesarios) y tanto del procedimiento como de las pruebas estadísticas
específicas que utilizaron. En contraste, ofrecen información escasa sobre los resuJtados; con
frecuencia, sólo dicen al lector que "fueron significativos" o incluso que "a continuación se
presentan los resultados". Debe indicarse qué dirección tomaron éstos.
La introducdón
El propósito de la introducción es poner la investigación en el contexto de otros estudios
relevantes anteriores y explicar por qué valió la pena efectuarla. El nivel de detalle debe es-
tar entre dos extremos: lanzarse directamente a la hipótesis sin ninguna otra explicación o
ser demasiado minucioso, al grado de explicar la psicología social. Han de resumirse los
trabajos previos y evitar exponer hasta el mínimo detalle.
Al citar a un autor, simplemente se escribe su apellido y la fecha de publicación, como
se haría en un ensayo. Resulta innecesario informar al lector: Jean Piaget, psicólogo suizo
nacido en Ginebra, afirmó en 1963 que... , a menos que tales detalles sean de suma relevan-
cia para el argumento que se presenta. En lugar de ello, habrá de escribirse: Piaget {1963)
afirmó que... Según la convención, la primera vez que se hace referencia a un articulo es-
crito por más de dos autores, se presenta toda la lista de éstos. En adelante, se cita así: Pia-
get y cols. (1977), en lugar de señalar a todos nuevamente (la abreviatura y cols. significa
"y colaboradores"). Si uno o más estudios leídos no aportan nada al argumento, pero sirven
para apoyar alguna investigación relevante anterior citada en el artículo, basta listar a los
amores en seguida de una frase sintética, como Los resultados hallan respaldo en Piaget
(1963), Hartley (1977) y Cruíkshank (1 983).
El final de la introducción debe allanar el camino a la sección siguiente: el método.
Ello puede hacerse mediante una frase de enlace: Se decidió realizar un experimento para
ver si la presencia de otra persona tiene algún efecto en la conducta altruista de un parti-
cipa me. De manera alternativa, también puede plantearse formalmente la hipótesis de la in-
vestigación. En un informe de laboratorio, tal vez resulte más adecuado utilizar el segundo
ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
~~----------------ln_v_e_st~ig~a_c_ió_n_c_u_a_n_ti_
formato, junto con la hipótesis nula. Sin embargo, pocos psicólogos graduados divulgan
sus investigaciones en tales términos y prefieren dejar implícita la hipótesis. Las ventajas
del método formal son dos: el estudiante puede demostrar al evaluador que sabe lo que hace
y deja en claro qué criterios se aplicaron al efectuar las estadísticas, por ejemplo, si es apro-
piado usar una prueba de una o de dos colas.
El método
La función del método consiste en permitir a los lectores reproduc4' el estudio si lo desean.
Por tanto, es necesario decidir si se han dado o no detalles suficientes. Sin embargo, al mis-
mo tiempo, no debe incluirse información inocua, como el procesador de textos utilizado
para preparar un cuestionario. La sección del método suele diviillrse en los subapartados
"Diseño", "Participantes", "Materiales y equipo" y "Procedimiento".
Diseño. El subapartado "Diseño" contiene, obviamente, los detalles acerca del diseño uti-
lizado en la investigación. Es necesario informar al lector cuáles fueron las variables inde-
pendientes y las dependientes y si se usó un diseño entre sujetos, de sujetos igualados,
intrasujetos o mixto. Sin embargo, en el caso de los diseños correlativos no se requiere
hablar de las VI y de las VD, a menos que se haya manipulado una de ellas, ni de las va-
riables entre o intrasujetos. En esa sección también debe incluirse alguna justificación re-
ferente a ciertos aspectos del diseño. Por ejemplo, si en un experimento sobre la memoria
se introduce una actividad entre la fase de presentación y la de recuerdo para evitar que el
sujeto repase la primera, se explicará por qué. En pocas palabras, la sección "Diseño" sirve
para indicar por qué se pidió a los participantes que hicieran lo que hicieron, mientras que
en "Procedimiento" se pormenoriza lo que se les indicó y lo que realizaron.
Si el investigador efectuó alguna prueba piloto, lo cual recomiendo encarecidamente,
resulta más claro si la menciona en una subsección, o "Estudio piloto", de la sección de di-
seño. En ella se incluirán los detalles usuales de los participantes (véase más adelante) y
una referencia breve a las modificaciones hechas a la luz del estudio piloto. Ello reviste
importancia particular si el estudio se relaciona con la creación de una medida, como un
cuestionario. Es necesario convencer al lector de que se ha intentado, como mínimo, estu-
diar la validez patente de la medida.
El consejo formal sería señalar el nivel alfa que se aplicará a las pruebas estadísticas,
mas en la práctica ello se realiza pocas veces.
Participantes. En el pasado, los participantes se llamaban sujetos. Estamos en un periodo
de transición entre esa postura, la cual parece implicar que las personas son objetos de estu-
dio, y una nueva en que se les considera más semejantes a los investigadores. Por tanto, al-
gunos psicólogos hablan de sujetos y otros de participantes. Debe elegirse un término y
apegarse a él en todo el informe. Los lectores desean conocer la representatividad de la mues-
tra y tener una idea de hasta dónde se generalizan sin riesgos los hallazgos. Es necesario
------------------------~C~ó~m~o~p~r~e~se~n~t~ar_l_a_i_nv_e_s_n~g_ac_i_ón________________-J¡:377
•
J78l~ _______________l_n_ve_s_ti~ga_c_io_'n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
exponer las estadísticas inferenciales utilizadas en el estudio. Si se desea incluir los datos
crudos (es decir, los de cada participante, sin analizarlos ni resumirlos), se colocarán en un
apéndice y ha de remitirse a él al lector.
Prefiero las tablas de estadísticas resumidas exactas, como medias y desviaciones es-
tándar, y representaciones gráficas, aun cuando en algunas publicaciones eso está prohibi-
do y se pide a los autores utilizar unas u otras, pero no ambas. Las prefiero porque las
tablas presentan las cifras exactas, mientras que las gráficas dan una impresión más inme-
diata de los resultados.
Se debe informar respecto al tamaño del efecto, cuando lo haya, y dar la versión par-
ticular, por ejemplo, la d de Cohen, pues puede existir más de una medida para el tamaño
del efecto en el mismo tipo de datos. No han de presentarse ecuaciones directamente en el
texto sino en un apéndice o en una nota de pie de página.
Es necesario numerar y rotular cada tabla y figura. Según cierta convención, todo lo que
no es una tabla constituye una figura. Debe señalarse qué unidades se utilizaron en las me-
didas. Por ejemplo, ha de indicarse que la tabla presenta las medias y las desviaciones es-
tándar del número de palabras recordadas. Las tablas y las gráficas serán autosuficientes
en lo posible, en lugar de forzar al lector a que consulte el texto para comprender el signi-
ficado del apoyo gráfico. De la misma manera, se evitarán descripciones como grupo J
si puede indicarse recuerdo inmediato. Sin embargo, si la descripción del grupo resulta de-
masiado complicada, conviene incluir una leyenda o, en el último de los casos, remitir a
la parte del texto donde se halla la explicación respectiva.
No es necesario explicar los resultados en esta sección. En el caso de las estadísticas des-
criptivas, basta una frase como la media y las desviaciones estándar de las palabras recorda-
das por los grupos inmediato y demorado se muestran en la tabla J y en la figura l.
Sugiero que, al presentar estadísticas inferenciales, se brinde información en tres eta-
pas. En primer lugar, debe precisarse qué prueba se utilizó y qué se analizó. Por ejemplo: Se
usó una prueba t entre sujetos para comparar la capacidad de recuerdo de los participan-
tes a quienes se pidió recordar después de JO minutos. En segundo lugar, se indicará con
palabras lo que muestran los resultados. Por ejemplo: Las personas a quienes se pidió que
recordaran inmediatamente recordaron muchas más palabras que aquellas a quienes se
pidió recordar después de JO minutos. Finalmente, han de exponerse las pruebas de la afir-
mación; por ejemplo: (t(IS) = 2.48, p = O.OJ3, prueba de una cola). Se especificará la
versión de la prueba aplicada y, cuando sea apropiado, se mencionarán las variables inde-
pendientes y las dependientes. No basta decir que se realizó una prueba t con los datos.
Si se utilizó un programa estadístico que produjo la probabilidad exacta para el resul-
tado, se indicará ésta. Si, por otra parte, el investigador se apoyó en tablas estadísticas, seña-
lará la probabilidad con toda exactitud. Por tanto. si la probabilidad está entre dos niveles
tabulados. debe presentarse el intervalo de valores posibles; por ej emplo, 0.01 < p < 0.05.
Ello dice más a los lectores que " < O 05. pues ya saben que p es mayor que O Ol .
p:aa
__________________________c_ó_m_o_p~r_e_se_n_t_ar__
la_i_n_ve_s_ti~g_
ac_i_
ón________________~¡-J79
• prueba concreta es apropiada o no, debe informarse sobre los resultados correspondientes;
por ejemplo, si el investigador evaluó la homogeneidad de varianzas antes de aplicar
una prueba t. De manera similar, si transforma los datos, como con una transformación
arcoseno, especificará ese procedimiento. En el capítulo 14 se estudia la transformación de
éste. Asimismo, si se utiliza un procedimiento estadístico en que se dispone de varias deci-
siones, se detallarán las tomadas. Por ejemplo, en el análisis factorial puede elegir cómo se
identificarán los factores.
Según una de las convenciones para informes escritos, el investigador debe dar la im-
presión de ser un científico imparcial que deja a las cifras decidir si su hipótesis es válida.
Así, evitará dañar esa impresión con frases como Por desgracia, los resultados no fueron
significativos. También los resultados no significativos proporcionan información ..
Si el investigador obtuvo un resultado no significativo, recomiendo realizar un análi-
sis de poder. Ello le permitirá calcular el poder estadístico de la prueba, por el tamaño del
efecto obtenido y el de la muestra utilizada. El lector del informe podrá distinguir así la
posibilidad de que se haya cometido un error tipo Il. Si el poder fue de menos de 0.8, su-
giero calcular el tamaño de la muestra que se requeriría para obtener uno de 0.8 con el mis-
mo tamaño del efecto. De esa forma, el resultado se contextúa. Si el tamaño del efecto es
inferior a lo que Cohen (1988) consideraría pequeño y fuese necesaria una muestra muy
grande para obtener un poder de 0.8, el investigador deberá preguntarse si vale la pena re-
plicar el estudio sin modificarlo. Por otra parte, si el tamaño del efecto fue pequeño, media-
no o incluso grande y el poder fue bajo, parecería razonable recomendar la repetición del
estudio con un tamaño adecuado de la muestra.
El análisis y la conclusión
En la parte "Análisis y conclusión" se pretende ubicar los resultados en el contexto de la
investigación referida en "introducción". Además, podrían mencionarse por primera vez
otros trabajos que ayuden a explicar los resultados. También cabe sugerir modificaciones o
mejoras con las cuales la investigación tendría mayor alcance. Debe evitarse exagerar las
críticas hacia ella . Al parecer, algunos estudiantes consideran ésta una oportunidad para
la autohumillación pública y para encontrar fallas donde r :> , a~ . :-
•
luii¡I.UIIW_,.UIIU _ _ __
~L________________In_v_e_st~ig~a_c_ió_n_c_u_a_n_ ta_t_iv_a_e_n~p~s_ic_o_lo~g~ía______________________
ti_
Recomiendo el orden siguiente para la sección: puede comenzarse con un breve resu-
men de los resultados. No deben mencionarse la probabilidad ni el tamaño del efecto sino
sólo qué dirección tomaron los resultados y si fueron estadísticamente significativos o no.
En seguida, han de ubicarse los resultados en el contexto de las investigaciones anteriores.
Si siguen la misma línea que los de éstas, bastará señalar que confirman el trabajo de los
autores citados en "Introducción". Si los contradicen, se tratará de explicar ese hecho. En
esta parte, el psicólogo podría desear criticar su propio estudio, en particular si obtuvo re-
sultados no significativos y el poder estadístico fue bajo. Se evitará el uso de frases poco
convincentes como Si se hubiera usado una muestra más grande, podlian haberse obteni-
do resultados estadísticamente significativos. Como quedó demostrado en el capítulo 13,
esto casi siempre es cierto, por lo cual carece de importancia. Conviene ser más específicos
y recomendar un tamaño de muestra concreto basado en cálculos de poder. Ello podría re-
velar sí vale la pena tratar de obtener el mismo efecto o si se ha de modificar el diseño para
aumentar el tamaño del efecto. Si el científico confia en que sus resultados son el produc-
to de un trabajo bien diseñado y realizado, indicará las implicaciones teóricas de éstos. Fi-
nalmente, deberá recomendar la realización de investigaciones futuras relacionadas con la
suya, pero sin entrar en el ámbito de la fantasía. Ciertamente, puede analizarse toda suerte
de aspectos sobre la memoria, si éste es el tema de la investigación, pero el investigador in-
tentará formular sugerencias apoyadas en sus resultados.
Si el investigador presenta en un solo documento el informe de más de un estudio (por
ejemplo, de una serie de experimentos), lo más usual es redactar una sola introducción con
una sección de método, resultados y análisis para cada estudio. A esas secciones habrá de
seguir un análisis general.
La bibliografía
Quizá la institución a que pertenece el investigador tiene un estilo propio para citar la bi-
bliografía. Sin embargo, el más utilizado en las revistas y en los libros de psicología es el
conocido como método Harv01·d. * Éste muestra disimilitudes ligeras en cuanto a la presen-
tación de referencias de libros, capítulos o artículos. En los tres casos, se indica primero el
nombre o nombres del autor o autores en el orden siguiente: apellido e inicial del o de los nom-
bres del primer autor; después el o los de los demás autores. Se menciona luego el año de
publicación, entre corchetes, asegurándose de que, en el caso de los libros, se especifique
el año de la edición utilizada en la investigación.
En el caso de las revistas científicas, se indica a continuación el nombre del artículo y
el del medio (en cursiva o subrayado), el volumen, la parte (si la hay) y finalmente las pá-
ginas que abarca el artículo.
• Otro método para presentar la bibliografia (el más usado en español) es el seguido en la sección corres-
pondiente de este libro.
_________________________C_
ó_m_o~p_re_s_e_
nt_a_r_la_l_
·n_ve_s_tl~
·g_
ac_io_'n________________~~
Por ejemplo:
Smith, E. (1974). The effect ofhunger upon the perception ofthe size offood. British
Journal of Nutritional Psychology, 17, 3, 27-35.
En el caso de los libros, se indica el título (subrayado o en cursiva), con la primera letra de
cada palabra en mayúscula, seguido de la edición, si ésta no es la primera, el lugar de pu-
blicación y el nombre de la editorial. Por ejemplo:
Brown, A. (1975). Choice Reaction Times Made Simple (2a. ed.). Londres: University
ofNeasden Press.
Si se ha utilizado un libro escrito en colaboración, es decir, donde uno o más capítulos fue-
ron escritos por un autor diferente, se anota el nombre del coordinador o editor (Ed. o Eds. ).
Por ejemplo:
Iones, B. (Ed.) (1990). Children s Understanding ofLinear Algebra. Manchester: Uni-
versity of Stretford Press.
De citarse capítulos de un libro escrito en colaboración, se indica el título del capítulo, se-
guido del nombre del editor o editores, el título del libro (subrayado o en cursiva), el lugar
de publicación y el nombre de la editorial. Por ejemplo:
Kropotkin, P. (1990). Who needs linear algebra, anyway? En B. Iones (Ed.). Children s
Understanding of Linear Algebra. Manchester: University of Stretford Press.
Los apéndkes
En un apéndice se presentan datos relacionados con la investigación, los cuales tienen un
grado de detalle que puede afectar la fluidez de la lectura si se incluyen en el-texto princi-
pal. Por tanto, si el investigador creó una medida con varios ítemes, deberá poner en dicho
texto sólo algunos ejemplos y pedir al lector que consulte el apéndice. De manera similar, si
se quiere listar un programa de computadora o describir la parte de un equipo creado espe-
cialmente para el estudio, se colocará tal información en apéndices. Además, como se mencio-
nó, si se desea informar sobre los datos no analizados, éstos aparecerán en un apéndice.
Si el investigador tiene información de varios tipos, es útil .crear un apéndice para cada
uno de ellos, en lugar de aglomerarla toda en uno solo. De esa manera, podría ponerse la
lista de un programa informático en un apéndice y los datos crudos en otro. Para el lec-
tor es útil localizar rápidamente el material, en particular si el informe tiene una tabla de
contenido.
Metaanálisis
En el capítulo 22 se detalla cómo presentar los resultados del metaanálisis. En éste, los datos
derivan de las investigaciones de otros profesionales. En cierto sentido, la población la
J84l~ _______________l_nv_e_s_ti~ga_c_io_·n_c_u_a_nt_it_a_ti_v_a_e_n~p_si_co_l_og~í_a____________________
constituyen todos los artículos referidos al tema del análisis, mientras que la muestra incluye
los artículos comprendidos en la versión final de éste. El psicólogo explicará cómo identi-
ficó su población, con el señalamiento, por ejemplo, de las bases de datos utilizadas. Pos-
teriormente, debe exponer de manera explícita los criterios atendidos para seleccionar la
muestra; es decir, las características de los estudios satisfactorios e insatisfactorios. Además,
pormenorizará sus intentos de incorporar estudios insatisfactorios en la muestra; para ello, por
ejemplo, deducirá estadísticas inferenciales a partir de datos de resumen, usará reglas prác-
ticas para cuantificar ténninos como significativo o escribirá a los autores para tener mayor
información.
Como el objetivo de un informe académico es permitir que el estudio se reproduzca,
conviene presentar, en una tabla incluida en un apéndice, todos los trabajos tomados en
cuenta e identificar los que se utilizaron en el análisis. También se incorporarán tablas con
las estadísticas derivadas de estos últimos, complementadas con el tamaño de la muestra y la
orientación de los resultados; es decir, si éstos apoyan o no cierta hipótesis.
El metaanálisis se encuentra aún en sus primeras fases de desarrollo, por lo cual se es-
pera que el investigador exponga de forma más explícita sus decisiones estadísticas, como
el haber ponderado los estudios con base en el tamaño de la muestra, y la técnica utilizada
para convertir los resultados en una estadística estándar. Además, es común que los auto-
res citen libros sobre el metaanálisis para justificar sus decisiones.
Presentación verbal
Igual que sucede con los otros tipos de presentación, el estilo que el expositor adopte en la
verbal depende de su público. En el caso de uno académico, se aplican muchos principios
del artículo para publicaciones de ese tipo, mientras que para una concurrencia no acadé-
mica se toma más adecuado un modo predominantemente periodístico. , '-' obstante, cabe
recordar que una presentación verbal es un medio temporal: una vez que el e>-, 0sitor ha di-
cho algo, la audiencia recurrirá a su memoria para acceder a la información, a menos que
haya tomado notas suficientes. Por tanto, la presentación tendrá un ritmo que permita a los
oyentes procesar lo que se les indica y no sobrecargar su memoria. Además, éstos no pueden
consultar un diccionario. Por ello, el expositor estará más dispuesto a explicar sus térmi-
nos, incluidas las abreviaturas.
Una limitación clara es el tiempo de que se dispone. El expositor debe investigar si ha
de incluirse un periodo para preguntas y, si es así, de cuánto.
Preparación de la expos;dón
Ciertas personas realizan sin notas sus exposiciones, si bien ésta es una habilidad poco
común. Otras sólo preparan y usan notas. Y algunas más preparan una versión completa de
la exposición, la cual leen ante el público. Le recomiendo que, a menos que esté seguro
__________________________C_ó_m_o~pr~e~se~n~t~a_r~la~i~n_ve~s~tl~·g~ac~i~ón~--------------~~
de poder efectuar la primera de dichas actividades, no haga ninguna. Sugiero que comience
por escribir una versión completa de la exposición para perfeccionar sus argumentos y
presentar una historia coherente. Además, ello permite que los expositores experimentados
sepan si la alocución cabe en el tiempo asignado y que los inexpertos calculen el tiempo de
su presentación.
Posteriormente, sugiero tomar notas de la versión completa de la exposición; servirán
en su oportunidad como ayudas nemotécnicas. Ha de usarse el mínimo de notas y de ase-
gurarse, no obstante, que bastan, para lo cual se releerán después de cierto tiempo. Por basar
la exposición sólo en las notas, el expositor se ve obligado a reelaborar los enunciados cada
vez que presenta el material, dando una imagen de naturalidad. Es necesario espaciar de
modo adecuado las notas, dar sangría a los puntos importantes y colocar las listas de forma tal,
q · ....ada nuevo ítem esté en una línea nueva. Así, el expositor puede encontrar con mayor
rapide~arte que busca y no depende demasiado de las notas para decir lo que debe.
También suelo marcar en mis notas la parte donde va un apoyo gráfico, digamos una trans-
parencia.
Algunos utilizan tarjetas para sus notas; y otros, hojas tamaño carta o A4. Todo ello po-
dría parecer una organización excesiva, pero cuanto mejor preparado esté el expositor, tanto
más natural parecerá su intervención. Una ventaja adicional de preparar la versión comple-
ta de la presentación es que ésta se hallará disponible si alguien necesita copia.
Si se presenta un artículo en un congreso, generalmente se pide una síntesis de la ex-
posición. En el congreso puede repartirse un folleto con los títulos de las síntesis y de las
exposiciones, de manera que los asistentes puedan decidir a cuáles desean asistir; el folleto
también sirve como un registro completo del congreso. Además, para que un artículo se
acepte en un congreso, quizá se pida al autor una versión ampliada de la síntesis, la cual
evaluarán un comité o varios jueces, del mismo modo que un artículo para revista.
Cómo exponer
El expositor desea que el público comprenda lo que dice, pese a las limitaciones de la si-
tuación. Una manera de lograrlo consiste en presentar el mismo material más de una vez,
con diferentes grados de detalle, de forma semejante a un noticiario: primero, los encabe-
zados; en seguida, los pormenores de la información; y para concluir, un resumen de los
puntos principales. Otro método se describe en ocasiones como indicar al público lo que
se le dirá, referírselo y señalarle lo que se le ha comentado.
Una manera de aumentar al máximo la posibilidad de que se comprenda la presenta-
ción consiste en mantener el interés. Líneas arriba recomendé usar notas para conseguir que
la exposición resulte más natural y establecer empatía con el auditorio. Sin embargo, algunos
leen las versiones completas de sus artículos ante el público, lo cual tiene muchas desven-
tajas. Primera, la voz que utilizan al leer difiere de la empleada en una conversación, pues
la primera es menos dinámica. Segunda, quienes leen dedican mucho más tiempo a mirar las
J86l~ _______________l_nv_e~s_ti~ga_c_io_·n_c_u_a_nt_it_a_tl_·v_a_e_n~p_si_co_l_og~í_a____________________
hojas de su escrito. Ello significa que la voz no se proyecta adecuadamente y que el con-
tacto visual con el público disminuye.
Si el investigador piensa leer así su artículo, deberá preguntarse por qué. La única jus-
tificación que se me ocurre es que cada frase escrita debe exponerse literalmente y que
cualquier paráfrasis arruinará el significado. Ello pocas veces ocurre así. Si el expositor
piensa que olvidará algún punto importante, realizará todos los preparativos descritos y ten-
drá a la mano la versión completa como último recurso. Si de cualquier modo ha de leer la
exposición, usará letra grande, suficientemente negra y espaciada para que pueda ver con
mayor frecuencia al público y sin perder el ritmo. Quizá convenga emplear un atril. Sin im-
portar cuán breve sea una exposición, no hay que tratar de memorizarla y reproducirla li-
teralmente, pues tal método también carece de naturalidad.
Mantener el interés del público implica, en parte, centrar su atención en lo que se dice.
Por ello, el expositor estará consciente de su lenguaje no verbal. Es necesario mantener el
contacto visual con el auditorio sin concentrarse en una sola persona, pues ello la inco-
modaría y excluiría a las demás. Sin embargo, el expositor no debe sorprenderse si aun sus
conocidos muestran un rostro más pasivo que el que tendrían en una conversación; el papel
del público es pasivo. El expositor no ha de quedarse parado como estatua, pues parecerá
incómodo e inquietará al público. Mejor utilizará en cierta medida los gestos, pero no al
grado de que éstos se vuelvan distractores; asimismo, evitará jugar con bolígrafos, llaves
o partes de su atuendo. Si está nervioso, recuerde que una hoja de papel amplifica incluso
un temblor mínimo, por lo cual podría suponer una ventaja usar taijetas de notas en las pre-
sentaciones. Asimismo, intentará permanecer en una sola área en lugar de moverse por
todas partes.
Ilustración de la exposición
El expositor tendrá en cuenta que está hablando; por lo mismo, si presenta alguna otra cosa
al público, ésta podría distraerlo y hacer que pierda de vista lo que dice.
Folletos
Si se entrega al público un folleto con texto, antes o después de la exposición, lo más se-
guro es que lo lea. De igual forma, si se le proporcionan imágenes, las verá. En ambos casos,
no se tiene control sobre el momento en que las personas revisarán el folleto. Conviene
pensar en la función de éste. Si es una forma de que la concurrencia evite tomar notas, se
le dirá, antes de iniciar la exposición, que al fmal recibirá un folleto completo. Si se desea
proporcionar una estructura que ayude en el proceso de toma de notas, lo más adecuado
consiste en repartir un folleto que contenga sólo encabezados y subencabezados, con espa-
cios suficientes para tomar notas y no perder tiempo buscando en él. Puede incluirse una
lista de referencias al final del escrito.
__________________________C_ó_m_o~p~r_e_se_n_t_ar__
la_i_nv_e_s_ti~g_ac_i_ón________________~¡:i87
Accesorios audiovisuales
Solía haber una regla para los actores: no trabajar con niños ni con animales, pues son im-
previsibles y pueden echar por tierra la actuación. Se afirmaría lo mismo respecto al uso
de algunas formas de tecnología, como un proyector de transparencias o de diapositivas de
35 mm, un videorreproductor o una computadora. Existen dos reglas generales para todo
ese equipo: el expositor no debe dar por hecho que lo tendrá a su disposición sino que pre-
.. guntará con anticipación; y, aun si dichos aparatos están disponibles, no hará que la presen-
li tación dependa de ellos al grado de que si fallan, ésta se arruine. Es necesario tener planes
i de contingencia y no dejarse abrumar por algún error.
1 A pesar de sus riesgos, Jos accesorios audiovisuales pueden representar una ventaja
i si se usan juiciosamente. Ello se debe a que una imagen, en particular si tiene movimien-
1 to, suele convencer más y comprenderse con mayor facilidad que su equivalente en pala-
t bras, así como a que en una exposición prolongada añaden variedad y ayudan a mantener
la atención del público. Asimismo, por brindar información en más de un medio, se favo-
r rece la retención de los detalles.
Proyectores de transparencias. Los proyectores de transparencias son muy útiles, pues
permiten que el expositor realice un esbozo de su trabajo y presente una lista de temas, ci-
tas largas y gráficas e imágenes. Sin embargo, no conviene usarlos en exceso. No tiene ca-
so efectuar mediante un proyector toda la exposición.
Preparación de las transparencias. Deben dejarse márgenes amplios en los cuatro lados
de las transparencias, pues no todos los proyectores tienen el mismo espacio para colocar-
las. Se aconseja no incluir demasiados detalles y evitar imágenes muy pequeñas o borro-
sas. Si éstas se dibujan sobre la marcha con plumones, elabórese antes un borrador en una
hoja de papel y utilícense marcadores permanentes en el acetato porque los plumones de
agua llegan a correrse, en especial en manos sudorosas. Pueden efectuarse fotocopias di-
rectamente en los acetatos, incluso en color. Sin embargo, si el expositor va a fotocopiar o
imprimir en acetatos, elegirá el tipo correcto de material: algunos de ellos se derriten con
el calor de las impresoras o de las copiadoras. Conviene preparar una transparencia intro-
ductoria para verificar la naturaleza de la proyección.
Presentación de las transparencias. Si es posible, el psicólogo deberá darse tiempo para
colocar la transparencia introductoria y revisar aspectos de la proyección, como que esté
388l~---------------l~nv~e~s~ti~ga~c~ió~n_c~u~a_nt_it_a_ti_va__e_n~p_si~co~l~og~í_a____________________
alineada con la pantalla y enfocada correctamente o que el espejo no oculte parte de la pro-
yección. Esto último puede verificarse sólo desde la perspectiva del público: si el espejo se
interpone entre éste y la proyección, el expositor debe colocar fuera del área tapada la parte
de la imagen que desea que se vea, si ello resulta factible. De presentar varios elementos
en la misma transparencia, una técnica eficaz consiste en tapar la parte que no se utilizará
todavía; de otra manera, la leerán antes de tiempo. Otro método radica en sobreponer dos
o más transparencias (por ejemplo, si se construye una imagen paso a paso). Si se utiliza
tal sistema, a cada una de éstas se colocará cierta marca de referencia que permita alinear-
las todas.
El expositor no debe pararse frente a la pantalla ni dar la espalda al público para indi-
car alguna parte de la transparencia; en cambio, ha de señalar esta misma. Evitará colocar
cierta transparencia y abordar un asunto ajeno a ella; hablará acerca de su contenido, pues
lo contrario revestirá el mismo efecto distractor de un folleto y la audiencia tendrá que
elegir entre concentrarse en lo que se dice o en el contenido de la imagen. Si una transpa-
rencia muestra una gráfica o tabla, particularmente si ésta es complicada, o si se utilizan
convenciones poco usuales, habrá de explicarse el contenido y señalarse partes concretas
de la transparencia mientras se hace. Las gráficas y las tablas constituyen formas de abs-
tracción que, como otros medios de presentar cifras, el lector ha de traducir.
Se intentará mantener en orden las transparencias tras usarlas. Quizá alguien desee re-
ferirse a una de ellas en la sesión de preguntas y respuestas y así se facilitará encontrarla;
tal vez el expositor y quien pregunta recuerden el contenido, pero si la transparencia no se
proyecta de nuevo, el resto del público puede perderse mientras esas dos personas hablan
acerca de ella.
Si hay aspectos de la investigación relativamente importantes para la exposición, pero
el psicólogo ha tenido que resumirlos al grado de que podría preguntársele acerca de los
detalles, le convendría tener preparada una transparencia extra que simplifique su explica-
ción de los pormenores durante la sesión de preguntas. En ocasiones, los científicos indi-
can durante su intervención que en ese momento no pueden tratar a profundidad algunos
temas, pero que volverán a ellos en las preguntas y respuestas.
Diapositivas de 35 mm. Le aconsejo evitar en lo posible el uso de diapositivas de 35 mm,
en particular si ha de comunicarse con otra persona encerrada en un cubículo situado en el
extremo opuesto de la sala para controlar el proyector. Hoy día pueden elaborarse transpa-
rencias en color perfectamente eficaces y los proyectores respectivos son mucho más co-
munes que los de diapositivas. He perdido la cuenta del número de exhibiciones en que tal
dispositivo ha fallado y dejado con ello al expositor sin imágenes para ilustrar la charla o
con una proyección tan desenfocada que sería mejor no tenerla. Otro riesgo con las diapo-
sitivas es que pueden colocarse de diferentes formas en el proyector, incluso de cabeza
o al revés, como la imagen de un espejo.
_________________________c_ó_m_o~p_re_s_
e_nt_a_r_la__
in_ve_s_tl;·g_ac_io_·n________________~~
Ensayo de la presentación
Sin importar el medio por el cual se presentará el informe de una exposición, es dificil que
el autor permanezca en segundo plano y tenga una visión independiente del contenido. Una
vez preparado éste, se pedirá a una persona menos relacionada con él que lo lea. Única-
mente deberá explicársele la naturaleza del público respectivo, sin dársele más datos. É-sta
constituye otra de las ventajas de preparar una versión completa de una exposición verbal.
En cuanto a la modalidad mural, conviene que la persona la vea antes de leer la versión
completa. La presentación verbal, en particular si el encargado es novato, habrá de reali-
zarse ante una audiencia reducida. En todos los casos, los comentarios de los oyentes o de
los lectores resultarán invaluables para incrementar la calidad del trabajo.
__________________________C_ó_m_o~p_r_es_e_n_ta_r_l_a_i_nv_e_s_ti~ga_c_io_
' n________________~¡-391
Resumen
Hay diversas maneras de presentar un informe de investigación. El científico debe conocer
las convenciones y las limitaciones de la forma elegida y del probable público. Un informe
escrito para publicarse en una revista académica reunirá detalles suficientes para que el lec-
tor identifique el valor de los hechos respectivos y reproduzca los elementos importantes
del trabajo. Por otra parte, una presentación verbal incluirá menos pormenores para favo-
recer la comprensión, en particular si hay una sesión de preguntas y respuestas.
- - - - l l l l tlllllf
Apéndices
~~···
'
1
Estadísticas descriptivas
- "x
X=~
11
394
~-----------------------------------------------------
__________________________E_s_ta_d_ís_ti_ca_s_d_e_sc_n~·p_ti_va_s________________~~
Esto es, se calcula la desviación de cada puntuación a partir de la media y se eleva al cua-
drado. Luego se suman las desviaciones al cuadrado y se divide el resultado entre el núme-
ro de puntuaciones menos l.
2 - 73.335
S - -14-
= 5.238
S = ).;2
S = ~5 .238
= 2.289
J96l~-----------------------A~p_én_d_ic_e_s___________________________
Como ignoramos las edades exactas de los integrantes de los grupos, Jo usual es tomar el va-
lor medio del rango de cada grupo. Por tanto, en el primer grupo hay 15 personas cuya edad
se considerará 20 + 29 ~ 24.5. El total de edades del grupo se calcula multiplicando el punto
2
medio del grupo por el tamaño de éste. Así, la edad total del primer grupo es 24.5 x 15 = 367.5.
Es necesario por ello calcular la edad total de todos los grupos y dividirla entre el tamaño
de la muestra.
Edad total
Medía
Tamaño de la muestra
4990
120
= 41.583 años
Es_ta_d_ís_t_ic_a_s_de_s_c_ri~pt_iv_a_s__________________~~
____________________________
Med;anas
En primer lugar, debe identificarse al grupo que contenga la mediana. Como hay 120 per-
sonas, ésta se halla entre la persona número 60 y la 61. Para encontrar en qué grupo se lo-
caliza, se crea lo que se conoce como frecuencia acumulativa.
1 20·29 15 15
2 30·39 45 60
3 40-49 30 90
4 50-59 20 11 o
5 60-69 10 120
En este caso, la mediana se halla entre el segundo y el tercer grupos. Puede calcularse obte-
niendo la media de la mayor edad posible del segundo grupo y la menor del tercero:
39 + 40
Mediana=
2
39.5 años
Sin embargo, si la mediana está en un grupo, el cálculo es diferente. En la tabla AI.5 se pre-
sentan los datos para los que la mediana se encuentra en un grupo: el de las personas de 40
a 49 años de edad.
1 20-29 14 14
2 30-39 44 58
3 40-49 32 90
4 50-59 20 110
5 60-69 10 120
én~d~k~e~s_____________________________
398lL----------------------~A~p~
= 40+(10x( 60~58))
= 40 + (10 X 0.0625)
= 40.625
• ____________________________
Es_t_ad_í_st_ic_a_s_d_es_c_ri~pt_iv_a_s__________________~~
• Fumadores
D No fumadores
216
grados
Figura Al.1. Grados de una gráfica de pastel necesarios para representar cierta
proporción de una muestra.
Orden Recuerdo
1 3
2 4
3 4
4 5
5 5
6 6
7 6
8 7
9 7
10 7
11 8
12 8
13 9
14 10
15 11
400lL_________________________A~p~é_nd~i~ce~s______________________________
La med;ana
La mediana se ubica en la puntuación n; 1
, donde n representa el número de puntuaciones.
Como en este caso se halla en la octava puntuación, la mediana es 7.
Lugar de la bisagra
Las bisagras se localizan en los percentiles 25 y 75. Su ubicación se calcula con la ecua-
ción siguiente:
Ubicación de la mediana + 1
Lugar de la bisagra
2
Si la ubicación de la mediana no es un número entero, hay que ignorar la parte decimal.
Por ejemplo, si la localización de la mediana ha sido de 8.5, en la ecuación anterior se
usará 8.
Lugar de la bisagra = ~ = 4.5
Por consiguiente, la bisagra inferior está entre la puntuación 4 y la 5 de abajo arriba y, por
tanto, es igual a 5. La bisagra superior se encuentra entre la puntuación 4 y la 5 de arriba
abajo y, debido a ello, es igual a 8.
Rango H
El rango H representa la diferencia entre la bisagra inferior y la superior; por consiguien-
te, es 8 - 5 = 3.
Bardas interiores
Las bardas interiores se calculan con la ecuación siguiente:
Barda interior inferior = bisagra inferior- (1.5 x rango H)
Barda interior superior = bisagra superior + ( 1.5 x rango H)
Por tanto,
Podemos ver que todas las puntuaciones están dentro de las bardas interiores y no tenemos
puntuación alguna que pudiese considerarse extrema. El programa estadístico SPSS, que
hemos utilizado para crear las figuras AI.2 y AI.3, emplea un procedimiento un tanto dife-
rente, pues coloca los bigotes en el valor mayor de la barda interior superior y en el menor
de la barda interior inferior. En este caso, 11 es el valor mayor y 3 el menor.
14
12
Vl
re
"O
re
....
"O 10
o
u
....Q)
Vl 8
....re
.o
re
-¡¡¡
c. 6
Q)
"O
o
....
Q) 4
E
•::J
z
2
o
Figura Al.2. Diagrama de caja del número de palabras recordadas.
Si la puntuación número 15 ha sido 25, valdría la pena calcular las bardas exteriores. Ob-
sérvese que, como el número de puntuaciones permanece igual, todos los valores calcula-
dos para el diagrama de caja también se mantienen sin cambios.
Bardas exterjores
Las bardas exteriores se calculan con la ecuación siguiente:
Barda exterior inferior = bisagra inferior- (3 x rango H)
Barda exterior superior = bisagra superior + (3 x rango H)
Por tanto,
Barda exterior inferior = 5- (3 x 3)
= -4.5 (lo cual no puede existir en este ejemplo)
4Q2lL_________________________A~p_én_d_ic_e_s______________________________
Por tanto, una puntuación de 25 (la número 15) estará fuera de la barda exterior y podría
tratarse como un posible extremo. El programa SPSS no muestra las bardas exteriores,
pero destaca los posibles extremos presentándolos en el diagrama de caja.
30
*15
"'"'
'O
"'o
'E
u 20
~
"'~
.o
"'a.
'¡¡j
Q)
'O
....Q)o 10
E
• ::J
z
OL-----------------------~------------------------~
Figura Al. 3. Diagrama de caja del número de palabras recordadas con un posible
extremo señalado.
IS
l
ii
z =
Se recomienda considerar p = 0.01 el nivel alfa; en otras palabras, z tendría que ser de al
menos 2.58 para suponer que la distribución está sesgada de manera significativa.
Curtosis
La medida más común de curtosis tiene dos versiones, una básica y otra ajustada. La pri-
mera es:
-.. Observe que constituye casi la misma que el índice de sesgo, excepto porque se eleva no al
cubo, sino a la cuarta potencia. En la segunda versión se resta 3 al primer índice de curtosis.
Eso se debe a que la versión original es igual a 3 cuando la distribución resulta mesocúrtica
(es decir, como la distribución normal, no es marcadamente alta ni plana). Cuando el índi-
ce ajustado produce un valor negativo, ello sugiere una distribución platicúrtica; un valor
positivo la sugiere leptocúrtica.
404lL_________________________A~p~én_d~ic~e~s______________________________
La prueba z de curtosis es:
re
z = (24
'J--;;
11
Muestreo e intervalos
de confianza para proporciones
--------------------------------------------------------~ 405
406lL________________________A~p_én_d_ic_e_s_____________________________
donde p "' la proporción de la muestra que afirmó que votaría por la Vía Derecha
1 - p = la proporción de la muestra que no dijo que votaría por la Vía Derecha
n = el tamaño de la muestra
La cifra de 1.96 se extrae de las tablas z (apéndice XIV). Ello indica que 2.5% de una po-
blación tendrá 1.96 desviaciones estándar o más por encima de la media de la población y
2.5% tendrá 1.96 o más desviaciones estándar por debajo de la media de la población. Por
tanto, el restante 95% de la población estará en un rango de 1.96 desviaciones estándar de
la media. Podemos confiar así, en un nivel de 95%, que el intervalo de confianza conten-
drá la proporción de la población (n).
En consecuencia, si 900 personas de una muestra de 2 500 afirmaron que votarían por
la Vía Derecha,
900
p
2500
0.36
l -p 0.64
n 2 500
y el intervalo de confianza del número de partidarios de la Vía Derecha en la población es:
re = 0.36-1.96 x ~
a
0.36x 0.64
0.36 + 1.96 X
2500
[023
o.36 ± 1.96 x fi5oo
0.36 ± 1.96 X ~0.000092
0.36 ± 1.96 X 0.0096
0.36 ± 0.019
0.341 a 0.379
Por ende, si la muestra se tomó de una población de 100 000, es probable que el número de
partidarios de la Vía Derecha en la población esté entre
0.341 X 100000 y 0.379 X 100000
es decir, 34 100 y 37 900
- - ·u
__________________ co_n_fl_·a_nz_a~p~a_r_a~p_ro~p_o_rc_io_n_e_s________~~
M_u_es_t_re_o_e_l_·n_te_N_a_l_os_d_e__
Margen de error
Podemos expresar el error estándar utilizado en un intervalo de confianza como un porcen-
taje o margen de error:
Obsérvese que el error se expresa como un porcentaje del total de la muestra y no de la sub-
muestra que apoya a un partido político dado.
1- 2500
Porcentaje de error ajustado 1.9 X
25000
l. 9 X .J]:Q.l
1.9 X ..JQ.9
).9 X 0.949
1.803%
Ello demuestra que cuanto mayor es la muestra en relación con la población, tanto menor
resulta el porcentaje de error. Esto no sorprende: cuanto mayor es la muestra, pueden espe-
rarse mejores estimaciones sobre los parámetros de la población. La conclusión lógica de
tal tendencia consiste en que no habrá error si se realiza un censo (si la muestra la consti-
tuye la población completa).
1
.1
408l~-------------------------A~p_én_d_ic_e_s______________________________
9 604
n = ( error) 2
donde el error es el margen .de error, expresado como porcentaje, que estamos djspuestos a
aceptar.
Por ejemplo, si deseamos un margen de error de 2%,
9604
n = 4
2 401
A mayor margen de error que estemos dispuestos a aceptar, menor tamaño de la muestra
necesitaremos.
Si la proporción de la muestra es menor o mayor que 0.5, el margen de error será me-
nor para el mismo tamaño de la muestra. Por tanto, la ecuación anterior garantizará que el
margen de error no resulte mayor que el requerido para el tamaño de muestra dado.
Debido a lo anterior, si usáramos los datos obtenidos acerca de los votos que obtendrá la
Vía Derecha, el intervalo de confianza estaría entre 0.341 y 0.379. Por tanto, la proporción
(p) más cercana a 0.5 sería 0.379 y la muestra requerida para un margen de error de 2%
sería:
38 4J6 X 0.379 X (1 - 0.379)
n = 4
M_u_
__________________ es_t_
re_o_e_l_n·_te_~
_a_l_
os_d_e__
co_n_fl_
·a_
nz_a~p~a_r_
a ~p_
ro~p_o_
rc_io_n_e_s________~~
9 041.55
4
0.36 X 0.64
IC = 0.36- 2.575 X 2500
a
0.36x0.64
0.36 + 2.575 X
2500
/o23
o.36 ± 2.575 x -v 2500
...
410lL----------------------~A~p=e'n~d~ic~e~s___________________________
111
Comparación de la muestra
con la población
------------------------------------------~
412l~-------------------------A~p_én_d_ic_e_s______________________________
De esta manera podemos calcular la probabilidad de que la media de una muestra dada pro-
venga de una población concreta.
Imagine que examinamos los IQ de 20 niños y que la media de IQ es de 90, con una
prueba de media de población de 100 y desviación estándar de 15.
90 - 100
(Jo]
z =
-10
3.354
= -2.98
_____________________C_
om
~pa_r_a_
ci_ó_
n _d_
e _la__m_u_
es_t_ra_c_o_n_l_a~p_o_
bl_a_
ci_ó_
n __________~~
Imaginemos que se aplica cierta prueba de matemáticas a 1O participantes; se sabe que és-
ta tiene una media de 6 en la población, cuya desviación estándar se desconoce. La media
de la muestra fue 7 y la desviacion estándar 1.247.
7- 6
(1.247]
t =
lfiO
0.3943
2.536
IC =
.
med1a de la muestra± z x l .{,;
(DE de la muestra J
donde el valor z depende del nivel de confianza que se requiere y n es el tamaño de la
muestra.
414l~-------------------------A~p_én_d_ic_e_s______________________________
IC (95%) = 7 ± 1.96x ~
"'J 300
7 ± 1.96 X 0.115
7 ± 0.226
7 - 0.226 y 7 + 0.226
o 6.774 y 7.226
.¡;;
. de la muestra ± t x ( DE de la muestra )
IC = med1a
7 ± 2.262 X 0.3943
7 ± 0.892
4.74
= 7±
3.873
= 7 ± 1.224
Los ejemplos de este apéndice se relacionan con el material estudiado en el capítulo 13.
416 L __ _ _ __ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ _ _ _ _ _ _ __ __ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __ __ _ _ __ _
--;:::"'111'
Para ello, necesitamos saber qué valor z podría habemos dado un nivel de significación
de una cola de 0.05. De consultar las tablas z del apéndice XIV, encontraremos que z es
1.645. La versión apropiada de la prueba z es:
xc ~ media de la población
z
(DE de !~oblación)
donde xc (que se calcula más adelante) es la media crítica de la muestra que daría una z de
1.645 y n es el tamaño de la muestra.
La ecuación anterior se usa cuando la predicción consiste en que la media de la mues-
tra será mayor que la de la población. Cuando la predicción estriba, como en el presente
caso, en que la media de la muestra será menor que la de la población, se utiliza la ecua-
ción siguiente:
media de la población ~ xc
z
(DE de !~oblación)
por tanto,
= 100~xc
1.645
( 15 \
lF20)
Mediante operaciones algebraicas, podemos calcular que xc es
15
=> 1.645 X r:::: = 100- XC
-y 20
15
=> 1.645 X C::: - 100
-y 20
Segunda etapa: calcular el nivel ~ (la probabilidad de cometer un error tipo II).
Para ello, calcularemos el valor de z que nos daría el nivel ~:
(Fo)
1.336
_______________________P_od_e_r_d_e_l_a~p_ru_e_b_a_z_e_n_u_n_s_o_lo~g~r_u~po______________~~
donde z~ es el valor z que dará la probabilidad de un error tipo II (en este caso, p = 0.2, lo
cual proporciona un poder de 0.8)
za es el valor z que proporciona el nivel a (en este caso, una probabilidad de una
cola de 0.05)
d es el tamaño del efecto que deseamos detectar
Por tanto,
2
= (0.8415+1.645)
n 0.667
= 13.897
Ello significa que para la persona más cercana, necesitamos una muestra de 14 individuos
para alcanzar un poder de 0.8.
V
Transformación de datos
y pruebas de bondad del ajuste
Transformación de datos
Cuando los datos no están distribuidos normalmente o los niveles de una variable indepen-
diente (VI) no tienen una varianza homogénea, no conviene usar una prueba estadística
paramétrica. Sin embargo, en ocasiones pueden transformarse los datos para que la distri-
bución sea más normal o que las varianzas estén más cerca unas de otras. Además, si al exa-
minar.la relación entre dos variables (datos bivariados) parece haber una relación entre
éstas, pero es no lineal, cabe transformar alguna para producir una relación más lineal. Para
transformar los datos se aplica la misma fórmula matemática a cada valor del conjunto. El
lector podría pensar que con esto se manipulan los datos para obtener el resultado que se
quiere. Empero, si con la transformación se busca poner los datos de manera que permita
practicar una prueba paramétrica o lineal, es del todo legítima. Lo ilegítimo estriba en rea-
lizar una transformación, efectuar una prueba estadística con los datos y llevar a cabo des-
pués otra transformación si los resultados no tienen significación estadistica.
Para demostrar que todos usamos transformaciones aun sin darnos cuenta, pensemos en
las medidas que podríamos tomar si estuviésemos interesados en el desempeño de varios
corredores. Podríamos medir el tiempo que les toma recorrer cierta distancia y la que reco-
rrieron en un tiempo determinado e incluso su velocidad, que es la distancia dividida entre
el tiempo. Si convertimos los datos del tiempo en velocidad, habremos realizado una trans-
formación de los datos.
420
11 11
_________________~_r_a_ns_f_or_m_a_c_io_
·n_d_e__d_at_o_s~y~p_r_ue_b_a_s_d_e_b_o_n_d_ad__d_el_a~j_u_st_e______~~
Todas las transformaciones sugeridas pueden llevarse a cabo mediante una calculadora
científica o una computadora.
Datos un;var;ados
Sesgados negativamente. Si la distribución está sesgada negativamente, como la de la
figura AV.l, una posibilidad radica en elevar los puntos de los datos por un valor (.xll), en
tanto a sea mayor que 1; por ejemplo, podríamos elevar al cuadrado todos los puntos de los
datos. De otra forma, podríamos elevar un número a la potencia de cada punto de los da-
tos; por ejemplo, 10X, es decir, elevar 10 a la potencia de cada dato, o eX, lo cual implica
elevar el número e (2.718) a la potencia de cada dato.
20
"'e:ro
o
"'~
c.
~ 10
e
QJ
E
n
•::l
m-miT
z
o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Número de palabras recordadas
Figura AV.1. Distribución sesgada negativamente.
Elevamos al cuadrado cada número de palabras recordadas para producir una distribución
más simétrica:
20
"'e:ro r
o .---
~ r-
QJ
c. r- r-
~ 10
....oQJ
r-
E
liT n
•::l
z
o
16 142 269 396 522 649 776 902
79 206 332 459 586 712 839
Número de palabras recordadas elevado al cuadrado
Figura AV.2. Distribución sesgada negativamente después de ser transformada.
~~-------------------------A~p_é_nd_i_c_es________________________________
20
V> r-
<O 1-
e:
o
.... -
-
V>
(1)
a. r-
f-
(1)
"O 10
o -
.... f-
E
(1)
- r-
. ::;¡
z
-.-
-
ITlllim
-
o
0.5 4.5 8.5 12.5 16.5 20.5 24.5 28.5
2.5 6.5 10.5 14.5 18.5 22.5 26.5 30.5
Número de palabras recordadas
Recíprocos. Pruebe .=!.,-lo..::!... Sin embargo, como no es posible dividir entre cero, uti-
x2 x .¡;
!izaremos una transformación inicial que haga que los puntos de los datos sean diferentes
de cero antes de tomar un recíproco; por ejemplo, sumando 1 a la puntuación de cada per-
sona.
Logaritmos. Pruebe log 10(x) -logaritmo de base 10-- o In (x) -logaritmos naturales o
neperianos- . Si algún punto de los datos es negativo o igual que cero, podemos sumar un
número fijo a cada punto de los datos para que todos sean superiores a cero. De esa mane-
ra, si la puntuación negativa más alta en una serie de datos fue de -4, sume 5 a todas las
puntuaciones y tome el logaritmo del resultado.
Raíces (potencias fraccionarias). Pruebe ·.¡; o particularmente si los valores son inferiores
de la varianza. Si no funcionan, pruebe la raíz cúbica (es decir, J.{; o xt). Tras probar varias
transformaciones, encontramos que ~palabras recordadas+ 0.5 produjo una distribución más
simétrica.
"111
__________________~_r_an_s_f_or_m_a_c_i_o'n__d_e_d_a_t_o_s_y~p_ru_e_b_a_s_d_e_b_o_n_d_a_d_d_e_l_a~ju_s_te________~~
20
"'e
"' ,-
o
¡:;
(IJ f-
c.
(IJ
-o 10
e(IJ
f- ,-
E
n T 11-m
. ;:¡
z
o
o. 71 1.38 2.04 2. 71 3.38 4.04 4. 71 5.38
1.04 1.71 2.38 3.04 3.71 4.38 5.04
Curtosis. Cuando los datos son proporciones o porcentajes pueden producir una distribución
leptocúrtica (con la sección media alta y angosta) . En ese caso, ensaye 2 x arcoseno (E) (en
las calculadoras, el arcoseno aparece a veces como sin- 1).
Datos bivariados
Al observar la correlación entre dos variables, en la correlación producto momento de Pear-
son se supone que la relación es lineal (que forma una línea recta). Por tanto, quizá debamos
transformar los datos si tienen una pauta no lineal.
Curva hacia arriba. Cuando la curva dt: la línea se inclina hacia arriba, como en la figura
1 -1
siguiente, se transforman los valores del eje vertical (y). Pruebe 'J Y, ln(y ), log1o (y) o -- .
y
100
o
80
60
o
;::.,
40
o
20 o
o
o o
o o o
o 2 4 6 8 10 12
X
-0.5
o 2 4 6 8 10 12
X
La estadística de esta prueba es D11 , el mayor valor que F0 F1 puede alcanzar para el ta-
... maño de la muestra n. En este caso,
-
D 120 = 0.15
Cálculo de la significación estadística de D11• En la tabla AXIV.18 del apéndice XIV se pre-
sentan los valores críticos que D 11 debe alcanzar o exceder para ser estadísticamente signi-
ficativa. En una muestra de 35, el nivel crítico de D 11 para p = 0.05 es 1.36 . En este caso,
.[n
6
1.3 = 0.124
f¡20
Debido a ello y a que 0.15 es mayor que 0.124, podemos decir que los datos difieren de
manera significativa de una distribución uniforme.
Tabla AV.2. Número de niños que se acercaron primero a una pintura concreta y la
cantidad esperada de acuerdo con la hipótesis nula (H0 ).
Klee 11 5
Picasso 5 5
Modigliani 3 5
Cézanne 4 5
Rubens 2 5
En la prueba x? se comparan frecuencias reales u observadas (fr) con las esperadas (fe)
-de acuerdo con la hipótesis nula-, para ver si difieren de manera estadísticamente sig-
nificativa, y se utiliza la ecuación siguiente:
Esto es, cada frecuencia esperada se resta a su observada, se eleva al cuadrado el resultado
y se divide entre la frecuencia esperada. El proceso se repite con cada categoría y se suman
todos los resultados. Por ende,
x2 = oI-5) 2 2 2 2
+ (5 - 5) + (3 - 5) + (4 - 5) + (2-5)
2
5 5 5 5 5
= 10
lfl
d_
_________________T_r_a_ns_f_or_m_a_c_io_'n_ d_ e__ at_o_s~y~p_r_ue_b_a_s_d_e_b_o_n_d_a_d_d_e_l~
aJ~·u_st_e________~~
Esta versión de la prueba x_l tiene grados de libertad iguales que el número de categorías
menos l. Por tanto, en este caso, gl = 5 - 1 = 4. Podemos buscar ahora el resultado en la
tabla de distribución de chi cuadrada del apéndice XIV. Con gl = 4, el nivel crítico de x2
para p = 0.05 es 9.49. Como el valor calculado de x2 excede tal valor crítico, concluiría-
mos que los niños s·e acercaron primero a distintas pinturas en una pauta significativamen-
te no aleatoria .
..
-
VI
Búsqueda de diferencias entre dos
niveles de una variable independiente
Pruebas paramétricas
La prueba t
Las diferentes versiones de la prueba t dependen de si el diseño es entre o intrasujetos.
Prueba t entre sujetos. En este ejemplo, los investigadores desean evaluar la eficacia de una
técnica terapéutica diseñada para liberar de la aracnofobia a los pacientes, a quienes se di-
vidió en dos grupos: experimental, que recibe la terapia; y control, que no la recibe. Se mide
la ansiedad mediante una lista de verificación de autoinforme.
428 L------------------------------------------------------
~;:;;;;..,..; _______________ _ _
;;;;..... - - - - --
• Búsqueda de diferencias entre dos niveles de una variable independiente ¡429
83 89
60 81
62 83
70 67
65 65
79 70
76 84
72 88
74 85
69 82
76 79
71 75
68 77
75 80
Tabla AVI.2. Medias, varianzas y DE del nivel de ansiedad del grupo de terapia y del
control.
Terapia Control
Media 71.5 79.5
Varianza 43 58.368
DE 6.557 7.64
Ec. AVI.l
=
(s::si)
XI -X2
t Ec. AVI.2
= - 3.553
Los gl de esta versión de la prueba t son (2 x n) - 2. Por tanto, en este caso serán (2 x 20)
- 2 = 38; de usar la ecuación AVI.l, serían (n 1 + n2)- 2.
En las versiones anteriores de la prueba t se supone que las varianzas de ambos grupos
son iguales (homogéneas). En el caso contrario, debe aplicarse otra versión de la prueba t.
Prueba t entre sujetos con heterogeneidad de varianza (varianzas independientes: prueba t
de Welch). Cuando las varianzas de las muestras de dos grupos difieren más de tres veces,
si los tamaños de la muestra son iguales (o si las varianzas de las muestras difieren más de
dos veces cuando los tamaños de las muestras no resultan iguales}, debe usarse una versión
de la prueba t en la cual las varianzas se tratan por separado y no se produce una varianza
conjunta estimada:
t = Be. AVI.3
Si los tamaños de las muestras son iguales en ambos grupos, la ecuación produce el mismo
resultado que la AVI.2 (presentada lineas arriba). Sin embargo, tiene su propio método para
calcular los grados de libertad, los cuales debemos conocer para comprobar si el resultado
es estadísticamente significativo. No obstante, para ahorrar tiempo, si no hemos obtenido
los gl con una computadora, es útil verificar si el resultado tiene probabilidades de tor-
narse estadísticamente significativo antes de calcular los gl. Como la nueva versión de los
grados de libertad nunca será mayor que los gl usuales de una prueba t entre sujetos, si el va-
lor t no es estadísticamente significativo con los gl usuales, tampoco lo será con la versión
modificada. De ahí que si el valor t no es estadísticamente significativo con gl = n 1 + n2 - 2,
se antoja innecesario calcular los gl modificados, a menos que se requiera una probabili-
dad más exacta.
• Búsqueda de diferencias entre dos niveles de una variable independiente I4J1
En el otro extremo de la escala, los gl modificados nunca serán inferiores al tamaño de
la muestra más pequeña menos l. Por lo mismo, si el valor t resulta estadisticamente sig-
nificativo cuando gl = n(muestra más pequeña) - 1, de seguro será estadísticamente significativo
con la versión modificada de los gl. Tampoco en este caso se calculan los gl modificados,
a menos que se requiera una probabilidad más exacta.
Si el valor t no es estadísticamente significativo con los gl de n (muestra más pequeña) - 1
pero sí con gl = n 1 + n2 - 2, calcularemos los gl modificados (o ajustados).
La versión más común de la ecuación de los gl ajustados en una prueba t entre sujetos
con varianzas separadas es:
Ec.AVI.4
Tabla AVI. J. Medias, varianzas y DE del nivel de ansiedad del grupo de terapia y del
control (varianza heterogénea).
Terapia Control
Media 71.5 79.5
Varianza 112.053 24.053
DE 10.586 4.904
Observe que la varianza del grupo que recibió terapia es más de tres veces mayor que la
• del grupo control. Por consiguiente, debe aplicarse la prueba t para grupos con varianzas
heterogéneas.
71.5-79.5
t = -;:::::=====
112.053 + 24.053 )
( 20 20
-3.0667
Los grados de libertad mínimos que tal valor t puede tener son n - 1 = 19 (pues el tamaño de
ambas muestras es igual); y los máximos, n 1 + n2 - 2 = 38. Como ese valor de t resultaria
...
4J2lL-------------------------A~p_én_d_ic_e_s______________________________
estadísticamente significativo en p ~ 0.05 con gl = 19, desde luego también será estadísti-
camente significativo para cualesquier gl ajustados. Sin embargo, calculamos a manera de
ejemplo los gl ajustados:
2
112.053 + 24.053)
e~~~53J (24~~53 J
( 20 20
gl ajustados
= 26.798
Tabla AVI.4. Tiempo (expresado en minutos) que los ciclistas emplearon para recorrer
cierta distancia antes y después del entrenamiento con las diferencias
entre ambos tiempos.
1 195 195 o
2 200 190 10
3 180 182 -2
4 170 169 1
(Continúa)
__________
,,,,
5 210 205 5
6 220 219 1
7 190 191 -1
8 185 183 2
9 150 148 2
10 160 160 o
11 165 166 -1
Total 17
Media 1.545
DE 3.387
~
1.513
Cálculo del tamaño del efecto al comparar dos grupos experimentales. El tamaño del
efecto en diseños donde se comparan las medias de dos muestras es igual a d y se calcula
de la forma siguiente:
media 1 - medi"2
d
DE
Si uno de los grupos es control, su DE puede usarse en la ecuación anterior. Sin embargo,
si en la investigación se compararon las medias de dos grupos experimentales será mejor
4J.4lL________________________A~p_én_d_ic_e_s_____________________________
emplear una DE que combine la información de ambos (la DE combinada). Recordemos
que la prueba t para un diseño entre sujetos comprende el cálculo de la varianza combina-
da (p. 429) y que la DE es la raíz cuadrada de la varianza. Por tanto,
Pruebas no paramétricas
Prueba U de Mann-Whjtney
Cuando el diseño tiene una VI con dos niveles y no se satisfacen los requisitos de una prue-
ba t, pero la medida es por lo menos ordinal, puede usarse la prueba U de Mann-Whitney.
Varios investigadores desean comparar las actitudes de dos grupos de estudiantes (los
de física y los de sociología) hacia la cinegética. A cada alumno se pidió que calificara su
grado de acuerdo con la afinnación "la caza de animales salvajes es cruel". Las evaluacio-
nes se dieron en una escala de 5 puntos (desde en completo desacuerdo hasta completamen-
te de acuerdo), en la cual la puntuación más alta denota una actitud anticacerí'a.
Todas las puntuaciones se ordenaron según su magnitud en una sola escala y no por sepa-
rado en cada nivel de la VI.
1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3
F F F F F F F F F F. S F F F F F F S S S S
4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5
F F F S S S S S S S F F S S S S S S S S S
Evaluación Aportación a U u
1 o o
2 (6 X 0.5) 3
3 (6 X 2) + (6 X 1) 18
4 (3 X 3.5) + (3 X 4) + (3 X 1) 25.5
5 (2 X 4.5) + (2 X 7) + (2 X 4) + (2 X 1) 33
1 o
Total de U 79.5
Si nuestra predicción fuera direccional e indicase que los sociólogos darían evaluaciones
más altas que los físicos, buscaríamos la probabilidad de este valor U. Sin embargo, si pre-
decimos que los físicos darían las evaluaciones más altas, calcularemos la U de los físicos.
Tras calcular la U de un grupo, se hace lo propio con la otra U mediante la ecuación
siguiente:
.,
436lL________________________~A~p~én~d~ic~e~s______________________________
Por tanto, la U de los fisicos es:
U2 (2Ix21)-79.5
361.5
z = Ec. AVI.7
n 1 Xn2x(n1 +n2 +1)
12
79.5-(21;21)
z = -;===b=::::f:::=
21X21 x(21+ 21+1)
12
= -3.5469
Corrección para empates. Quizá nuestro programa de computadora ofrezca también otro ,
valor de z, donde se haya tenido en cuenta el número de puntuaciones con el mismo valor
(empatadas). Cuando el tamaño de la muestra es suficientemente grande para requerir el
uso de la prueba z, vale la pena corregir los empates, pues así obtendremos un valor más
exacto de z y, por tanto, de p.
Para corregir los empates necesitamos saber cuántas puntuaciones empataron y cuán-
tas hay en cada empate. En la puntuación 1 hubo cuatro empates, en la 2 siete, etc. Forma-
mos la tabla siguiente:
1 4 5
2 7 28
3 10 82.5
4 10 82.5
5 11 110
Corrección total 308
Búsqueda de diferencias entre dos niveles de una variable independiente I4J7
Podemos usar ahora la ecuación para z, corregida para empates, pero a fin de simplificarla
que sea N= n 1 + n2 :
z (corregida
para empates) Ec.AVL8
n1 Xt~
(Nx(N - l )) x
(N 12-N
-
3
.. )
- -correcclon tota1
79.5 - ( 21 ; 21)
z (corregida para empates)
3
21x21 x((42) -42 _ 308)
(42x{42- l)) 12
= - 3.6389
1+ 2+3
rango med1o = - -
o
3
= 2
••
4J8l~-------------------------A~p_én_d_ic_e_s______________________________
Rango
Antes Después Diferencia de diferencia Positivo Negativo
1 4 -3 7.5 7.5
1 4 -3 7.5 7.5
2 2 o
2 4 -2 5 5
3 5 -2 5 5
2 4 -2 5 5 '
3 4 -1 2 2
4 4 o
5 5 o
4 5 -1 2 2
2 3 -1 2 2
3 3 o
Total <n o 36
Utilizamos la menor de las dos T: en este caso, la correspondiente a las diferencias positi-
vas, T= O.
T N x(N+l)
4
z = Ec. AVI.9
N x (N +l)x((2x N) + 1)
24
Búsqueda de diferencias entre dos niveles de una var~able independiente ¡439
_ 8x(8 + 1)
0
4
z
8x(8+l)x((2x8)+1)
24
8x9
4
z
rs;9ill
~~
-18
Fl
= -2.521
Puntuaciones empatadas. Para corregir los empates debemos conocer cuántas puntuacio-
nes empataron y de cuántas se compone cada empate. En la puntuación 1 hubo tres empates,
tres en la 2, etc. Formamos la tabla siguiente:
Diferencia
(independientemente
.'
3
1 3 12
2 3 12
3 2 3
Corrección total 27
T- Nx(N +l)
z (corregida para empates) 4 Ec. AVI.lO
Nx(N +l)x(( 2 x N) +l)- Corrección total
• !
24
t1
440lL________________________A~p_én_d_ic_e_s_____________________________
Por tanto, en el presente caso,
O- 8x(8+ 1)
z (corregida para empates) 4
8x(8+1)x((2x8)+1) _
27
24
-18
~51 - 27
-18
4.8989
-3.674
- 3.6389
r = ---=---
...}42
= 0.56
Prueba x2
para el análisis de una tabla
de contingencias de dos ent radas
Cuando el diseño es entre sujetos, hay dos variables (dos entradas) y los datos son nomi-
x
nales, puede usarse la prueba 2 para contingencias.
Un conjunto de investigadores desea saber si hay proporciones diferentes de mujeres
y de varones que fuman.
Búsqueda de diferencias entre dos niveles de una variable independiente ¡441
Tabla AV1. 8. Cantidad de hombres y mujeres fumadores y no fumadores.
_La frecuencia esperada (fe) de una celda específica se calcula multiplicando el total de la
fila donde se encuentra la celda por el total de la columna en que se halla y dividiendo el
resultado por el total global. Por tanto, en la celda superior izquierda la .fe es:
38 X 44
J:e =
88
19
Valores esperados
Hombre Mujer Totales
Fumador 19 19 38
No fumador 25 25 50
Totales 44 44 88
En la prueba x2 se comparan las frecuencias esperadas con las reales (frecuencias observa-
das, j0) mediante la misma ecuación que se utiliza en la prueba x2 de un solo grupo:
x2 = "i.Cfo- J.J'
f.
Esto es, restar cada frecuencia esperada a la observada correspondiente, elevar al cuadrado
el resultado y dividirlo entre la frecuencia esperada. El proceso se repite para cada celda y
se suman todos los resultados.
(17-19) 2 (21-19) 2 (27-25) 2 (23-25) 2
2= + + +
X 19 19 25 25
x
Esta versión de la prueba 2 tiene los grados de libertad siguientes: (r - l) x (e- l ), donde
res el número de filas y e el de columnas. Por tanto, en este caso, gl = (2- 1) x (2- 1) = l.
Podemos buscar el resultado en la tabla de distribución de x2 del apéndice XIV. En ella
se muestra que la probabilidad de que tal resultado, con gl = 1, ocurriera por azar es
0.3 < p < 0.5. Según la computadora, la probabilidad exacta es p = 0.3893.
Corrección para continuidad. Yates creó una corrección para la prueba x2 cuando se usa
en una tabla de contingencia de 2 x 2. Como se señaló en el capítulo 15, el razonamiento
de la corrección consiste en que las probabilidades dadas por la distribución de x2 se calcu-
lan con base en que las variables son continuas. Se pensó que, como en una tabla de 2 x
2 las medidas son dicotómicas, debía efectuarse la corrección en esas circunstancias. Sin
embargo, se supone que los totales marginales son fijos.
Eso ocurre muy pocas veces en las investigaciones reales, pero un ejemplo podría ser .
éste: pedir a un participante que clasifique 32 fotografias de personas en dos pilas iguales
según piense que cada imagen presenta a un individuo del norte o del sur de Inglaterra. Por
tanto, los totales marginales de la clasificación serían fijos: 16 en cada uno. Dieciséis foto- ·
grafias serían de personas del norte de Inglaterra y 16 de personas del sur, lo cual fijaría los·
otros totales marginales:
Tabla AVI. 1O. Forma en que un participante clasificó fotografías de personas del norte
y del sur de Inglaterra.
Tabla AVI. 11. Forma en que un participante clasificó 1O fotos de personas del norte y
del sur de Inglaterra.
Parte de Inglaterra de donde
proviene la persona retratada
Clasificación Norte Sur
Norte 4 (A) 1 (B) 5
Sur 1 (C) 4 (D) 5
5 5
Como los totales marginales son fijos y las frecuencias esperadas para cada una de las
celdas de 2.5, para analizar esos datos podemos usar la prueba de probabilidad exacta de
Fisher.
-La ecuación de tal prueba nos da la probabilidad exacta del resultado. Recordemos que
usualmente deseamos conocer la probabilidad de ese resultado y las de las probabilidades
más extremas que concuerdan con la hipótesis (en el capítulo 1O se presenta una explica-
. ción al respecto). En consecuencia, queremos conocer la probabilidad del resultado que se
presenta en la tabla AVI.ll y la del resultado más extremo presentado en la AVI.12 .
444l~------~----------------A~p~én~d~ic~e~s_____________________________
Tabla AVI. 12. Resultado más extremo de los datos presentados en la tabla AVI . 11 .
Debido a ello, la probabilidad de que los resultados de la tabla de contingencias hayan ocu-
rrido por azar e~: ,
p = 0.099206349 + 0.003968254
= 0.103174603
Para ahorrarnos el cálculo de las probabilidades, en el apéndice XIV se presentan las tablas
respectivas. "
'"
.
VIl
Búsqueda de diferencias
entre más de dos niveles de
una variable independiente
Pruebas paramétricas
ANOVA de una vía entre sujetos
Un conjunto de investigadores comparó la eficacia de dos sistemas nemotécnicos (palabras
-
gancho y el método de ubicación) y una condición control.
--------------------------------------------~~--------~ 445
446l~------------------------A~p~én~d~ic~e~s_____________________________
Estrategia nemotécnica
Control Palabras gancho Ubicación
10 11 10
7 7 8
7 9 11
9 10 9
5 8 12
6 6 10
8 12 7
5 9 11
7 10 8
8 7 10
7.2 8.9 9.6
DE 1.61 933 1.91195 1.57762
Hay tres fuentes de variación que debemos cuantificar: la variación gl~bal de las puntua-
ciones (total), que puede dividirse a su vez en la variación entre los tratamientos (entre gru-
pos) y de las puntuaciones en los grupos (intragrupos).
La suma de cuadrados es la suma de las desviaciones al cuadrado y suele presentarse
de la manera siguiente:
Suma de cuadrados = 2: (x- i) 2
Suma total de cuadrados. Para calcular la suma total de cuadrados, se halla la media glo-
bal de las puntuaciones. Se resta posteriormente la media de cada una de éstas para calcu-
lar cada desviación. Por último, se eleva al cuadrado cada desviación y se suman todas las
desviaciones al cuadrado. '
En este caso, la media global es 8.56667; y la suma de cuadrados total, l 09.36654 (o
109.367, redondeada a tres decimales).
Suma de cuadrados entre grupos. La suma de cuadrados del tratamiento o entre grupos
es la comparación de los resultados de tres tratamientos; en ella se tieRe en cuenta el nú-
mero de puntuaciones observado en cada tratamiento. Se calcula encontrando la desviación
de la media de cada tratamiento respecto a la global. Se eleva al cuadrado cada desviación,
se multiplica por el número de puntuaciones que rindieron esa media del tratamiento y, por
último, se suman todos los resultados.
.~'1
,..
Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡447
Tabla AVII.2. Cálculo de la suma de cuadrados del tratamiento para un ANOVA de una
vía entre sujetos. ti l ·S/ ~-~
c-..!.
Desviación de
la media global
Tratamiento Media (8.56667) (desviación) 2 n x (desviación)2
Control 7.2 1.36667 1.86779 18.6779
Palabras gancho 8.9 0.33333 0.11111 1.1111
Ubicación 9.6 1.03333 1.06777 10.6777
Suma de 30.4667
cuadrados entre
grupos
Tabla AVII.3. Creación de la suma de cuadrados intragrupos para un ANOVA de una vía
entre sujetos.
Tabla AVII.4. Tabla resumen para un ANOVA de una vía entre sujetos.
En el capítulo 16 se explica cómo calcular los grados de libertad, las medias al cuadrado y
las razones F.
Tamaños desiguales de la muestra (diseños desequilibrados). Cuando el tamaño de la
muestra no es igual en todos los grupos hay dos maneras posibles de calcular la suma de
cuadrados; la otra suma de cuadrados se calcula como se indica en los p~rrafos anteriores.
Medias ponderadas. Con el método presentado anterionnente se produce lo que se cono-
ce como solución de medias ponderadas, donde se multiplica la suma de las desviaciones
al cuadrado de cada media por el tamaño de la muestra del grupo de que se obtuvo dicha
media. Así, a las muestras mayores se da mayor peso. Este método se utili;za en el grueso
de los programas de computadora. ·
Medias no ponderadas. Otro método consiste en multiplicar cada suma de las desviacio-
nes al cuadrado por la media armónica del tamaño de la muestra. La media armónica se
calcula de la forma siguiente:
k
-+-basta-
1 1
( 111 112
1 J
nk
3
(0.125+0.1 +0.14286)
3
0.36786
8.155
Heterogeneidad de la varianza (F' de Welch). Cierta versión del ANOVA entre sujetos (la
fórmula F' de Welch) permite una falta de heterogeneidad de la varianza entre los niveles
de la varl:able independiente.
F'
dond~ w=~
1 S~
Aunque los datos de la tabla AVII.l tienen varianza homogénea, en la página siguiente se
presenta un reanálisis acorde con la fórmula de Welch.
45QlL______________________~A~p~én~d~ic=e~s___________________________
Estrategia nemotécnica
Control Palabras gancho Ubicación
7.2 8.9 9.6
DE¡(S¡) 1.61933 1.91195 1.57762
Varianza (~) 2.6222 3.6556 2.4889
3.8135 2.7356 4.0179
27.4572 24.3468 38.5718
¿w1 - 10.567
x = B.5526
Estrategia nemotécnica
Control Palabras gancho Ubicación
X¡ - X - 1.3526 0.3474 1.0474
- - X_)2
(X¡ 1.8295 0.1207 1.0970
5.6468
8
glí 3x0.1491
17.8851
En las tablas de la distribución F vemos que con 2 y 18 grados de libertad, la probabilidad
de F' es 0.01 < p < 0.05. (La probabilidad exacta es 0.0 13, muy semejante a la probabili-
dad dada para la razón F original de la tabla AVII.4.)
En el experimento hubo tres condiciones: en una, cada participante estaba solo y descono-
cía el juicio de otros; en la segunda, estaba solo, pero podía ver en una pantalla de compu-
tadora lo que otros habían "decidido"; en la tercera, estaba en un grupo y sabía lo que los
demás habían "decidido". Las decisiones que los participantes creían que habían tomado
los demás fueron en realidad preestablecidas por los psicólogos, pero aquéllos lo ignoraban.
Tabla AVII.5. Sentencias que los participantes dieron en cada una de las tres
situaciones a los criminales.
1 24 24 24 24
2 18 24 24 22
3 12 15 15 14
4 3 12 12 9
5 24 24 30 26
,¡
6 18 18 24 20
7 12 15 18 15
8 15 20 - 20 18.33333
9 12 15 18 15
10 9 15 15 13
Media 14.7 18.2 20 17.63333
DE 6.55 4.52 5.48
Las fuentes de variación de las puntuaciones son la variación total, que puede dividirse en
la debida a los párticipantes (entre sujetos) y en la debida a la combinación de éstos y los
tratamientos (intrasujetos). La variación intrasujetos puede dividirse en variación entre gru-
pos (o de tratamiento) -el efecto de la VI- y en residual (o de error) -lo no atribuible a di-
ferencias entre tratamientos.
De esa manera, la suma total de desviaciones al cuadrado puede dividirse en:
S de C total = 1 S de
~
e de sujetos 1 + 1 S de
"\
e del tratamiento+ S de e residual 1
452lL----------------------~A~p~én~d~ic~e~s_____________________________
Tabla AVII.6. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de una vía
intrasujetos.
Desviación
de la media k x (desviación)2
global (k es el número ·
Participante Media (17.63333) (desviación) 2 de tratamientos)
Tabla AVIl. 7. Cálculo de la suma de cuadrados intrasujetos para un ANO VA de una vía
intrasujetos.
Suma de
desviaciones al
cuadrado de
Participante Solo Computadora Grupo Media la propia media
1 24 24 24 24 o
2 18 24 24 22 24
3 12 15 15 14 6
4 3 12 12 9 54
5 24 24 30 26 24
6 18 18 24 20 24
7 12 15 18 15 18
8 15 20 20 18.33333 16.66667
9 12 15 18 15 18
10 9 15 15 13 24
s de e 208.66667
intrasujetos
Suma de cuadrados entre grupos (tratamiento). Como sucede con el ANOVA entre suje-
tos, la suma de cuadrados entre grupos es la suma de cuadrados de las tres medias del tra-
tamiento multiplicadas por el tamaño de la muestra.
Tabla AVII.8. Cálculo de la suma de cuadrados entre grupos para un ANOVA de una vía
intrasujetos.
Desviación
Media de la media
del global
Tratamiento tratamiento (17.63333) (desviación) 2 n x (desviación) 2
Solo 14.7 -2.93333 8.60442 86.0442
Computadora 18.2 0.56667 0.32111 3.2111
Grupo 20 2.36667 5.60113 56.0113
Suma de 145.2666
cuadrados entre
grupos
J
~~~---
454l~------------------------A~pe_'n_d_ic_e_s_____________________________
Tabla AVIl . 9. Residuos por participante en cada condición, utilizados para calcular la
suma de cuadrados residual para un ANOVA de una vía intrasujetos.
Una vez que hemos calculado la suma de cuadrados total y la entre sujetos, podemos calcu-
lar la intrasujetos con la fórmula siguiente:
S de e intrasujetos = S de e total- S de e entre sujetos
Tras calcular la suma de cuadrados del tratamiento, la suma de cuadrado~ residual se calcula
con esta fórmula:
S de e residual = S de e intrasujetos - S de e de los tratamientos
Ahora que hemos obtenido todas las sumas de cuadrados necesarias podemos crear la ta-
bla resumen del ANO VA. En el capítulo 16 se incluyen más detalles sobre el cálculo de los
grados de libertad, las medias de cuadrados y la razón F.
• Búsqueda de diferencias entre más de dos niveles de una variable independiente f"455
Tabla AVIl. 1O. Tabla resumen para un ANOVA de una via intrasujetos.
Suma Media
Fuente gl de cuadrados de cuadrados Razón F p
Entre sujetos 9 776.3 86.256 24.491 0.0001
lntrasujetos 20 208.667 10.433
tratamientos 2 145.267 72.633 20.621 0.0001
residual 18 63.399 3.522
Total 29 984.967
Esfericidad. Los ANOVA intrasujetos tienen una suposición peculiar que los datos han de
cumplir: las yarianzas de las diferencias entre distintos pares de niveles de la VI deben ser
iguales (esfericidad o circularidad). En otras palabras: la varianza de las diferencias entre
las puntuaciones de la condición sujeto solo y con computadora será la misma que la va-
rianza de las diferencias entre las puntuaciones de la condición computadora y cara a cara,
y que la varianza de las diferencias entre las puntuaciones entre la condición sujeto solo y
cara a cara.
Cuando la esfericidad no está presente, un método para compensar tal situación y pro-
ducir una probabilidad más exacta para la prueba consiste en ajustar los grados de libertad
para las razones F.
Los dos ajustes son la épsilon de Greenhouse-Geisser (G-G) y la de Huynh-Feldt (H-
F). El primero resulta conservador (tiene más probabilidades de evitar un error tipo I, pero
también de producir uno tipo 11); y el segundo, más liberal.
Tabla AVII. 11. Cálculo de las varianzas de las diferencias entre las puntuaciones de
las distintas condiciones.
Diferencias
Participante Solo-computadora Solo-grupo Computadora-grupo
1 0.00 0.00 0.00
2 -6.00 -6.00 0.00
3 -3.00 -3 .00 0.00
4 -9.00 - 9.00 0.00
5 0.00 -6.00 -6.00
6 0.00 -6.00 -6.00
-3.00 - 3.00
T
7 -6.00
8 - 5.00 - 5.00 0.00
9 - 3.00 -6.00 - 3.00
10 -6.00 -6.00 0.00
..
,
Varianza 9.17 5.57 6.40
456lL_________________________A~p~én_d~ic~e~s______________________________
Un concepto que suele estar relacionado con la esfericidad en los análisis sobre el tema es
el de la simetría compuesta. Decimos que la hay si las varianzas de las puntuaciones origi-
nales y también las covarianzas son homogéneas (la covarianza representa la medida de
cuán cercana resulta la relación entre dos medidas; en el capítulo 19 se incluyen más deta-
lles al respecto). Por tanto, para que haya simetría compuesta, las varianzas de las condi-
ciones paciente solo, con computadora y en grupo deben ser iguales entre sí, mientras que
las covarianzas de las condiciones solo y computadora, solo y grupo, y computadora y gru-
po han de ser iguales entre sí. Cuando hay simetría compuesta se tiene también esfericidad;
sin embargo, puede tenerse la segunda sin la presencia de la primera.
Una matriz de varianza y covarianza contiene las covarianzas entre cada uno de los ni-
veles de la VI y, en la diagonal de la matriz, las varianzas de cada uno de los niveles. En la
tabla siguiente, el valor 42.9 es la varianza de la condición participante solo; 20.4, la de
la condición con computadora:
Tabla AVII . 12. Matriz de varianza y covarianza de las condiciones en que los
participantes emitieron sus sentencias a los criminales, incluidas las
medias de las columnas.
Para calcular las epsilones necesitamos la información siguiente, que podemos deducir de
la tabla anterior:
Media global = 28.75189 (la media de los nueve valores)
Varianza media = 31.1 (la media de las tres varianzas)
Suma de las medias al cuadrado de las columnas (SCmediaJ = 2 544.92659 (la suma de las
medias al cuadrado de cada columna)
Suma de las varianzas y covarianzas al cuadrado (SC10daJ = 7 856.68645 (la suma de cada
uno de los nueve valores al cuadrado)
Obsérvese que SCmedias y SCtodas son, literalmente, sumas de cuadrados y no de desviacio-
nes al cuadrado, como en cálculos anteriores.
La épsilon de Greenhouse-Geisser (e) se calcula con la ecuación siguiente:
9 X 5.51362
2 X (7 856.68645-15 269.55955 + 7 440.04061)
49.62258
54.33502
= 0.91327
La épsilon de Huynh-Feldt ( e) se basa en la e de Greenhouse-Geisser:
(nx(k-1)xe)-2
e = --~--~~--~----
(k -1)X (n - 1- ((k - 1) X e))
(10 X 2 X 0.91327) - 2
2 X (9 - (2 X 0.91327))
18.2654-2
2 X (9 -1.82654)
16.2654
14.34692
= 1.13372
Ambas epsilones pueden usarse para ajustar los grados de libertad en un ANOVA intrasu-
jetos mediante la ecuación siguiente:
gl ajustados = (gl anteriores) x épsilon
Sin embargo, cuando la épsilon es mayor que 1 no se realiza ningún ajuste. Por tanto, la e
de Greenhouse-Gefsser es la única necesaria. En el ANO VA de una vía intrasujetos, los gra-
dos de libertad fueron 2 y 18, lo cual significa que, con la ede Greenhouse-Geisser, se con-
vertirán en:
gl ajustados = 2 x 0.913 y 18 x 0.913
= 1.826 y 16.434
que, redondeados a los enteros siguientes, nos dan:
2 y 16
·-
'
458l~------------------------A~p~én_d_ic~e~s----~------------------------
Pruebas no paramétricas
Medida por lo menos ordinal
Diseños entre sujetos: ANO VA de Kruskal-Wallis por rangos. Cuando el diseño de inves-
tigación es entre sujetos con una VI de más de dos niveles y no se cumplen los requisitos
para un ANOVA paramétrico, cabe realizar el análisis mediante el ANOVA de una vía de
Kruskal-Wallis si los datos son al menos ordinales.
Un grupo de investigadores deseaba comparar los grados que varios catedráticos asig-
naron a diversos ensayos escritos por un varón, por una mujer o por un autor de género no
especificado. Veinticuatro catedráticos universitarios recibieron sendos textos para evaluar;
se les dijo que el material correspondía a un estudiante varón o a una estudiante mujer, o
bien, no se les indicó sexo. En realidad, todos recibieron el mismo escrito. Cada ensayo fue
calificado entre C- y A-, lo cual se convirtió después en valores numéricos de 1 a 9.
Se dio un rango a cada grado y los rangos empatados se trataron igual que en la prue-
ba de rangos con signo de Wilcoxon para pares equiparados.
Tabla AVII.13. Grados que los participantes asignaron a un ensayo, según el supuesto
género del autor, con los rangos conferidos a los grados.
"Género" del autor
Mujer Neutro Varón
Grado Rango Grado Rango Grado Rango
2 2 3 7.5 3 7.5
3 7.5 3 7.5 4 15
2 2 4 15 5 20
3 7.5 4 15 6 22.5
4 15 5 20 7 24
4 15 6 22.5 2 2
3 7.5 4 15 3 7.5
5 20 3 7.5 4 15
Total (R) 76.5 110 113.5
En consecuencia,
12
H = (( )x(3854.3125)J-(3x(24+1))
24 X (24 + 1)
((;~o) x 3 854.3125J-75
77.08625 - 75
2.08625 ·
Para una VI con tres niveles y un tamaño de la muestra no mayor que cinco en cualquiera
de los grupos, los valores de probabilidad de H se presentan en el apéndice XIV. En caso
x
contrario, H se distribuye como 2 , con grados de libertad iguales que el número de nive-
les de la VI, menos uno. Por consiguiente, en este caso, podemos consultar la tabla de la
distribución de x2 en el apéndice XIV para gl = 2 y encontraremos que p está entre 0.5 y
0.3 (es decir, 0.3 < p < 0.5). Ello significa que no hay elementos suficientes para rechazar
la hipótesis nula.
Corrección de empates. Cuando algunas puntuaciones son iguales, en una versión de la prue-
ba se ajustan los empates. En el ejemplo hubo cinco lugares donde los grados empataron.
1-[ 894 ]]
[ (24y -24
2.08625
1
( -( 138~~24 ))
2.08625
1- 0.06478
= 2 .23076
La probabilidad se encuentra en el mismo rango que la de la versión no corregida para em-
pates, y la probabilidad exacta de p = 0.3278. La H corregida para empates constituye la
cifra más exacta.
Diseños intrasujetos: ANO VA de dos vías de Friedman. Cuando el diseño es intrasujetos
y la variable independiente tiene más de dos niveles, pero no se satisfacen los supuestos del
ANOVA paramétrico, si el nivel de medida es al menos ordinal, el ANOVA de dos vías de
Friedman se torna la prueba adecuada.
Un grupo de investigadores desea saber si un conjunto de siete estudiantes evaluaba di-
ferente un curso conforme pasaban más tiempo en él. Se pidió a cada cual evaluar el curso
según una escala de 7 puntos, desde no disfrutable hasta muy disfrutable, en tres ocasio-
nes: después de una semana, después de cinco y luego de 10.
Tabla AVII. 15. Evaluaciones que los estudiantes dieron al curso en tres ocasiones.
Para calcular el ANO VA de Friedman, se asignan rangos a las puntuaciones de cada perso-
na. Observe que ello se realiza sólo con cada persona. Sin embargo, los empates se tratan
de la manera usual, como se describe en la prueba de rangos con signo de Wilcoxon para
pares equiparados.
x
La prueba produce la estadística llamada 2F (conocida también como 2r), donde x
Por tanto,
12
X2F = (( Jx 616.5)-(3x7x(3+1))
7 X 3 X (3 + 1)
462lL_______________________A~pe_·n_d_ic_es____________________________
= (( ~! )x616.5)-84
= 88.07143 - 84
= 4.07143
Corrección de empates. A diferencia de las correcciones de empates anteriores, la usada
en la prueba de Friedman cuenta las ocasiones en que no hay empate, pero las cuenta co-
mo empate de l. Se cuentan los empates de cada persona.
Tabla AVII.1 7. Cálculo del número de rangos empatados de cada medida en un ANOVA
de dos vías de Friedman.
3 1 2.5 2.5 1 1. o
4 1 2 3 3 o o
5 3 1.5 1.5 1 1 o
6 1 2 3 3 o o
7 1 2.5 2. 5 1 1 o
Total 12 3
Elevamos ahora al cubo cada tamaño del empate y sumamos los resultados; así, para los 12
empates que tuvieron uno en cada empate, la suma es
Ésta es la suma para los tres empates que tuvieron dos en cada empate:
Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡463
X F corregida
2
(N x k x (k+ l) )+ (N x k- suma(~~e~pates al cubo)
- Por ello:
(7x3x4))+Cx32-63)
7 398- (3x49x3xl6)
84+( 21;63)
7 398-7 056
84-( ~J
342
63
= 5.42857
Tabla AVII. 18. Cantidad por la que debe multiplicarse el tamaño de la muestra
sugerido por un ANOVA paramétrico para obtener el mismo poder en
la prueba de Friedman.
Número de niveles Se multiplica el tamaño
de la VI de la muestra por
3 1.40
4 1.31
5 1.26
6 1.22
7 1.20
8 1.18
9 1.16
10 1.15
Datos nom;nales
Diseños intrasujetos: Q de Cochran. Si la medida tomada resulta dicotómica, por ejem-
plo, sí o no, puede usarse la Q de Cocbran. Sin embargo, si no lo es, cabe recodificar los
datos para volverlos dicotómicos, como se muestra más adelante. Un grupo de investiga-
dores deseaba comparar las elecciones de los estudiantes de psicología social, de métodos de
investigación y de temas de historia para ver si algunos módulos eran más populares que
otros. Se recomienda realizar la prueba con al menos 16 participantes. Los investigadores
preguntaron a 16 participantes cuáles módulos escogieron. Doce seleccionaron psicolo-
gía social; ocho, métodos, y seis, temas de historia. La Q de Cochran requiere variables
dicotómicas; por ello, los datos deben registrarse como variables ficticias, en las cuales 1
indica que el estudiante tomó el curso y Oque no lo hizo (tabla AVll.l9).
_,,,
Búsqueda de diferencias entre más de dos niveles de una variable independiente ¡-465"
..
Tabla AVII.20. Tabla resumen de un ANOVA de una vía intrasujetos para calcular
la. Q de Cochran .
Suma de Media de
Fuente gl cuadrados cuadrados Prueba F Valor P
Entre sujetos 15 3.917 0.261 1.145 0.362
lntrasujetos 32 8 0.25
tratamientos 2 1.167 0.583 2.561 0.094
residuo 30 6.833 0.228
Total 47 11.917
466l~-------------------------A~p_é_nd_i_ce_s______________________________
-Q = 1.167
0.25
= 4.668
Con un tamaño de muestra por lo menos tan grande como ése, Q se distribuye como conx?
gl =número de niveles de la VI, menos uno. En el ejemplo, gl = 3 - 1 =-2. De consultar las
tablas de distribución de x2 del apéndice XIV, veremos que 0.05 < p < 0.1. De ahí conclui-
mos que no había elementos suficientes para rechazar la hipótesis nula de que el número
de estudiantes que eligiera cada uno de Jos módulos sería el mismo.
111
VIII
Análisis de diseños con más
de una variable independiente
Tabla AVIII.1. Número de palabras recordadas por los participantes al recibir una
estrategia nemotécnica y un tipo de lista.
Tipo de lista
Palabra Palabra
Estrategia gancho gancho
nemotécnica Control vinculada Ubicación Control desvinculada Ubicación
10 9 9 4 10 8
10 10 11 6 7 8
11 10 11 7 8 8
11 12 10 7 8 9
13 12 12 8 9 11
Total 55 53 53 32 42 44
Media 11 10.6 10.6 6.4 8.4 8.8
Varianza 1.5 1.8 1.3 2.3 1.3 1.7
DE 1.22474 1.34164 1.14018 1.51658 1.14018 1.30384
------------------------------------------~~--------~467
46:BlL______________________~A~p~én~d~ic~e~s_____________________________
Media global == 9.3
DE global= 2.01973
161
15 .
= 10.73333
_______________ A
_n_á_li_sis__
de__
di_se_ñ_o_s_co_n_m
__ in_d~ep~e_n_
ás_d_e_u_n_a_v_a_ria_b_le__ dt_·e_
nt_e_______J~
Observe que, cuando hay dos valores, cada uno se desvía de su media en la misma medi-
da: uno positivamente y el otro de manera negativa.
- ma de c'l!adrados para VI 1.
Acusado
Novato Cara Experto Cara Media por
Participante Solo computadora a cara Solo computadora a cara participante
1 12 14 16 16 18 20 16
2 14 14 15 14 18 22 16.16667
3 13 13 17 17 17 21 16.33333
4 14 13 17 16 16 19 15.83333
5 13 14 16 17 19 21 16.66667
Media 13.2 13.6 16.2 16.0 17.6 20.6 16.2
Varianza 0.7 0.3 0.7 1.5 1.3 1.3
DE 0.83667 0.54772 0.83667 1.22474 1.14018 1.14018
472lL________________________A~p_én_d_ic_e_s_____________________________
Suma total de cuadrados
Como es usual, la suma total de cuadrados constituye la suma de las desviaciones al cua-
drado de cada puntuación de la media global (16.2), es decir, representa el cálculo de la su-
ma de las desviaciones al cuadrado de cada puntuación de la media global. En este caso, el
valor es 208.8.
Tabla AVIII. 7. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de dos
vías de 2 x 3 intrasujetos.
S de Centre 2.46671
sujetos
43
3
= 14.33333
16+ 17.6+20.6
Media expertos =
3
54.2
3
= 18.06667
(desviación) 2 x número
Desviación de puntuaciones que
de la media contribuyen a
Acusado Media global (16. 2) (desviación) 2 cada media (15)
Novato 14.33333 - 1.86667 3.48446 52.26685
Experto 18.06667 1.86667 3.48446 52.26685
S de C de V1 1 104.5337
12+14+16 = 14
3
Podemos calcular la suma de cuadrados para los sujetos de las celdas de Vl 1 como se indi-
ca en la tabla AVIII.9.
4J4l Apéndices
(desviación)2 x número
Media Desviación de de puntuaciones que
de la la media contribuyen
Acusado Participante celda global (1 6.2) (desviación)2 a cada media (3)
Novato 1 14 - 2.2 4.84 14.52
2 14.33333 - 1.86667 3.48444 10.45333
3 14.33333 -1.86667 3.48444 10.45333
4 14.66667 -1.53333 2.35111 7.05333
5 14.33333 - 1.86667 3.48444 10.45333
Experto 1 18 1.8 3.24 9.72
2 18 1.8 3.24 9.72
3 18.33333 2.13333 4.55111 13.65333
4 17 0.8 0.64 1.92
5 19 2.8 7.84 23.52
S de C de las celdas 111.46665
Puede calcularse la suma de cuadrados de la celda de VI 1 por sujetos (SeAs) con la fóimu-
la siguiente:
Por tanto:
= 4.46624
Tabla AVIII. 11. Cálculo de la suma de cuadrados de las celdas de Vl 2 para un ANOVA
de dos vías de 2 x 3 intrasujetos.
Podemos calcular la suma de cuadrados de~ por sujetos (SCBs) con la fónnula siguiente:
Por ello,
= 6.73329
(desviación) 2 x número
Media Desviación de puntuaciones que
de la de la media contribuyen a cada
Acusado Condición celda global (1 6.2) (desviación) 2 media de la celda (6)
Novato Solo 13.2 -3 9 45
Computadora 13.6 - 2.6 6.76 33.8
Grupo 16.2 o o o
Experto Solo 16.0 -0.2 0.04 0.2
Computadora 17.6 1.4 1.96 9.8
Grupo 20.6 4.4 19.36 96.8
S de C de la celda 185.6
de Vl 1 por Vl 2
La suma de cuadrados de VI 1 por VI2 (SeAB) puede calcularse con la fórmula siguiente:
= 3.4663
donde A es VI 1
Bes VI2
ABes la interacción entre VI 1 y VI2
AS es la interacción entre VI 1 y los sujetos
BS es la interacción entre VI2 y los sujetos
S son los sujetos
Por tanto,
= 9.53376
Ahora podemos crear la tabla resumen del ANO VA. En el capítulo 17 se explica cómo calcu-
lar los grados de libertad, las medias de cuadrados y las razones F; en el apéndice IX, cómo
efectuar los ajustes de Greenbouse-Geisser (G-G) y Huynh-Feldt (H-F).
Tabla AVIII. 14. Estimaciones que varones y mujeres efectuaron respecto a los IQ de
sus progenitores.
Progenitor
Género del Medi a del Media del
Participante participante Padre Madre género participante
1 Varón 120 100 110
• 2 Varón 110 90 100
3 Varón 100 105 102.5
4 Varón 105 100 102.5
5 Varón 140 120 130
Media 115 103 109
6 Mujer 11 o 11 o 110
7 Mujer 11 o 105 107.5
8 Mujer 105 11 o 107.5
9 Mujer 120 115 117.5
10 Mujer 100 100 100
Media 109 108 108.5
= 2193.75007
Tabla AVIII.15. Cálculo de la suma de cuadrados entre sujetos para un ANOVA de dos
vías mixto de 2 x 2.
Puntuación (desviación) 2 x número
media del Desviación de puntuaciones que
IQ de los de la media contribuyen a cada
Participante progenitores global (1 08. 75) (desviación) 2 media (2)
1 11 o 1.25 1.5625 3.125
2 100 - 8.75 76.5625 153.125
3 102.5 -6.25 39.0625 78.125
4 102.5 -6.25 39.0625 78.125
5 130 21 .25 451.5625 903 .125
6 110 1.25 1.5625 3.125
7 107.5 -1.25 1~5625 3.125
8 107.5 - 1.25 1.5625 3.125
9 117.5 8.75 76.5625 153.125
10 100 - 8.75 76.5625 153.125
S de e entre 1 531.25
sujetos
48QlL----------------------~A~p~én~d~ic~e~s_____________________________
= 1530
Ahora podemos obtener la suma de cuadrados de VI 1 por VI2 (SCAB) de la forma siguiente:
= 151.25
Por tanto,
= 300.00007
Hemos dividido la suma total de cuadrados en sus partes constitutivas y podemos formar la
tabla resumen del ANO VA. En el capítulo 17 se indica cómo calcular los grados de libertad,
las medias de cuadrados y las razones F, mientras que en el apéndice IX se explica la inter-
pretación de los ajustes G-G y H-F.
Ajuste de Bonferroni
Una versión simplificada del ajuste de Bonferroni consiste en dividir el nivel a original en-
tre el número de veces que se repetirá la prueba. De ahí que si se realizaran tres pruebas t y
el nivel a original es de 0.05, el nuevo nivel a contra el que se evaluará cada prueba t será
éste:
0.~ 5 = 0.0167
El método, adecuado para niveles a de 0.05 o menores, es el que se utiliza para calcular los
valores t presentes en las tablas t de Bonferroni, como las incluidas en el apéndice XIV.
La ecuación completa es
1
Nivel a ajustado = 1- (1-a)T
------------------------------------------~----------_J483
'
484lL_________________________A~p_én_d_ic_e_s______________________________
que puede escribirse como
1-Vl-a
.1
= 1-(0.95)3
0.333
= 1- ( 0.95 )
= 1-0.98306
= 0.0169
Cont rastes
Cuando se ha realizado un ANO VA, es común que los investigadores deseen comparar tra-
tamientos específicos para ver si resultan estadísticamente distintos entre sí.
Pruebas paramétricas
Cabe usar cierta ecuación estándar en los diseños entre sujetos para calcular un valor t, cu-
ya probabilidad puede probarse. Sin embargo, como se señaló en el capítulo 18, tales con-
trastes son realizables aun si no se lleva a cabo un ANOVA.
Ec. AIX.l
w~
I _!__ indica elevar al cuadrado cada ponderación y dividirla entre el número de participan-
n¡
tes del grupo y sumar los resultados.
Contrastes por pares. De comparar sólo dos tratamientos (contraste por par), la ecuación
se simplifica de la manera siguiente:
media 1 -media 2
t= ~==:::!::::e==='== Ec. 18.1
( _.!._ + _!_Jx MCerrar
n1 n2
media 1 -media 2
t= Ec. 18.2
(~ }Mcerror
donde n es el tamaño de la muestra del grupo que produjo una de las medias.
486lL_________________________A~p~én_d_ic_e_s______________________________
En el capítulo 18 se incluye un ejemplo de contraste por pares. A continuación daremos uno
de contraste no por pares. Utilizaremos el experimento sobre memoria (presentado en los
capítulos 9 y 16) donde se puso a los participantes en una de tres condiciones: condición
control, en la cual no recibieron capacitación; grupo en que se les enseñó a usar palabras
gancho como estrategia nemotécnica; y un grupo en que se les capacitó para emplear un
método de ubicación. Cada grupo contó con lO participantes.
Tabla AIX. 1. Medias y DE del recuerdo de palabras en las tres condiciones de memoria.
Tabla AIX.2. Tabla resumen del ANOVA de una vía entre grupos sobre datos del recuerdo.
Si comparásemos ambas técnicas nemotécnicas con la condición control, tendríamos las ci-
fras siguientes:
Calcularemos en seguida las ponderaciones, con la restricción de que deben sumar cero.
Por tanto, podríamos multiplicar la media 1 por 2, la media2 por - 1 y la media3 por - l. Ello
equivale a contrastar el grupo control con la media de los otros dos grupos; se habría obte-
nido el mismo resultado con ponderaciones de 1, _.!.y _.!._
2 2
------------------------~A~n~á~ll~·sl~·s~p~o~st~e_ri~o_r_a_lA_N_O_V.~~~o~a~x~2--------------~~
Por consiguiente,
=O
La restricción de que la suma de las ponderaciones sea igual a cero (es decir, 2:, w1 =O,
donde w1 es la ponderación de una media concreta) resulta verdadera sólo con los tamaños
de las muestras iguales en los diferentes grupos. Cuando hay tamaños de las muestras desi-
guales, la restricción estriba en que I,(n 1 x w1 )=0, donde n1 es el tamaño de cada muestra.
En el apéndice XVI se indica cómo calcular los coeficientes con los tamaños de las
muestras distintos.
Mediante la ecuación AIX.1 ,
14.4-8.9 - 9.6
4 -1 + -1 J
2.922x ( -+
10 10 10
-4.1
~/2.922 X 0.6
- 4.1
~1.7532
488lL_________________________A~p_én_d_ic_e_s______________________________
-4.1
.JJ.32408
= -3 .096
La forma de medir la significación del resultado depende de si el contraste fue planeado o
no y de si constituyó el único contraste, uno de varios o uno entre muchos. Si se trata de
uno solo, no se requiere otro ajuste. Si es uno de varios ajustes planeados o si hubo unos
cuantos contrastes no planeados, podemos usar la prueba de Bonferroni (basada en el ajus-
te de Bonferroni). Sin embargo, si se trata de uno de muchos ajustes no planeados, emplea-
remos la prueba de Scheffe. Estudiaremos ésta en la sección siguiente.
= ~2x3.35
= .f6j
= 2.588
Puesto que las tablas F no dan valores negativos, podemos decir que t debe ser igual o ma-
yor que± 2.588 (más menos 2.588). .
Como el valor t obtenido es mayor, en - 3.096, que el valor crítico, concluiríamos que la
condición control produjo menos palabras recordadas que las dos condiciones nemotécnicaS .
• ;l._ _ _
· s~p_o_st_e_ri_o_r_a_lA_N_O_V._A_o__a~x~2--------------~~
_________________________A_n~á_li_sl_
9.585
2
= 4.793
Cuarto método. Siguiendo el mismo razonamiento que nos llevó del primer método al se-
gundo (o a la inversa), podemos decir que el tercero tiene una versión relacionada con un
valor t y no con un valor F. Por ende, la t crítica sería la raíz cuadrada de la F crítica del
tratamiento:
t crítica = ·h.35
= 1.83
Debemos obtener ahora la raíz cuadrada de la razón F que calculamos en el tercer método.
Por tanto, ésta es la t calculada:
2
( t original para el contraste )
gl del tratamiento
4901 Apéndices
~------------------------~----------------------------------
que equivale a
t original para el contraste
~gl del tratamiento
3.096
= li
= 2.1 89
El resultado es, de nuevo, mayor que el valor crítico. De los cuatro métodos, el primero y
el segundo parecen los más directos, y como muchas pruebas de contraste se basan en la
misma ecuación de la prueba t, el primero de ellos es consistente con las demás pruebas.
'.
t cnt1ca = .fi
q
_________________________A
_n_á_ll_.sl_·s~p_o_st_e_n_·o_r_a_lA_N_O_V._A__o_a~x~2--------------~~
En la DHS de Tukey, ese valor crítico se utiliza para evaluar todos los valores.,t calculados
en la familia de contrastes.
En la prueba de Newman-Keuls, las medias se ordenan por tamaño y el valor q depen-
de del número de medias que participan en el contraste particular (su rango). Por ejemplo,
ordenaríamos como sigue las medias del experimento nemotécnico:
La comparación entre las medias de ubicación y control abarca tres medias (incluidas las
dos del contraste); por ello, buscaremos la q con tres medias en la tabla de la estadística de
rango estudentizado del apéndice XIV. Éste nos indica que para gl = 24, q = 3.53 y para gl =
30, q = 3.49. En este caso, como los gl que deseamos en realidad se hallan a medio camino
24 30
entre dichos valores ( ; = 27 ), podemos usar una forma simple de interpolación a fin
de calcular el valor q para gl = 27; tomando la media de las dos q:
q= 3.53;3.49 =3 .51
Por tanto,
3.51
t crítica = .fi
3.51
1.4142
= 2.482
= 2.267
Ortogonalidad
Como se indicó, en cada contraste, cuando los tamaños de la muestra resultan iguales, la
suma de ponderaciones debe ser igual a cero; es decir,
Algunos expertos en estadística sostuvieron en el pasado que las comparaciones deben ser
independientes entre sí porque tratamos de encontrar cuánto contribuye a los contrastes la
suma global de cuadrados. La suma de cuadrados de cada tratamiento puede dividirse en
tantos contrastes independientes como grados de libertad haya para el tratamiento. En el
ejemplo nemotécnico hay 2 gl para el tratamiento y, por tanto, pueden hacerse dos contras-
tes independientes. Si los contrastes resultan independientes, se dice que son ortogonales.
Si son ortogonales (y los tamaños de las muestras iguales), entonces
donde j se refiere a la media para que la ponderación resulte adecuada y a y b son dos con-
trastes diferentes.
• ----------------------~A~n~á~li~si~s~p~os~te~r~io~r~a~l~A~N~O~VA~o~a~x~2--------------~~
Si los tamaños de la muestra no son iguales,
Tratamiento
Ponderación Control Palabras gancho Ubicación Suma
El primer contraste de la tabla se haría comparando la media de las palabras gancho con la
de la ubicación. Obsérvese que no es posible realizar simplemente comparaciones por pa-
res entre todas las medias y mantener las ponderaciones ortogonales.
Pruebas no paramétricas
Datos por lo menos ordinales. Diseños entre sujetos: después de un ANOVA de Kruskal-
Wallis
En el capítulo 16 y en el apéndice VII se presenta un ejemplo donde 24 catedráticos
recibieron un ensayo para evaluar; se les informó que el autor era un varón o una mujer, o
bien, no se les indicó el género. En realidad, se dio el mismo texto a todos. Los partici-
pantes asignaron a los escritos una calificación entre C- y A+, la cual se convirtió en
numérica (entre l y 9). La prueba que explicaremos se usa sólo si el ANOVA de Kruskal-
Wallis inicial es estadísticamente significativo y si se utilizaron al menos cinco personas
en cada grupo. Sin embargo, aunque el resultado no revistió significación e~~. 911plea~
. . . . .....
remos el ejemplo para pormenorizar la técnica. .;. .~....•-..". ·. ~. . . ··•
; · ·;'·~....
494lL_______________________~A~pe~·n~d_ic~e~s_____________________________
En el cálculo de la prueba de Kruskal-Wallis se asigna un rango a cada grado. En el
apéndice VII se mostró que las tres condiciones tenían los rangos totales siguientes, de don-
de se derivaron los rangos medios (de ocho participant07es por gmpo):
Tabla AIX.4. El rango total y el medio de las calificaciones que los participantes
asignaron al ensayo según el supuesto género del autor.
Puede probarse la diferencia entre dos de los rangos medios mediante una ptueba z, en la cual:
14.1875-9.5625
z=
( 241~ 25) ~ + ~)
X (
4.625
~50x±
- 4.625
- ~12.5
4.625
3.53553
= 1.308
________________________A~n~á~li~si~s~p~os~t~er~io~r~a~l~A~N~O_VA~o~a~x~2--------------~~
Sin embargo, debemos ajustar el nivel a para tener en cuenta el número de condiciones por
contrastar. Éste es el ajuste:
. d a
a aJusta a = k X
(
k -1
)
. d 0.05
a aJusta a = x
3 2
= 0.0083
Las probabilidades incluidas en las tablas z son pare. pruebas de una cola. Por ello, si bus-
cáramos una z que produjese una probabilidad de dos colas de 0.05, buscaríamos una z
que arrojara una probabilidad de una cola de 0.025 o %·
En el presente caso, hacemos un
ajuste que tiene en cuenta el número de contrastes por pares que se realizarán. El número
kx(k -1 )
de contrastes por pares efectuables de k niveles de una VI será siempre de .
2
A fin de realizar el ajuste, dividiremos la probabilidad deseada para la familia de contras-
a
tes entre el número de posibles contrastes. En otras palabras, dividiremos 2 entre
kx(k-1)
. Alge-
t ).
2
braicamente, ello se convierte en Por tanto, podemos encontrar el valor z apropiado
k X k -1
que produciría esa probabilidad de dos colas calculando un valor z de una cola en las tablas
z del apéndice XIV. Éstas nos indican que la z crítica es 2.395, mayor que la z calculada.
+ +
496l~-------------------------A~p_é_nd_i_ce_s______________________________
14.1875-9.5625
((~J225) _(~))X(.!.+.!.)
J2 23 X 8 8
4.625
~(so- 3.23913) x .¡
4.625
~11.69022
4.625
3.4 1909
= 1.353
Como ese valor es menor que el crítico de z, no podemos concluir que hay una diferencia
en la forma en que los catedráticos evaluaron los ensayos cuando se les indicó que los ha-
bía escrito un hombre y cuando se les dijo que correspondían a una mujer.
Tabla AIX.5 . Rangos medios y totales para las evaluaciones asignadas al curso.
La prueba de la comparación por pares de los niveles de la variable independiente sigue los
principios del diseño entre sujetos, en cuanto a que debe realizarse sólo si el ANOVA ini-
cial resulta estadísticamente significativo y, mientras el tamaño de la muestra sea de al me-
nos 15, si hay una prueba z cuyo valor puede compararse con el valor z crítico que ajusta
-·
...... A·~o_a~x~2--------------~~
________________________A_n_á_li_si_s~p_os_t_er_io_r_a_l_A_N_O_V~
l
se deriva de
R1 - R2
z=
kx(k+l)
nx6
donde m
k es el número de veles de la VI (en este caso, 3)
R1 y R2 son los rangos medios de los dos niveles de la VI que se comparan
(Hay una versión de la prueba, basada en los rangos totales y no en los medios, pero utiliza-
mQs la otra para ser consistentes con el análisis entre sujetos que presentamos antes.)
En el presente caso,
2.5 - 1.42857
z:=
vw
~
1.07143
~0.2857
= 2.005
Siguiendo los principios para calcular el valor z crítico expuestos sobre el diseño entre suje-
m
tos con una VI de tres veles, la z crítica es 2.395, mayor que la z calculada. Así, no podemos
concluir que las opilliones de los estudiantes acerca del curso hayan cambiado entre la primera
y la décima semana.
No parece haber una corrección de empates en la prueba.
1
.._,...
Los investigadores realizaron una prueba de contingencia de x}, según se describe en el ca-
pítulo 15, y encontraron que l(gl = 2) = 6.621, p = 0.0365. Como ello mostró que las fre-
cuencias de las dos escuelas variaban de manera significativa, decidieron encontrar el
origen de esta significación y efectuaron una partición de la tabla de contingencia.
La pattición implica formar subtablas de 2 x 2. Como cada subtabla tiene un grado de
libertad, pueden elaborarse tantas subtablas como grados de libertad haya en la tabla de con-
tingencia original. Por tanto, en el presente caso, una tabla de 2 x 3 tiene gl = 2; de ahí que
l
puedan practicarse dos particiones. Puede realizarse una prueba en cada partición, pero
se utiliza una ecuación revisada que tiene en cuenta el número original de participantes y
no sólo a aquellos de la partición dada.
La partición inicial Sé realiza en las primeras dos columnas, pero mantenemos los totales
originales de las filas:
Tabla AIX.B. Celdas y totales de la primera partición de los datos de la tabla AIX.6.
________________________A_n_á_li_
si_s~p_os_t_
er_io_r_a_l_A_N_O_VA__o_a~x~2--------------~~
? _ N2 x((ax e)-(bxd)t
x- (1) - R1 x R2 x c1x c2x ( c1+ c2)
Total 32 44 100
2
( 1ÜÜ )
2
X (( t
1Ü X 18)- ( 26 X 22)
- -'--------'-'-------------'-'----
X (1 ) - 50x50x32x44x76
2
10 ÜÜÜ X ( -392)
267 520 000
= 5.744
Tiempo completo
o medio tiempo Desempleados Total original
Escuela A a+b e R1
Escuela 8 d+e t Rz
c3
1
Total C1 + Cz
SOOlL_________________________A~p_én_d_ic_e_s______________________________
?
Podemos calcular después x-con la ecuación siguiente:
1 2 3 1 2
Tiempo completo
o medio tiempo Desempleados Total original
Escuela A
Escuela B
36
40
1
14
10
¡· 50
50
Total 76 24
Pruebas de tendencia
En el capítulo 18 se presenta un ejemplo de participantes que ingerían una, dos o tres uni-
dades de alcohol, tras lo cual se registraban sus tiempos de reacción; hubo ocho participan-
tes por grupo.
o
-o
190
e
~
on
(j) 180
"'(j)
-o
"'"'
E 170
'ü
• QI
~
e: 160
·O
'ü
u
"'~ 150
G>
-o
"'a.
o 140
E
G>
F 130
Una Dos Tres
Unidades de alcohol
Figura AIX.1. Tiempos medios de reacción (expresados en décimas de segundo)
por el número de unidades de alcohol consumidas.
La media forma una pauta en que a mayor cantidad de alcohol consumido, mayor tiempo
de reacción. Sin embargo, no forma una línea recta. Si el efecto del tratamiento no es esta-
dísticamente significativo, se toma innecesario un análisis de tendencias. En este caso, el
análisis preliminar revistió significación estadística.
Tabla AIX.13. Tabla resumen del ANOVA entre sujetos acerca del efecto del alcohol
en los tiempos de reacción.
Ec. AIX.2
5o2l Apéndices
_nxi(cJX.Y¡Y
SCtendencia- I(cJ) Ec. AIX.3
Cada tendencia tiene su propio conjunto de coeficientes y, como la idea consiste en dividir
la suma de cuadrados del tratamiento en sus componentes, aquéllos serán 01togonales. En
el apéndice XVI se presentan los coeficientes de algunas pruebas de tendencia.
Cada prueba de tendencia tiene 1 gl. Por tanto, ya que la media de cuadrados de la ten-
dencia (MC1endcncia) se calcula con la ecuación siguiente:
Metendencia = SCtendencia
al . =
SCtendencia
o tendenc1a
es igual a la SCtendencia·
Una razón F de la tendencia se calcula con esta fómmla:
y la razón F tiene gl = 1 para MC1endcncia y los gl del ténnino de error original en el ANOVA
para el error. Por tanto, en el presente ejemplo, los grados de libertad son 1 y 21. La pro-
babilidad de la razón F de la tendencia puede encontrarse en las tablas F estándar.
Un análisis de tendencia es, de hecho, ejemplo de una prueba de contraste. Para no
contradecir las convenciones, nos hemos referido a coeficientes al hablar acerca del análi-
sis de tendencias. Éstos desempeñan la misma función que las ponderaciones mencionadas
en la descripción de la prueba de contrastes. En este ejemplo concreto, la prueba de la tenden-
cia lineal entre los niveles de alcohol sería la misma que un contraste por pares entre la con-
dición de una unidad y la de tres, pues el coeficiente de dos unidades es Oen la prueba de
tendencia. Sin embargo, tal prueba producirá una razón F, mientras que el contraste genera
un valor t. Por tanto, recordemos que cuando en una razón F los gl del tratamiento = 1,
t= .JF. En el ejemplo, la razónF de la tendencia lineal fue de 7.695, y en este caso, t = 2.774.
Intente usar la ecuación 18.1 para verificar que los contrastes por pares entre una y tres uni-
dades arrojan el mismo resultado.
.. ________________________A_n_á_li_si_s~p_os_t_er_io_r_a_l_A_N_O_VA__o_a~x~2--------------~~
X
Correlación y confiabilidad )
Tabla AX. 1. Tiempo que los alumnos han estudiado psicología y opinión de éstos
respecto a si es una ciencia.
Años de estudiar Evaluación de la psicología
Participante psicología como ciencia
1 1 1
2 2 1
3 3 2
4 4 3
S S 4
6 1 3
7 2 3
8 3 2
9 4 S
10 S 5
11 6 S
504
___________________________C_
or_r_
el_a_
ci_
ó_n~y_c_
o_
nf_ia_b_il_
id_a_
d ________________~~
Es posible calcular la rho de Spearman y la tau de Kendall convirtiendo en rangos las puntua-
ciones de una variable. Como resulta común en estas pruebas, a las puntuaciones que tienen
el mismo valor (empates) se da un rango medio (véase la explicación de la prueba de rangos
con signo de Wilcoxon en el apéndice VI).
Tabla AX.2. Años de estudiar psicología y opinión sobre si ésta es una ciencia, más los
rangos.
Rango de la Diferencia entre
Año Evaluación Rango del año evaluación rangos (diferencia)2
1 1 1.5 1.5 o o
2 1 3.5 1.5 2 4
3 2 5.5 3.5 2 4
4 3 7.5 6 1.5 2.25
5 4 9.5 8 1.5 2.25
1 3 1.5 6 - 4.5 20.25
2 3 3.5 6 - 2.5 6.25
3 2 5.5 3.5 2 4
-
4 5 7.5 10 - 2.5 6.25
5 5 9.5 10 -0.5 0.25
6 5 11 10 1 1
Total 50.50
Rho de Spearman
De las dos versiones de la rho de Spearman, una es muy directa, pero no corrige los rangos
empatados. La otra sí lo hace y por ello es más exacta cuando hay empates. A continuación
presentamos el método para calcular la primera versión. La segunda se encuentra calculan-
do la correlación producto momento de Pearson de los rangos de los datos. También puede
hallarse mediante una modificación laboriosa de la versión no corregida. Por tanto, si no
contamos con una computadora, conviene usar la técnica siguiente sólo cuando no hay em-
pates. Sin embargo, para ejemplificar su uso, calculamos la rho no corregida a partir de los
datos de la tabla AX.l. Ésta es la ecuación para calcular la rho cuando no hay empates:
6 x (suma de d )
2
rho = l - ---'---------'-
n3 - n
donde n es el tamaño de la muestra.
Por tanto,
rho = 1- 6 x_so.s
(11Y -11
~L--------------------------A~p_é_n_di_c_es________________________________
h - 1- 303
ro- 1331-11
= 1-0.22955
= 0.77
Podemos revisar la significación estadística del resultado mediante las tablas t estándar con
n - 2 grados de libertad, donde n es el tamaño de la muestra.
Tau de Kendall
Para reanalizar los datos del ejemplo anterior no necesitamos convertir las puntuaciones en
rangos; sin embargo, obtendremos el mismo resultado si usamos rangos o las puntuaciones
originales.
La tau de Kendall puede calcularse de diferentes maneras; algunas de ellas son más rá-
pidas que la que presentaremos a continuación, pero se complican cuando hay empates en
ambas variables. El método que utilizaremos puede aplicarse a todas las situaciones.
Para calcular la tau primero construiremos una tabla con los valores de una variable,
en orden numérico, encabezando las filas respectivas, y los valores de la otra variable, tam-
bién en ese orden, señalando las columnas. El valor de cada par de puntuaciones se presen-
ta en la tabla colocándolo en la celda correspondiente y mostrando el número de pares que
tengan el mismo valor; por ejemplo, los dos alumnos que han estudiado durante tres años
y que dieron una puntuación de dos:
___________________________
C_or_re_l_ac_i_ón~y_c_on_f_ia_b_il_id_a_d________________~~
Tabla AX.3. Datos de la tabla AX.1 organizados en una tabla para el análisis inicial
de la tau de Kendall.
Tomamos ahora cada entrada de la tabla, comenzando con la de la celda superior izquier-
da, y observamos cuántas están por debajo y a la derecha de esa celda objetivo; es decir,
cuántas entradas se hallan en tma posición consistente con una correlación positiva:
Tabla AX.4. Datos de la tabla AX.1 organizados en una tabla para realizar un análisis
inicial de la tau de Kendall; en ellos se muestra el área a la derecha
y debajo de la primera celda de la tabla.
1+2 + 1+ 1+ 1+ 1+ 1= 8
508l~-----------------------A~p_én_d_ic_e_s_____________________________
Multiplicamos luego esa suma por el número de la celda objetivo (en este caso, 1). Re-
petimos el proceso con todas las entradas de la tabla y sumamos todos los resultados para
calcular el número de entradas en el orden corregido (S+). Por tanto,
S+ = (l X 8) + (1 X 4) + (1 X 7) + (1 X 4) + (2 X 5) + (1 X 3) + (1 X 1)
= 37
S_ = (1 X 3) + (1 X 2) + (1 X 1) = 6
Observaciones empatadas. Igual que en la rho de Spearman, hay un ajuste para los empa-
tes. A fin de obtenerlo, es necesario calcular un
factor de corrección que permita los empates
en cada una de las variables.
11
____________________________C_o_rr_e_La_c_ió_n~y_c_o_n_fi_a_bl_.Li_d_ad__________________~~
2x((s+) - (s_))
tau= -r.======~============~~r.======7===============
~( n x (n -1))- corrección para Vara x ~( n x (n -1)) - corrección para Varb
~(11x10) -1 0 x~(11x10) - 16
62
JO X 9.69536
= 0.639
Probabilidad de tau. A semejanza de la rho de Spearman, hay una aproximación a la dis-
tribución normal de la tau de Kendall. Sin embargo, ésta tiene la ventaja de que su aproxi-
mación es adecuada para muestras menores. Así, con una muestra de 1O o menos puede
usarse la tabla correspondiente del apéndice XIV. Si la muestra es mayor, cabe utilizar la
aproximación z:
z=
3 X 0.639 X Ea
~2 x(22 + 5)
1.917 X 10.48809
Fs4
20.10567
7.34847
= 2.74
Correlación parcial
Como señalamos en el capítulo 19, la correlación parcial es la existente entre dos variables
con la posible influencia de una tercera o más variables en las dos originales extraídas de
51Ql~-------------------------A~p_én_d_ic_e_s______________________________
~'mi .e = 0.723
r x ~ 11 - 2 - orden
t=
~
donde res el coeficiente de correlación o de correlación parcial, n el tamaño de la muestra y
orden el orden de la correlación parcial; si excluimos una variable, tendremos un orden= 1;
si excluimos dos variables, como en el caso anterior donde excluimos edad y ES, orden= 2;
cuando se trata de una correlación normal, no de una parcial, orden= O. En cada caso, los
grados de libertad de la prueba t son gl = (n- 2 - orden).
Grupos no independientes
En dos situaciones distintas podemos desear comparar dos correlaciones provenientes de la
misma muestra. Una de ellas es cuando hemos conelacionado una medida con otra, al tiem-
po que hemos correlacionado la primera medida con una tercera. Supongamos que se busca
relacionar el IQ con la aptitud en matemáticas, y el IQ con la aptitud para la música, y que
...- se quiere comparar ambas relaciones para ver si una de las aptitudes está relacionada más
estrechamente con el IQ que la otra.
La segunda situación es cuando tenemos cuatro medidas y deseamos comparar las co-
nelaciones entre pares de ellas. Digamos que se selecciona a un grupo de niños y se pide
a cada uno de ellos que estime cuántas palabras seria capaz de recordar de una lista de 20.
Se da a cada chico una lista de palabras y después se ve cuántas puede recordar. Es posible
correlacionar las dos medidas para averiguar si hay una relación entre la puntuación esti..:
mada y la real. Posterionnente, se capacita a cada niño en diversas estrategias nemotécnicas,
como agrupar las palabras relacionadas. Se puede comparar después ambas correlaciones
para averiguar si cambió la relación entre la puntuación estimada y la real.
En ambas situaciones podemos comparar las correlaciones en tanto el tamaño de la
muestra sea mayor que 20.
Como en los dos casos anteriores utilizamos a los mismos participantes, consideraremos
las otras interrelaciones entre las variables. Ello provoca que los cálculos luzcan aterrado-
res. De hecho, son muy laboriosos y exigen mucho cuidado, pero en realidad nc, resultan
particularmente complicados.
Primera situación
Tabla AX.6. Matriz de correlación para tres variables.
Variable
Variable 2 3
1
... 2 (21
3 r31
Si deseáramos comparar la correlación entre las variables 1 y 2 (r21 ) con la de las variables
1 y 3 (r31), primero encontraríamos lo que se conoce como la determinante de esta matriz,
designada como IRI, donde
5f2lL------------------------~A~p~én~d~ic~e~s______________________________
A continuación, debemos encontrar la media de las dos correlaciones que estamos compa-
rando:
r21 + r31
r = 2
Podemos calcular ahora un valor t que tenga n - 3 grados de libertad, donde n es el tama-
ño de la muestra.
Segunda situación
Variable
Variable 2 3 4
1
2 rz, 1
3 r31 r32 1
4 r4, r42 r43 1
Si deseáramos comparar la correlación entre las variables l y 2 (r21 ) con la correlación en-
tre las variables 3 y 4 (r43 ), primero calcularíamos una expresión basada en la covarianza
de r 21 y r 43, que llamamos 1p 12 .34, donde:
r21 + r43
r = 2
- -------- --.,
co_r_re_l_
_ _ _ _ _ _ _ _ __ _ __ _ ac_i_ón~y_c_on_f_
ia_b_
il_
id_a_
d _ __ _ _ _ _ _~~
$ 12.34 =
Debemos calcular ahora la transfonnación de Fisher (r') para los coeficientes de las corre-
laciones que deseamos comparar. Las llamaremos r'21 y r'43 (en el apéndice XVI se indica
cómo calcular la transformación).
A partir de tales cálculos podemos hallar una puntuación z mediante la ecuación si-
guiente:
La probabilidad de dicho valor z puede consultarse en la tabla z estándar del apéndice XIV.
Intervalos de confianza de r
En ocasiones, tras calcular un coeficiente de correlación para una muestra deseamos esti-
mar la correlación en la población. Una manera de hacerlo consiste en calcular el interva-
lo de confianza del coeficiente; es decir, el rango de valores en que es probable que esté el
parámetro de la población (p). En el capítulo 19 figura un ejemplo donde la correlación en-
tre la memoria real y la estimada fue de r = 0.8 en una muestra de 30 participantes.
Para calcular el intervalo de confianza (IC) es necesario convertir r en r', calcular el
intervalo de confianza de r' y convertir los límites mostrados nuevamente en valores r.
La ecuación es la siguiente:
1
IC = r' ± z(prob) x ,.-:::
vn-3
n es el tamaño de la muestra
Por tanto,
1
IC = 1.099 ± 1.96 X r:::::
v27
= 1.099 ± 0.377
(k xw)- 1
rho media = k-1
Tabla AX.B. Valoración de atractivo dada por los jueces para cinco fotografías.
Fotografía
Juez A B e D E
Uno 1 2 3.5 3.5 5
Dos 2 1 4 3 5
Tres 2.5 2.5 1 5 4
Cuatro 1 3 2 4 5
Puntuación total (R) 6.5 8.5 10.5 15.5 19
R media 1.625 2.125 2.625 3.875 4.75
Igual que en otros coeficientes de correlación no paramétricos, debe usarse una corrección
cuando hay empates.
Corrección de empates
La corrección puede hacerse elaborando una tabla de la forma siguiente, donde se anoten
los empates de cada participante:
(k x (k2 _1)) -
W= ----,---'------,-r-----'<'-
correcc:ón total
516lL________________________A~pe_'n_d_ic_e_s____________________________
donde la R media global es la media de las R medias de cada entidad juzgada, que es en
este caso 1.625+2.125+2.625+3.875+4.75 = 3
5
Por tanto,
79.5
(5x24) - 3
79.5
= -
117
= 0.6794
(la versión sin corrección para empates sería W = 0.6625)
Confiabilidad
Presentamos a continuación los coeficientes de confiabilidad, cuyo uso apropiado se expli-
ca en el capítulo 19.
2xr12
rkk= l+'i2
__________________________C
_o_r_re_la_c_io_
'n_y~co_n_f_ia_b_
ili_d_ad________________~~
kxmedia(r)
1 +((k-l)x media(r ))
kk
k x[l-
r =_
k- l
L(sl)l
2
S¡
KR20r = _ k x[l_L(pxq)]
kk k- l sl
donde es el valor z que da el nivel de confianza requerido (digamos, z = 1.96 para una
zprob
confianza de 95%)
EEM = !Sx~(l-0.9)
= ISx..fOJ
= 15 X 0.3}6
=4.74
Si un joven obtuvo una puntuación de 90 en la prueba, el intervalo de confianza de 95% de
su IQ puede calcularse así:
IC = 90:t !.96x4.74
= 90:!: 9.2904
Tabla AX. 1O. Grados conferidos a 75 ensayos por dos catedráticos que trabajaron
independientemente uno de otro.
Primer catedrático
Segundo catedrático 2 3 4 5 Total
·~
1 5 1 6
2 2 13 2 17
3 4 20 2 26
4 1 16 2 19
5 3 4 7
Total 7 18 23 21 6 75
En la diagonal de la matriz vemos los ensayos donde los grados de ambos catedráticos
coincidieron:~ o 77.33%.
75
Calcularemos primero las frecuencias esperadas por azar de cada celda de la matriz en
que los catedráticos coincidieron. Ello se hace de manera similar a la x2 , donde:
. d· lí) _ total de la fila x total de la columna
Frecuenc1a espera a v e - tota1 g1oba1
Por tanto, la frecuencia esperada de los ensayos a que se dio un grado de 1 es:
r = 6x7
Je 75
= 0.56
52Ql~-------------------------A~p_é_nd_i_ce_s______________________________
y las otras frecuencias esperadas para las celdas diagonales son 4.08, 7.973, 5.32 y 0.56.
Ello significa que
donde fo es la suma de las frecuencias observadas de las celdas diagonales (en este caso, 58)
N es el número total de entidades clasificadas por Jos evaluadores (75 ensayos).
Por tanto,
K= 58-18.493
75-18.493
= 0.699
o un acuerdo ligeramente menor que 70%, una vez que se ha considerado el azar.
Robson (1993) informa que kappa en el rango de 0.4 a 0.6 se considerajusto; entre 0.6
y 0.75, bueno; y más de 0.75, excelente.
donde zprobes el valor z que da el niv.el de confianza requerido (por ejemplo, z = 1.96
para un grado de confianza de 95%).
Correlación y confiabilidad
----------------------------------~------------------------~
152"1
Si una medida de extraversión correlacionar= 0.8 con una medida de criterio de extraver-
sión, con una desviación estándar de 5, el error estándar de la estimación sería:
IC = 30 ± 1.96x3
= 30 ± 5.88
Es probable, por lo mismo, que su "verdadera" puntuación esté entre 24.12 y 35 .88.
XI
Regresión
522
_______________________________R_e~gr_e_si_ón_______________________J~
Tabla AX1.2. Cálculos para hallar la pendiente de una recta de mejor ajuste
de una regresión lineal simple.
Aptitud Aptitud
Participante en matemáticas (AM) en inglés (Al) AM x AI
1 50 50 2500 2500
2 40 48 2304 1920
3 60 48 2304 2880
4 50 47 2209 2350
5 70 65 4225 4550
6 60 64 4096 3840
7 75 75 5625 5625
8 70 72 5184 5040
9 85 75 5625 6375
-
10 75 80 6400 6000
Total 635 624 40472 41080
524l~----------------------~A~p~én~d~ic~e~s_____________________________
Por tanto,
(IQ X 41 080)-(624 X 635)
b =
(lO X 40 472) - (624) 2
= 0.94890511
(Hemos tenido que calcular todos los decimales para que las respuestas sean compatibles
con las de la computadora.)
Tras calcular b, hallaremos a mediante la ecuación siguiente:
o bien,
a medía para VD - (b x media para VI)
que suele escribirse así:
a F-bX
Por tanto,
4.28832
De acuerdo con lo anterior,
AM predicha:
Aptitud en media de la AM
matemáticas real (desviación) (desviación )2
Participante (Y) AM predicha ('f) ('f - Y) 6' - ?)2
1 50 51.734 - 11.76642 138.44872
2 40 49.836 - 13.66423 186.71128
3 60 49.836 - 13.66423 186.71128
4 50 48.887 -14.61314 213.54382
5 70 65.967 2.46715 6.08685
6 60 65.018 1.51825 2.30508
7 75 75.456 11.95620 142.95082
8 70 72.609 9.10949 82.98279
9 85 75.456 11.95620 142.95082
10 75 80.201 16.70073 278.91438
Total (S de C 1 381.606
de la regresión)
Tabla AXI.4. Cálculo de la suma residual de cuadrados de una regresión lineal simple.
AM: AM
predicha
(residuo); (residuo) 2 ;
Aptitud en AM es decir: es decir:
Y)
A A
Tenemos ya detalles suficientes a fin de crear el ANOVA de resumen para el análisis de re-
gresión. En el capítulo 20 se indica cómo calcular los grados de libertad, la media de cua-
drados y la razón F.
Tabla AXI.5. Tabla resumen del análisis de varianza de una regresión simple de la
relación entre las aptitudes para matemáticas e inglés.
Covarianza
r
DE 1 x DE 2
Ca varianza
b=
(DE para VI) 2
Por tanto,
b = 161.77778
170.48889
0.948905
f3 = bx DE,.
DE y
= 0.888
Lo anterior es igual que el coeficiente de correlación (r) de la relación entre las aptitudes
para matemáticas e inglés. Ello se debe a que el coeficiente de regresión estandarizado es el
que hallaríamos si convirtiéramos los valores de la VI en puntuaciones estandarizadas e
hiciéramos lo mismo con la VD y realizáramos luego un análisis de regresión de las dos
variables estandarizadas. Recordemos que la estandarización convierte una distribución en
528l~-----------------------A~pe_'n_d_ic_e_s_____________________________
VD estandarizada = r x VI estandarizada
R2 ajustada
La R2 ajustada constituye una estimación de R2 en la población y tiene en cuenta lo mismo el
tamaño de la muestra que el número de variables independientes: a menor muestra, mayor
ajuste. La ecuación de la R2 ajustada es ésta:
Por ende, si en el capítulo 20 R2 fue igual a 0.79, o 0.7896, con cuatro decimales, con dos
VI y 1O participantes,
1_ ( 0.21~4x9 )
= 0.729
, d ar d e VI =
E rror están Mediadecuaclradosresiduo
1
~ SdeCdeVI 1 x {t - ~2 ..)
'JI
________________________________R_e~g~re_s_ió_n______________________~~
donde Media de cuadradosresiduo puede calcularse a partir del ANOVA del análisis de re-
gresión
S de C de VI 1 es la suma de desviaciones al cuadrado (de la media) de la VI para la
que se calcula el error estándar
iif.2. es el coeficiente de correlación múltiple al cuadrado donde VI 1 se considera
una variable de criterio y las otras VI actúan como de predicción para ella.
Cuando hay sólo dos VI, dicho valor es el cuadrado del coeficiente de correlación
entre ambas VI (es decir, ,-2).
En el caso de una regresión simple (con una sola VI), la ecuación es la siguiente:
Tabla AXI.6. Datos registrados en una regresión por etapas en la cual matemáticas
es la VD y las demás variables, las independientes.
1 50 50 150 5 85
2 40 48 150 1 100
3 60 48 144 4 95
4 50 47 144 3 105
5 70 65 162 4 100
6 60 64 162 2 110
7 75 75 156 3 100
8 70 72 156 2 120
9 85 75 168 1 115
10 75 80 168 1 120
530l~-----------------------A~p~én~d_ic~e~s_____________________________
Tabla AXI. 7. Tabla ANOVA de una regresión múltiple donde matemáticas es la VD,
e inglés y ES, las VI.
Fuente gl Suma de cuadrados Media de cuadrados Prueba F
44.378
Error estándar (para inglés) =
' 11534.4 X (1 - 0.2233)
44.378
1 534.4 X 0.7767
44.378
119 1.76848
~0.037237
= 0.193
En seguida se muestra otra parte del análisis de regresión cuando la aptitud en matemáti-
cas es la VD, mientras que la aptitud en inglés y el ES constituyen las VI, incluidos los errores
estándar de los coeficientes de regresión:
Error Coeficiente
Variable Coeficiente estándar estándar F por retirar
Intersección -7.68
Inglés 1.055 0.193 0.987 29.899
ES 2.053 1.762 0.21 1.358
__________________________________Re~g~r_e_ ón________________________~j'531
si_
coeficiente de regresión
t =
(N - P - 1) error estándar del coeficiente de regresión
1.055
0.193
5.4663
La probabilidad de ese valor t puede verificarse contrastándola con los valores críticos pre-
sentados en las tablas t del apéndice XIV. Se usará la probabilidad de dos colas. En este ca-
so, el valor t es estadísticamente significativo en el nivel p < O. 001, por lo cual concluiremos
que la aptitud en inglés representa un predictor significativo de la aptitud en matemáticas.
Recordemos una vez más que F = t2; por ello, F = (5.4663) 2 = 29.88, igual a la razón
F (a un decimal) mostrada en la tabla AXI.8 para el coeficiente de regresión de la aptitud
en inglés. La significación estadística de la razón F podría haberse verificado utilizando gl
de 1 y 7.
En la regresión múltiple, si deseamos probar la significación estadística de los coefi-
cientes de regresión, ajustaremos el nivel alfa para tomar en cuenta el número de pruebas
realizadas, pues en el proceso se requiere realizar más de una prueba. Ello puede hacerse
mediante el ajuste de Bonferroni. En este caso, por tener dos VI, el nivel alfa crítico sería
0 05
· = 0.025.
2
-
Igual que con otros intervalos de confianza, necesitamos saber cuál sería el valor crítico de t
para los grados de libertad y para el nivel de confianza. Si deseamos tener uno de 95%, la
t crítica representaría el valor t de una probabilidad de dos colas de a.= 0.05 que, con gl = 7,
es igual a 2.365. Para calcular el intervalo de confianza (IC) se utiliza la fórmula siguiente:
En otras palabras, podemos tener una confianza de 95% de que el valor del coeficiente de
regresión de la población se encuentre entre 0.599 y 1.511.
••
XII
Análisis de reactivos y discriminativo
con las escalas de Likert
efecto, que sería en este caso r = 0.3. Si usó 68 participantes, el valor de r, para ser es-
tadísticamente significativo en p = 0.05, sería 0.20 l.
Si decide analizar los datos con la rho de Spearman o la tau de Kendall, debe tener
al menos 75 participantes para obtener el mismo poder. En el primer caso, el valor crí-
tico sería rho = 0.191 para esos participantes. Si usa la tau de Kendall, el valor crítico
de tau sería 0.129 para ellos mismos.
5. Revise la correlación entre cada afirmación y las puntuaciones totales. Se puede decir
que cualquier afirmación que tenga un coeficiente de correlación con el total del mismo
tamaño o mayor que el valor crítico pasó esta etapa del análisis de reactivos y, por el
momento, puede permanecer en la escala.
6. Examine las afirmaciones que no pasaron la etapa del análisis de reactivos para ver si
se correlacionan entre sí (en el mismo nivel crítico que antes). Las que no se correla-
cionen no sólo con el total sino con otras deben desecharse. Revise cómo están expre-
sadas para ver por qué fallaron.
Un conjunto de afirmaciones que no se correlacionen con el total pero sí unas con otras
pueden formar una subescala de la escala de actitud. Examínelas para ver cuáles aspectos de
la actitud que evalúa tienen en común. Si parece haber un tema coherente que las vincule,
considere que forman una subescala.
Si usó una escala de actitud en esta etapa para evaluar actitudes, podría producir pun-
tuaciones totales distintas para las diferentes subescalas.
XIII
Metaanálisis
Introducción
En este apéndice realizaremos paso a paso un metaanálisis donde se comparan las puntua-
ciones de depresión de mujeres que sufren dolor pélvico con las de grupos control de las
que no lo padecen. Estos datos se tomaron de McGowan, Clark-Carter y Pitts (en prensa).
Los estudios
Excepto en un caso, los detalles relevantes que aparecen en los artículos se presentan en
forma de medias y desviaciones estándar, no como estadísticas de probabilidad.
535
SJ6lL_________________________A~p~é_nd_i_ce_s______________________________
El paso siguiente consiste en crear una sola estadística de probabilidad para cada uno de
los estudios. Por la naturaleza de las estadísticas de resumen que cada estudio ha propor-
cionado, la estadística más apropiada es la prueba t entre sujetos. Como en los diseños entre
sujetos, revisaremos la homogeneidad de la varianza de cada estudio y, si la varianza 1nayor
no equivale a más de tres veces la menor, usaremos la ecuación de la prueba t con varian-
zas conjuntas; de lo contrario, emplearemos la ecuación de la prueba t con varianzas inde-
pendientes (prueba t de Welch). Ambas ecuaciones se presentan en el apéndice VI.
Sin embargo, si el nivel de información de un articulo es tan deficiente que nos impide
disponer de estadísticas descriptivas y nos informa sólo que el resultado es estadísticamente
significativo, lo mejor que podemos hacer es considerar que un resultado no significativo
tiene un valor z de cero (que da una probabilidad de 0.5) y que uno con significación esta-
dística posee un valor z de 1.645 (el nivel crítico de una cola de p = 0.05).
Podemos generar una nueva tabla resumen:
Ec. AJ<III.l
r Ec. AXIII.6
Estamos ahora en posibilidades de calcular el tamaño del efecto para cada estudio. Usare-
mos el estudio 2 como ejemplo:
r
¡;;-
~ '/2:;g¡
..
,
(3.4085) 2
(3 .4085) 2 + ( 60- 2)
5J8l~------------------------A~p_
én_d_ic_e_s_____________________________
1 11.61 79
V 11 .6179 + 58
0.4085
Tabla AXIII.3. Tamaños del efecto (r) de los estudios del met aanálisis.
z = o-J x loge
b
(l + ~)x
g! vll~~
-- 2><gl))
1
Ec. AXIII.7
1
z = 1glerror X log ( l + ;;¡. "2 ) X ( 1- ) Ec. AXIll.8
~ ' glerror 2 X glerror
-
donde glerror son los grados de libertad del término de error (el divisor) utilizado para calcu-
lar la razón F
F 1,v2 es una razón F con gl = l para el tratamiento
(Una razón F puede usarse sólo si la variable independiente tiene dos niveles; es
decir, si gl del tratamiento= 1.)
Ec. AXTII.ll
z Ec. AXIll.l 2
54Ql~----------------------~A~p~én~d~ic~e~s___________________________
Estamos ahora en posibilidades de calcular una z para cada estudio y de hallar un nivel de
probabilidad combinado. D e nueva cuenta, usaremos el estudio 2 como ejemplo:
1 6179 1
58xlog ( 1+ 1. ) x J (1- )
e 58 2x58
~58x0.18257 x~0.9914
= ~10.5896 X ~0.9914
= 3.2541 X 0.9957
= 3.2401
Mediante el mismo procedimiento, podemos crear una tabla de valores z para los estudios,
utilizable a fin de producir un nivel de probabilidad combinada.
Heterogeneidad
Heterogeneidad del tamaño del efecto
Antes de poder calcular la heterogeneidad del tamaño del efecto y el tamaño combinado
del efecto, convertiremos cada r en una transformación de r de Fisher (r'); si colocamos el
_________________________ _______M_e t_a_a_
n a_'l_ is______________________~j541
i s_
tamaño del efecto del estudio 2, r = 0.4085 en la ecuación que aparece en el apéndice XVI,
se produce r' = 0.4338.
Recordemos que si un estudio tiene dirección de efecto negativa, su r será negativa al
colocarla en la ecuación anterior, y la r' resultante también lo será.
Podemos crear ahora una tabla de r' para todos los estudios:
(79 0.4414 + 57 X 0.4338 + 97 X 0.5568 +57 X 0.4666 + 205 0.2874 + 107 X 0.1 430)
7 =
X X
214.4161
602
0.3562
Si un estudio tiene efecto con dirección negativa, sur' será negativa al colocarla en la ecua-
ción anterior.
542lL________________________A~p~én_d~ic~e~s_____________________________
Podemos calcular ahora con la ecuación siguiente la heterogeneidad del tamaño del efecto:
Ec. AXIII.14
Heterogeneidad de la probabilidad
Podemos calcular la heterogeneidad de la probabilidad mediante los valores z estándar de
cada estudio. Hallaremos el valor z medio (z) con el procedimiento estándar para el cálculo
de medias; en este análisis incluirnos los seis estudios:
"=_L-"z_k _.1.
-
Ec. AXIII.l5
3.5880
Si un estudio tiene efecto con dirección negativa, su z será negativa al colocarla en la
ecuación anterior.
Podemos calcular ahora la heterogeneidad de los valores de la probabil idad mediante
la ecuación siguiente:
Ec. AXIII.l 6
= 8.0709
Recordemos que si un estudio tiene efecto con dirección negativa, su z será negativa en la
ecuación anterior.
Según la tabla de la distribución de x2 del apéndice XIV, la probabilidad de que x2 con
5 gl sea un suceso por azar está entre 0.2 y 0.1 , por lo cual no es estadísticamente signifi-
cativo. En este caso, concluiremos que los seis estudios no resultan heterogéneos de ma-
nera significativa respecto a sus niveles de probabilidad.
r' combinada =
2:( / >< r'1 )
11
Ec. AXIII.17
L"i
donde n1 es el número de participantes en el estudio j
j = l ak
k es el número de estudios del metaanális is
r'1 es la z de Fisher para el estudio j
0.3571
Si un estudio tiene efecto con dirección negativa, su r' será negativa al colocarla en la ecua-
ción anterior.
Ese valor puede convertirse en uno r mediante la ecuación presentada en el apéndice
XVI para transformar r' en r. Ello produce un tamaño del efecto combinado (r) = 0.3427.
De acuerdo con Cohen (1988), ése es un tamaño medio del efecto. Como los seis es-
tudios fueron heterogéneos respecto al tamaño del efecto, calcularemos también el tamaño
del efecto de los demás estudios una vez que hemos retirado el sexto. Aquí, la r combina-
da = 0.3828, que también es un tamaño medio del efecto.
Combinación de la probabilidad
Podemos combinar la probabilidad utilizando en la ecuación siguiente las puntuaciones z
estándar que se muestran en la tabla AXIII.4:
l:Cn· x z ·)
z combinada= ~ Ec. AXIII.18
-..¡ 2: (11¡)2
donde nj es el número de participantes en el estudio j
j=lak
k es el número de estudios
zj es la puntuación z estándar del estudio j
z combinada =
82 X 3.8741 + 60 X 3.2401 + 100 X 5.3652 + 60 X 3.4768 + 208 X 4.0919 + 110 X 1.4801
~822 + 602 + 1002 + 602 + 2082 + 1J02
2271.135
281.5812
8.0656
Si un estudio tiene efecto con dirección negativa, su z será negativa al colocarla en la ecua-
ción ante1ior.
________________________________ ' l_is_is______________________~¡545
M_e t_a_a _na_
La tabla z del apéndice XIV muestra que este valor z combinado es significativo debajo
del nivel p = 0.0000 l. Podemos concluir que quienes sufren dolor pélvico padecen signifi-
cativamente más depresión que los grupos control participantes en los estudios. De nuevo,
como el estudio 6 produce heterogeneidad respecto al tamaño del efecto, para completar el
panorama recalcularemos la probabilidad combinada de los cinco estudios restantes. El cálculo
produce un valor z de 8.1338, el cual también es significativo en el nivelp < 0.00001.
Intervalo de confianza
Para hallar el intervalo de confianza en el nivel de confianza de 95% colocaremos en la
ecuación siguiente el tamaño del efecto combinado (r'), antes de transfmmarlo en r, y el nú-
mero total de participantes; en el ejemplo calculamos el IC de los seis estudios originales:
1.96
Intervalo de confianza para r' (IC) = r' - -r==== Ec. AXIII.l9
~2,(NJ- 3)
, 1.96
para r +
~ 2,(N; - 3)
para
1.96
0.3571 +
~79+57+97+57+205 + 107
96
0.3571 - ~ para 0.3571 + 1.
'-!602 f602
0.3571 - 0.0799 para 0.3571 + 0.0799
N fr , . _ kx(.kx .? - 2.706)
acaso-ex1to - . Ec. AXIII.20
2 706
2.706
859.4621
Redondeado al entero siguiente, da
= 860
40
El tema del archivero supone un problema sólo si el número crítico de estudios es igual o
mayor que la N fracaso-éxito. En este caso, como tal número es 40 y esa N 860, el tema no
entrai'ia un problema y podemos tener más confianza respecto al efecto combinado y a las
probabilidades combinadas que calculamos.
____________________________________M_e_t _a _a n_ a_' l_is_is__________________________~~
Dolor
pélvico
vs.
controles
Todos 0.2703
los 6 620 0.3427 para 8.066 <0.0001 860 40
estudios 0.411 1
0.2627
Estudios 5 510 0.3828 para 8.134 <0.0001 607 35
homogéneos 0.4179
111
XIV
Tablas de probabilidad
548
_____________________________~_a_
b_la_s_d_e~p_r_
ob_a_b_il_id_a_d__________________~J'5.49
valor t de 1.7 será estadísticamente significativo en a= 0.05 para una prueba de una co-
la, pues el valor t crítico de gl = 40 es 1.684. Por otra parte, si el valor t no es significativo
en el gl inmediato superior, tampoco lo será en el gl exacto. Por tanto, si gl = 45 y el valor
tes 1.6, no será estadísticamente significativo en a= 0.05 en una prueba de una cola por-
que el valor t crítico para gl = 50 es 1.676. Si estos métodos aproximados no nos dicen si
el resultado es estadísticamente significativo o no, usaremos la interpolación lineal.
Interpolación lineal
Cuando dependemos totalmente de las tablas t y los grados de libertad de nuestro estudio
no aparecen en ellas, podemos usar lo que se conoce como interpolación lineal a fin de
cálcular un valor t crítico más exacto para una probabilidad determinada. Por ejemplo,
t = 1.682 con gl = 43. En el cálculo del valor t crítico para gl = 43, con a= 0.05 y una prue-
ba de una cola, utilizaremos la ecuación siguiente:
, . t del gl inmediato superior + (t del gl inmediato gl superior- gl calculado)
t cntlca =
inferior- t del gl inmediato superior) x ( gl superior - gl inferior
En el presente caso,
50-43)
t crítica(4J) 1.676 + {1.684 - 1.676) X ( 50-40
1.682
-
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.6 0.0047 . 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.001 1 0.0011 0.0011 0.0010 0.0010
3.1 ·0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 . 0.00079 0.00076 0.00074 0.00071
3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
3.7 0.0001 1 0.00010 0.00010 0.00010 0 .00009 0.00009 0.00008 0.00008 0.00008 0.00008
3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
4.0 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003 0.00002 0.00002 0.00002 0.00002
·--
1
5s2l Apéndices
gl 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
0.325 0.727 1.376 3.078 6.314 12.706 31.821 63.656 318.289 636.578
2 0.289 0.617 1.061 1.886 2.920 4.303 6.965 9.925 22.328 31.600
3 0.277 0.584 0.978 1.638 2.353 3.182 4.541 5.841 10.214 12.924
4 0.271 0.569 0.941 1.533 2.132 2.776 3.747 4.604 7.173 8.610
5 0.267 0.559 0.920 1.476 2.015 2.571 3.365 4.032 5.894 6.869
6 0.265 0.553 0.906 1.440 1.943 2.447 3.143 3.707 5.208 5.959
7 0.263 0.549 0.896 1.415 1.895 2.365 2.998 3.499 4.785 5.408
8 0.262 0.546 0.889 1.397 1.860 2.306 2.896 3.355 4.501 5.041
9 0.261 0.543 0.883 1.383 1.833 2.262 2.821 3.250 4.297 4.781
10 0.260 0.542 0.879 1.372 1.812 2.228 2.764 3.169 4. 144 4.587
11 0.260 0.540 0.876 1.363 1.796 2.201 2.718 3.106 4.025 4.437
12 0.259 0.539 0.873 1.356 1.782 2.179 2.681 3.055 3.930 4.318
13 0.259 0.538 0.870 1.350 1.771 2.160 2.650 3.012 3.852 4.221
14 0.258 0.537 0.868 1.345 1.761 2.145 2.624 2.977 3.787 4.140
15 0.258 0.536 0.866 1.341 1.753 2.131 2.602 2.947 3.733 4.073
16 0.258 0.535 0.865 1.337 1.746 2.120 2.583 2.921 3.686 4.015
17 0.257 0.534 0.863 1.333 1.740 2.110 2.567 2.898 3.646 3.965
18 0.257 0.534 0.862 1.330 1.734 2.101 2.552 2.878 3.610 3.922
19 0.257 0.533 0.861 1.328 1.729 2.093 2.539 2.861 3.579 3.883
20 0.257 0.533 0.860 1.325 1.725 2.086 2.528 2.845 3.552 3.850
1
, _____________________________Ti_a_b_
la_s_d_e~p_r_o_ba_b_i_lid_a_d__________________~¡-553
..
26 0.256 0.531 0.856 1.315 1.706 2.056 2.479 2.779 3.435 3.707
27 0.256 0.531 0.855 1.314 1.703 2.052 2.473 2.771 3.421 3.689
28 0.256 0.530 0.855 1.313 1.701 2.048 2.467 2.763 3.408 3.674
29 0.256 0.530 0.854 1.31 1 1.699 2.045 2.462 2.756 3.396 3.660
30 0.256 0.530 0.854 1.310 1.697 2.042 2.457 2.750 3.385 3.646
31 0.256 0.530 0.853 1.309 1.696 2.040 2.453 2,744 3.375 3.633
32 0.255 0.530 0.853 1.309 1.694 2.037 2.449 2.738 3.365 3.622
33 0.255 0.530 0.853 1.308 1.692 2.035 2.445 2.733 3.356 3.611
34 0.255 0. 529 0.852 1.307 1.691 2.032 2.441 2.728 3.348 3.601
35 0.255 0.529 0.852 1.306 1.690 2.030 2.438 2.724 3.340 3.591
36 0.255 0.529 0.852 1.306 1.688 2.028 2.434 2.719 3.333 3.582
37 0.255 0.529 0.851 1.305 1.687 2.026 2.431 2.715 3.326 3.574
-
38 0.255 0.529 0.851 1.304 1.686 2.024 2.429 2.712 3.319 3.566
39 0.255 0.529 0.851 1.304 1.685 2.023 2.426 2.708 3.313 3.558
40 0.255 0.529 0.851 1.303 1.684 2.021 2.423 2.704 3.307 3.551
50 0.255 0.528 0.849 1.299 1.676 2.009 2.403 2.678 3.261 3.496
60 0.254 0.527 0.848 1.296 1.671 2.000 2.390 2.660 3.232 .3.460
70 0.254 0.527 0.847 1.294 1.667 1.994 2.381 2.648 3.211 3.435
80 0.254 0.526 0.846 1.292 1.664 1.990 2.374 2.639 3.195 3.416
90 0.254 0. 526 0.846 1.291 1.662 1.987 2.368 2.632 3.183 3.402
100 0.254 0.526 0.845 1.290 1.660 1.984 2.364 2.626 3.174 3.390
110 0.254 0.526 0.845 1.289 1.659 1.982 2.361 2.621 3.166 3.381
120 0.254 0.526 0.845 1.289 1.658 1.980 2.358 2.617 3.160 3.373
-
00 0.253 0.524 0.842 1.282 1.645 1.960 2.326 2.576 3.090 3.290
554l~-------------------------A~p_én_d_ic_e_s______________________________
1-
1 \
1 \
\
\
__....1 -
·~-- --
/- ......... ...
'
\
/"" ....
-
\
\ ' .......
\ / .............
~
, /
-
' ... ...
-- -
1 ....... ... .........
---
o 20 40
y}
- gl= 1
gl = 5
-- gl = 20
\
-----------------------------~-a_b_la_s_d_e~p_r_o_ba_b_i_lid_a~d--------------------~1'555
Tabla AXIV.3. Probabilidades de las distribuciones de x2.
Probabilidad
gl o 99 o 9S 090 080 070 oso 030 020 o 10 o 05 o 02 o 01 o 001
1 0.00 0.00 0.02 0.06 0.15 0.45 1.07 1.64 2.71 3.84 5.41 6.63 10.83
2 0.02 0.10 0.21 0.45 0.71 1.39 2.41 3.22 4.61 5.99 7.82 9.21 13.82
0.11 0.35 0.58 1.01 1.42 2.37 3.66 4.64 6.25 7.81 9.84 11.34 16.27
4 0.30 0.71 1.06 1.65 2.19 3.36 4 .88 5.99 7.78 9.49 11 .67 13.28 18.47
S o.ss 1.1S 1.61 2.34 3.00 4.35 6.06 7.29 9.24 11.07 13.39 15.09 20.51
6 0 .87 1.64 2.20 3.07 3.83 5.35 7.23 8.56 10.64 12.59 15.03 16.81 22.46
1.24 2. 17 2.83 3.82 4.67 6.35 8.38 9.80 12.02 14.07 16.62 18.48 24.32
8 1.65 2.73 3.49 4.S9 5.S3 7.34 9.52 11 .03 13.36 15.51 18.17 20.09 26.12
9 2.09 3.33 4.17 5.38 6.39 8.34 10.66 12.24 14.68 16.92 19.68 21 .67 27.88
10 2.56 3.94 4.87 6.18 7.27 9.34 11.78 13.44 15.99 18.31 21.16 23 .21 29. 59
11 3.05 4.57 5.58 6.99 8.15 10.34 12.90 14.63 17.28 19.68 22.62 24.73 31.26
12 3.57 5.23 6.30 7.81 9.03 11.34 14.01 15.81 18.55 21 .03 24.05 26.22 32.91
13 4 .11 5.89 7.04 8.63 9.93 12.34 15.12 16.98 19.81 22.36 25.47 27.69 34.53
14 4.66 6.57 7.79 9.47 10.82 13.34 16.22 18.15 21 .06 23.68 26.87 29.14 36.12
15 5.23 7.26 8.55 10.31 11 .72 14.34 17.32 19.31 22.31 25.00 28.26 30.58 37. 70
16 5.81 7.96 9.31 11.15 12.62 15.34 18.42 20.47 23.S4 26.30 29 .63 32.00 39.2S
17 6.41 8.67 10.09 12.00 13.53 16.34 19.51 21.61 24.77 27.59 31.00 33.41 40.79
18 7.01 9.39 10.86 12.86 14.44 17. 34 20.60 22.76 25.99 28.87 32. 35 34.81 42.31
19 7.63 10.12 11 .65 13.72 15.35 18. 34 21.69 23.90 27.20 30.14 33.69 36.19 43.82
20 8.26 10.85 12.44 14.58 16.27 19.34 22.77 2S.04 28.41 31 .41 35.02 37.57 45.31
21 8.90 11.59 13.24 15.44 17.18 20.34 23.86 26.17 29 .62 32.67 36.34 38.93 46.80
22 9.54 12.34 14.04 16.31 18.10 21.34 24.94 27.30 30.81 33.92 37.66 40. 29 48.27
23 10.20 13.09 14.85 17.19 19.02 22.34 26.02 28.43 32.01 35.17 38.97 41.64 49.73
24 10.86 13.85 15.66 18.06 19.94 23. 34 27.10 29.55 33.20 36.42 40.27 42.98 51.18
25 11 . 52 14.61 16.47 18.94 20.87 24.34 28.17 30.68 34.38 37.65 41.57 44.31 52.62
26 12.20 15.38 17.29 19 .82 21 . 79 25. 34 29.2S 31..79 35.56 38.89 42.86 45 .64 54.05
27 12.88 16.15 18.11 20.70 22.72 26.34 30.32 32.91 36.74 40.11 44.14 46.96 55.48
28 13.56 16.93 18 .94 21 . 59 23.65 27. 34 31.39 34.03 37.92 41 . 34 45.42 48.28 56.89
29 14.26 17.71 19.77 22.48 24.58 28.34 32.46 35.14 39.09 42.56 46.69 49 .59 58.30
30 14.95 18.49 . 20.60 23.36 2S.51 29.34 33.53 36.25 40.26 43.77 47.96 50.89 59.70
31 15.66 19.28 21.43 24.26 26.44 30.34 34.60 37.36 41 .42 44.99 49.23 52.19 61 .10
32 16.36 20.07 22 .27 25.15 27.37 31.34 35.66 38.47 42.58 46.19 50.49 53.49 62.49
33 17.07 20.87 23.11 26.04 28.31 32.34 36.73 39.57 43.75 47.40 51.74 54.78 63.87
34 17.79 21.66 23 .95 26.94 29.24 33.34 37.80 40.68 44.90 48.60 53.00 56.06 65.25
3S 18.51 22 .47 24.80 27.84 30. 18 34.34 38.86 41.78 46.06 49.80 54.24 57.34 66.62
36 19.23 23 .27 25.64 28.73 31.12 35.34 39.92 42.88 47.21 S1.00 55.49 58.62 67.98
37 19.96 24.07 26.49 29.64 32.05 36.34 40.98 43.98 48.36 52.19 56.73 59.89 69. 35
38 20.69 24.88 27. 34 30.54 32.99 37.34 42.05 45.08 49. S1 53.38 57.97 61.16 70..70
39 21.43 25.70 28.20 31.44 33.93 38.34 43.11 46.17 50.66 54.57 59.20 62 .43 72.06
40 22.16 26.51 29.05 32.34 34.87 39.34 44.16 47.27 51.81 55.76 60.44 63 .69 73.40
50 29.71 34.76 37.69 41.45 44.31 49.33 54.72 58.1 6 63.17 67.50 72.61 76.15 86.66
60 37.48 43.19 46.46 50.64 53.81 59. 33 65.23 68.97 74.40 79.08 84.58 88.38 99.61
70 45.44 51.74 55.33 59.90 63.35 69.33 75.69 79 .71 8S.S3 90.53 96.39 100.43 112.32
80 53.54 60.39 64.28 69. 21 72.92 79. 33 86.12 90.41 96.58 101 .88 108.07 112.33 124.84
90 61.75 69.13 73.29 78.S6 82.51 89.33 96. 52 101.05 107.57 113.15 119.65 124.12 137.21
100 70.06 77.93 82 .36 87.95 92.13 99.33 106.91 11 1.67 118.50 124.34 131.14 135.81 149.45
110 78.46 86.79 91.47 97.36 101.77 109.33 11 7.27 122.25 129.39 135.48 142. 56 147.41 161 .58
-
120 86 .92 95 .70 100.62 106.81 111 .42 119.33 127.62 132.81 140.23 146.57 153.92 158.95 173 .62
5561 Apéndices
(Adaptada, con autorización de Routledge, de H. R. Neave y P. L. Worthington, "Table G", Distribution-Free Tesis,
Routledge, Londres, 1988, p. 375.)
_____________________________t_a_b_
la_s_d_e~p_r_
ob_a_b_il_id_a_d__________________~¡-557
(Adaptada, con autorización de Routledge, de H. R. Neave y P. L. Worthington, "Table G", Distribution-Free Tests,
-
Routledge, Londres, 1988, p. 376.)
'
558lL________________________A~p_én_d_ic_e_s_____________________________
Tabla AXIV.5. Probabilidades de T de la prueba de Wilcoxon de rangos con signo para
pares equiparados.
(Adaptada, con autorización de Routledge. de H. ll ·ea, e)' P. L. Wonhington. "Tablc o··. Dislribution-Free Tesis.
Routlcdge. Londres. 1988. p. 373.)
____________________________1~a~b~la~s~d~e~p~ro~b~a~bt~·li~d~ad~----------------~~
1 2 1 o 2
~ n
1 o
2
1 8 8
8 10
De esta manera, si un resultado está de acuerdo con una hipótesis direccional, cuando la
muestra tiene tamaño (n) de 10, S 1 = 2, S2 = 2 y x = 2, su probabil idad es p = 0.022.
Hemos incluido sólo probabilidades hasta O. J. Para obtener otras mayores, consúltese
Dixon y Massey (1983) o Siegel y Castellan (1988).
n s, S¡ x Una cola Dos colas n s, S¡ X Una cola Dos colas n s, S¡ x Una cola Dos colas
S 2 2 2 0.100 0.1 00 10 1 1 1 0.100 0.100 12 1 1 1 0.083 0.083
6 2 2 2 0.067 0.067 2 2 2 0.022 0.022 2 2 2 0.01S 0.01S
3 3 o o.oso 0.100 2 2 0.067 0.067 2 3 2 0.04S 0.04S
3 o. oso 0.100 3 3 3 0.008 0.008 2 4 2 0.091 0.091
7 2 2 2 0.048 0.048 3 4 3 0.033 0.033 3 3 o.oos o.oos
3 3 3 0.029 0.029 3 S o 0.083 0.167 3 4 3 0.018 0.018
8 2 2 2 0.036 0.036 3 0.083 0.1 67 3 S 3 0.04S 0.045
3 3 3 0.018 0.018 4 4 o 0.071 0.0:'6 3 6 o 0.091 0.182
3 4 o 0.071 0.143 4 0.005 o.oos 3 0.091 0.182
3 0.071 0.143 4 S o 0.024 0.048 4 4 3 0.067 0.067
4 4 o 0.014 0.029 4 0.024 0.048 4 0.002 0.002
4 0.014 0.029 5 S o 0.004 0.008 4 5 o 0.071 0.081
9 2 2 2 0.028 0.028 S 0.004 0.008 4 0.010 0.010
2 3 2 0.083 0.083 11 1 1 1 0.091 0.091 4 6 o 0.030 0.061
3 3 3 0.012 0 .012 2 2 2 0.018 0.018 4 0.030 0.061
3 4 3 0.048 0.048 2 2 0.055 0.055 5 5 o 0.027 0.028
4 4 o 0.040 0.048 3 3 0.006 0.006 4 0.045 o.on
.... 4 0.008 0.008 3 4 0.024 0.024 S 0.001 0.001
3 S 3 0.061 0.061 5 6 o 0.008 0.015
4 4 3 0.088 0.088 0.008 0 .015
4 0.003 0 .003 6 6 o 0.001 0.002
4 5 o 0.045 0.061 0.040 0.080
4 0.015 0.015 0.040 0.080
S S o 0.013 0.015 6 0.001 0.002
4 0.067 0.080
5 0.002 0.002
(Adaptada. con autorización de McGraw- Hill Companies. de W. J. Dixon y F. J. Masscy. Jr.. lmroductionto Statisrical
4a. ed .• McGra\\-Hi11. Nueva York. 1983.)
Atw~l"Sis,
56Ql Apéndices
b) n = 13 a 15.
n s, Sz X Una cola Dos cola.s n s, Sz X Una cola Dos colas n s, Sz X Una cola Dos colas
1
13 1 1 1 0.077 0.077 14 1 1 1 0.071 0.071 15 1 1 1 0.067 0.067
2 2 2 0.013 0.013 2 2 2 0.011 0.011 2 2 2 0.010 0.010
2 3 2 0.038 0.038 2 3 2 0.033 0.033 2 3 2 0.029 0.029
2 4 2 o.on o.on 2 4 2 0.066 0.066 2 4 2 O.OS7 O.OS7
3 3 3 0.003 0.003 3 3 2 0.093 0.093 2 S 2 0.09S 0.095
3 4 3 0.014 0.014 3 0.003 0.003 3 3 2 0.081 0.081
3 S 3 0.035 0.03S 3 4 3 0.011 0.011 3 0.002 0.002
3 6 3 0.070 0.070 3 5 3 0.027 0.027 3 4 3 0.009 0.009
4 4 3 0.052 0.052 3 6 3 0.055 0.055 3 5 3 0.022 0.022
4 0.001 0.001 3 7 o 0.096 0.192 3 6 3 0.044 0.044
4 5 o 0.098 0.105 3 0.096 0.192 3 7 3 0.077 0.077
4 0.007 0.007 4 4 3 0.041 0.041 4 4 3 0.033 0.033
4 6 o 0.049 0.070 4 0.001 0.001 4 0.001 0.001
4 0.021 0.021 4 S 3 0.095 0.09S 4 5 3 0.077 0.077
5 5 o 0.044 0.075 4 0.005 0.005 4 0.004 0.004
4 0.032 0.032 4 6 o 0.070 0.08S 4 6 o 0.092 0.103
5 0.001 0.001 4 0.015 0.015 4 0.011 0.011
S 6 o 0.016 0.021 4 7 o 0.03S 0.070 4 7 o O.OS1 0.077
4 0.086 0.103 4 0.03S 0.070 4 0.026 0.026
5 0.005 0.005 5 5 o 0.063 0.086 5 5 o 0.084 0.101
6 6 o 0.004 0.005 4 0.023 0.023 4 0.017 0.017
1 0.078 0.103 5 0.0005 0.0005 5 0.0003 0.0003
5 0.02S 0 .029 S 6 o 0.028 0.031 S 6 o 0.042 0.089
6 0.001 0 .001 4 0.063 0.091 4 0.047 0.089
S 0.003 0.003 5 0.002 0.002
5 7 o 0.010 0.021 S 7 o 0.019 0.026
S 0.010 0.021 4 0.100 0.119
6 6 o 0.009 0.010 5 0.007 0.007
S 0.016 0.026 6 6 o 0.017 0.028
6 0.0003 0.0003 5 0.011 0.011
6 7 o 0.002 0.005 6 0.0002 0.0002
1 0.051 0.103 6 7 o 0.006 0.007
5 0.051 0.103 1 0.084 0.119
6 0.002 0.005 5 0.035 0.041
7 7 o <0.0001 <0.0001 6 0.001 0.001
1 0.015 0.029 7 7 o 0.001 0.001
6 0.015 0.029 1 0.032 0.041
7 <0.0001 <0.0001 5 0.100 0.132
6 0.009 0.010
7 0.0002 0.0002
(Adaptada, oon autorización de McGraw-Hill Companies, de W. J. Dixon y F. J. Massey, Jr., l11troduction ro Statistical
A11alysis, 4a. ed., McGraw-Hill, Nueva York, 1983.)
____________________________To_a_
bl_a_
s _de~p_
ro_b_a_
bi_li_
da_d__________________~~
"'-·
r-- 1\
1\
1 1
·~ 1 1
e:
<lJ
:::J
u
~
LJ...
'
-
: ,:''-., 1
1 ,, 1
\1
1
1'
~.
o
1
5 10
F
- gl = 1, 50
-- gl = 5, 50
-- gl = 20, 50
Para leer las tablas, los gl del numerador se muestran en la primera fila y los del divisor en
la columna inicial. Por tanto, si los gl del tratamiento son iguales a 2 y los del error a 20, la
razón F tendrá que ser 3.49 o mayor para resultar estadísticamente significativa en a= 0.05.
11
5621 Apéndices
...
8.69 8.67 8.66 8.65 8.64 8.62 8.60 8.59 8.58 8.57 8.56 8.5S
4 5.84 5.82 5.80 5.79 5.77 5.7S 5.73 5.72 5.70 5.69 5.67 5.66
5 4.60 4.58 4.56 4.54 4.53 4.50 4.48 4.46 4.44 4.43 4.41 4.41
6 3.92 3.90 3.87 3.86 3.84 3.81 3.79 3.77 3.75 3.74 3.72 3.71
7 3.49 3.47 3.44 3.43 3.41 3.38 3.36 3.34 3.32 3.30 3.29 3.27
8 3.20 3.17 3.15 3.13 3.12 3.08 3.06 3.04 3.02 3.01 2.99 2.97
9 2.99 2.96 2.94 2.92 2.90 2.86 2.84 2.83 2.80 2.79 2.77 2.76
10 2.83 2.80 2.77 2.75 2.74 2.70 2.68 2.66 2.64 2.62 2.60 2.59
11 2.70 2.67 2.65 2.63 2.61 2.57 2.55 2.53 2.51 2.49 2.47 2.46
12 2.60 2.57 2.54 2.52 2.51 2.47 2.44 2.43 2.40 2.38 2.36 2.35
13 2.51 2.48 2.46 2.44 2.42 2.38 2.36 2.34 2.31 2.30 2.27 2.26
14 2.44 2.41 2.39 2.37 2.35 2. 31 2.28 2.27 2.24 2.22 2.20 2.19
15 2.38 2.35 2.33 2.31 2.29 2.25 2.22 2.20 2.18 2.16 2.14 2.12
16 2.33 2.30 2.28 2.25 2.24 2.19 2.17 2.15 2.12 2.11 2.08 2.07
17 2.29 2.26 2.23 2.21 2.19 2.15 2.12 2.10 2.08 2.06 2.03 2.02
18 2.25 2.22 2.19 2.17 2.15 2.1 1 2.08 2.06 2.04 2.02 1.99 1.98
""· 19 2.21 2.18 2.16 2.13 2.11 2.07 2.05 2.03 2.00 1.98 1.96 1.94
20 2.18 2.15 2. 12 2.10 2.08 2.04 2.01 1.99 1.97 1.95 1.92 1.91
21 2.16 2.12 2.10 2.07 2.0S 2.01 1.98 1.96 1.94 1.92 1.89 1.88
22 2.13 2.10 2.07 2.05 2.03 1.98 1.96 1.94 1.91 1.89 1.86 1.85
23 2.11 2.08 2.05 2.02 2.01 1.96 1.93 1.91 1.88 1.86 1.84 1.82
24 2.09 2.05 2.03 2.00 1.98 1.94 1.91 1.89 1.86 1.84 1.82 1.80
25 2.07 2.04 2.01 1.98 1.96 1.92 1.89 1.87 1.84 1.82 1.80 1.78
26 2.05 2.02 1.99 1.97 1.95 1.90 1.87 1.85 1.82 1.80 1.78 1.76
27 2.04 2.00 1.97 1.95 1.93 1.88 1.86 1.84 1.81 1.79 1.76 1.74
28 2.02 1.99 1.96 1.93 1.91 1.87 1.84 1.82 1.79 1.77 1.74 1.73
29 2.01 1.97 1.94 1.92 1.90 1.85 1.83 1.81 1.77 1.75 1.73 1.71
30 1.99 1.96 1.93 1.91 1.89 1.84 1.81 1.79 1.76 1.74 1.71 1.70
35 1.94 1.91 1.88 1.85 1.83 1.79 1.76 1.74 1.70 1.68 1.65 1.63
40 1.90 1.87 1.84 1.81 1.79 1.74 1.72 1.69 1.66 1.64 1.61 1.59
45 1.87 1.84 1.81 1.78 1.76 1.71 1.68 1.66 1.63 1.60 1.57 1.55
50 1.85 1.81 1.78 1.76 1.74 1.69 1.66 1.63 1.60 1.58 1.54 1.52
~ SS 1.83 1.79 1.76 1.74 1.72 1.67 1.64 1.61 1.S8 1.55 1.S2 1.50
60 1.82 1.78 1. 75 1.72 1.70 1.65 1.62 1.59 1.56 1.53 1.50 1.48
65 1.80 1.76 1.73 1.71 1.69 1.63 1.60 1.58 1.54 1.52 1.49 1.46
70 1.79 1.7S 1.72 1.70 1.67 1.62 1.59 1.57 1.S3 1.SO 1.47 1.45
75 1.78 1.74 1.71 1.69 1.66 1.61 1.58 1.55 1.52 1.49 1.46 1.44
80 1.77 1.73 1.70 1.68 1.65 1.60 1.57 1.54 1.51 1.48 1.45 1.43
85 1.76 1.73 1.70 1.67 1.65 1.59 1.56 1.54 1.50 1.47 1.44 1.42
90 1.76 1.72 1.69 1.66 1.64 1.59 1.55 1.53 1.49 1.46 1.43 1.41
95 1.75 1.71 1.68 1.66 1.63 1.58 1.55 1.52 1.48 1.46 1.42 1.40
100 1.75 1.71 1.68 1.65 1.63 1.57 1.54 1.52 1.48 1.45 1.41 1.39
110 1.74 1.70 1.67 1.64 1.62 1.S6 1.53 1.50 1.47 1.44 1.40 1.38
120 1.73 1.69 1.66 1.63 1.61 1.55 1.52 1.50 1.46 1.43 1.39 1.37
~.
564l Apéndices
e) a = 0.01 , gl 1 = 1 a 24.
gl2 4 7 8 9 10 12 24
1 4052. 18 4999.34 5403.53 5624.26 5763.96 5858.95 5928.33 5980. 95 6022.40 6055.93 6106.68 6234. 27
2 98.50 99.00 99.16 99.25 99.30 99.33 99.36 99.38 99 .39 99.40 99.42 99.46
3 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.34 27.23 27.05 26.60
4 21.20 18.00 16.69 15.98 15. 52 15.21 14.98 14.80 14.66 14.55 14.37 13.93
S 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10. 16 10.05 9.89 9.47
6 13.75 10.92 9.78 9. 15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.31
7 12.25 9.55 8.45 7.85 7.46 7. 19 6.99 6.84 6.72 6.62 6.47 6.07
8 11 .26 8.65 7.59 7.01 6.63 6. 37 6.1 8 6.03 5.91 5.81 5.67 5.28
9 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.1 1 4.73
10 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.33
11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4. 74 4 .63 4.54 4.40 4.02
12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4. 16 3.78
13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4. 30 4 .19 4.10 3.96 3.59
14 8 .86 6.51 5. 56 5.04 4.69 4.46 4.28 4.14 4 .03 3.94 3.80 3.43
15 8.68 6.36 5.42 4.89 4.56 4.32 4. 14 4.00 3.89 3.80 3.67 3.29
16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3. 18
17 8.40 6. 11 5. 19 4.67 4.34 4. 10 3.93 3.79 3.68 3.59 3.46 3.08
18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.00
19 8.18 5.93 5.01 4.50 4. 17 3.94 3.77 3.63 3.52 3.43 3.30 2.92
20 8.10 5.85 4.94 4.43 4. 10 3.87 3.70 3. 56 3.46 3.37 3.23 2.86
21 8.02 5.78 4.87 4. 37 4 .04 3.81 3.64 3.51 3.40 3.31 3.17 2.80
22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.75
23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3. 30 3. 21 3.07 2.70
24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.66
25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.62
26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.58
27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3. 15 3.06 2.93 2.55
28 7.64 5.45 4.57 4.07 3. 75 3.53 3.36 3.23 3.12 3.03 2.90 2.52
29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.49
30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3. 17 3.07 2.98 2.84 2.47
35 7.42 5.27 4.40 3.91 3.59 3.37 3.20 3.07 2.96 2.88 2.74 2.36
40 7.31 5.18 4.31 3.83 3. 51 3. 29 3.12 2.99 2.89 2.80 2.66 2.29
45 7.23 5. 11 4.25 3.77 3.45 3.23 3.07 2.94 2.83 2.74 2.61 2.23
so 7.17 5.06 4.20 3.72 3.41 3.19 3.02 2.89 2.78 2.70 2.56 2.18
55 7.12 5.01 4. 16 3.68 3. 37 3. 15 2.98 2.85 2.75 2.66 2.53 2.15
60 7.08 4.98 4. 13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.12
65 7.04 4.95 4. 10 3.62 3.31 3.09 2.93 2.80 2.69 2.61 2.47 2.09
70 7.01 4.92 4.07 3.60 3.29 3.07 2.91 2.78 2.67 2.59 2.45 2.07
75 6.99 4.90 4.05 3.58 3.27 3.05 2.89 2.76 2.65 2.57 2.43 2.05
80 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.42 2.03
85 6.94 4.86 4.02 3.55 3.24 3.02 2.86 2.73 2.62 2.54 2.40 2.02
90 6.93 4.85 4.01 3.53 3.23 3.01 2.84 2.72 2.6 1 2.52 2.39 2.00
95 6.91 4.84 3.99 3.52 3.22 3.00 2.83 2.70 2.60 2.51 2.38 1.99
100 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.37 1.98
110 6.87 4.80 3.96 3.49 3.19 2.97 2.81 2.68 2.57 2.49 2.35 1.96
120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 1.95
_____________________________Ti_a_b_la_s_d_e~p_r_o_ba_b_il_id_a_d__________________ --J¡-565
Tabla AXIV.B. Probabilidades de H del ANOVA de Kruskal-Wallis.
k (número de niveles)= 3 a 5.
En el caso de las muestras que no aparecen en la tabla, usaremos los valores de probabili-
dad de la distribución de x2 con gl =k - l.
... k. 3
Tamaños de Probabilidad
k• 3
Tamaños de Probabilidad Tamaños de
k=4
Probabilidad Tamaños de
k=5
Probabilidad
la muestra 0.05 0.01 la mue-;tra 0.05 0.01 la mue-;tra 0.05 0.01 la muestra 0.05 0.01
2 2 2 5 5 3 5.705 7.578 2 2 1 1 2 2 1 1 1
3 2 1 5 5 4 5.666 7.823 2 2 2 1 5.679 2 2 2 1 1 6.750
3 2 2 4.714 5 5 5 5.780 8.000 2 2 2 2 6.167 6.667 2 2 2 2 1 7.133 7.533
3 3 1 5.143 6 1 1 3 1 1 1 2 2 2 2 2 7.418 8.291
3 3 2 5.361 6 2 1 4.822 3 2 1 1 3 1 1 1 1
3 3 3 5.600 7.200 6 2 2 5.345 6.655 3 2 2 1 5.833 3 2 1 1 1 6.583
4 2 1 6 3 1 4.855 6.873 3 2 2 2 6.333 7.133 3 2 2 1 1 6.800 7.600
4 2 2 5.333 6 3 2 5.348 6.970 3 3 1 1 6. 333 3 2 2 2 1 7.309 8.127
4 3 1 5.208 6 3 3 5.615 7.410 3 3 2 1 6.244 7.200 3 2 2 2 2 7.682 8.682
4 3 2 5.444 6.444 6 4 1 4.947 7.106 3 3 2 2 6.527 7.636 3 3 1 1 1 7.111
4 3 3 5.791 6.745 6 4 2 5.340 7.340 3 3 3 1 6.600 7.400 3 3 2 1 1 7.200 8.073
4 4 1 4.967 6.667 6 4 3 5.610 7.500 3 3 3 2 6.n7 8.015 3 3 2 2 1 7.591 8.576
4 4 2 5.455 7.036 6 4 4 5.681 7.795 3 3 3 3 7.000 8.538 3 3 2 2 2 7.910 9.115
4 4 3 5.598 7.144 6 5 1 4.990 7.182 4 1 1 1 3 3 3 1 1 7.576 8.424
4 4 4 5.692 7.654 6 5 2 5.338 7.376 4 2 1 1 5.833 3 3 3 2 1 7.769 9.051
5 2 1 5.000 6 S 3 5.602 7.590 4 2 2 1 6.133 7.000 3 3 3 2 2 8.044 9.505
5 2 2 5.160 6.533 6 5 4 5.661 7.936 4 2 2 2 6.545 7.391 3 3 3 3 1 8.000 9.451
5 3 1 4.960 6 5 5 5.729 8.028 4 3 1 1 6.178 7.067 3 3 3 3 2 8.200 9.876
S 3 2 S.2S1 6.909 6 6 1 4.945 7.121 4 3 2 1 6.309 7.455 3 3 3 3 3 8. 333 1o. 200
5 3 3 5.648 7.079 6 6 2 5.410 7.467 4 3 2 2 6.621 7.871
5 4 1 4.985 6.955 6 6 3 5.625 7.725 4 3 3 1 6.545 7.758
5 4 2 5.273 7.20S 6 6 4 5.724 8.000 4 3 3 2 6.795 8.333
5 4 3 5.656 7.445 6 6 5 5.765 8.124 4 3 3 3 6.984 8.659
5 4 4 5.657 7.760 6 6 6 5.801 8.222 4 4 1 1 5.945 7.909
5 5 1 5.127 7.309 7 7 7 5.819 8.378 4 4 2 1 6.386 7.909
5 5 2 5.338 7.338 8 8 8 5.805 8.465 4 4 2 2 6.731 8.346
4 4 3 1 6.635 8.231
4 4 3 2 6.874 8.621
4 4 3 3 7.038 8.876
4 4 4 1 6.725 8.588
4 4 4 2 6.957 8.871
4 4 4 3 7.142 9.075
4 4 4 4 7.235 9.287
(Adaptada, con autorización de Routledge, de 11. R. Neavc, " Table 4.2", Statistics Tables for Mathematicians, Engi-
neers, Economists and 1he Behavioural and Management Sciences, Routledge, Londres, 1978, p. 49.)
566lL_________________________A~p_én_d_ic_e_s______________________________
Tabla AXIV. 9. Probabilidades de x2F (estadística no paramétrica de Friedman para
ANOVA intrasujetos).
k ~3 k S 3 k~4
n x2F p n 2
XF p n x2F p
3 4.667
6
0.194
0.028 . 8 4.75
5.25
0.12
0.079
.
2 5.4
6
0.167
0.042 .
6.25 0.047
4 4.5 0.125 3 5.8 0.148
6.75 0.038
6 0.069
. 7 0.03
6.6 0.075
- .
6.5 0.042 7 0.054
8 0.0046
7.75
9
0.018
0.0099 .. 7.4 0.033
-
8.2 0.017
S 4.8 0.124
9 4.667 0. 107 9 0.0017
5.2
6.4
0.093
0.039 . 5.556 0.069
6 0.105
.
4
6 0.057
7.6
8.4
0.024
0.0085 .. 6.222
6.889
0.048
0.031
6.3
6.6
0.094
0.077
6.9 0.068
6 4.33 0.142 8 0.019
7.2 0.054
5.33 o.on 8.222 0.016
.. .
.
7.5 0.052
6.33 0.052 8.667 0.01
7.8 0.036
7 0.029
8.1 0.033
8.33
9
0.012
0.0081 .. 8.4
8.7
0.019
0.014
..
7 4.571 0.112 9.3 0.012
5.429 0.085 9.6 0.0069
6
7.143
0.052
0.027 .
7.714 0.021
-
8 0.016
8.857 0.0084
_____________________________Ti_a_b_la_s_d_e~p_r_ob_a_b_il_id_a_d__________________ __j¡-567
Tabla AXIV. 1O. Correcciones de contrastes de Bonferroni.
a) Índice de error por familia, a= 0.05, probabilidades de dos colas (o a= 0.025, proba-
bilidades de una cola), gl de error= 1 a 20.
Número de contrastes
gl de error 2 3 4 5 6 7 8 9 10 12 15
25.452 38.189 50.922 63.656 76.392 89.123 101.859 114.590 127.321 152.793 190.996
2 6.205 7.649 8.860 9. 925 10.886 11.769 12.590 13.360 14.089 15.444 11.2n
3 4.1n 4.857 5.392 5.841 6.232 6.580 6.895 7.185 7.453 7.940 8.575
4 3.495 3.961 4.315 4. 604 4.851 5.068 5.261 5.437 5.598 5.885 6.254
S 3.163 3.534 3.810 4.032 4.219 4.382 4.526 4.655 4.773 4.983 5.247
6 2.969 3.287 3.521 3.707 3.863 3.997 4.115 4.221 4.317 4.486 4.698
7 2.841 3.128 3.335 3.499 3.636 3. 753 3.855 3.947 4.029 4.174 4.355
8 2.752 3.016 3.206 3.355 3.479 3.584 3.677 3.759 3.833 3.962 4.122
9 2.685 2.933 3.111 3.250 3.364 3.462 3.547 3.622 3.690 3.808 3.954
10 2.634 2.870 3.038 3.169 3.277 3.368 3.448 3.518 3.581 3.691 3.827
11 2.593 2.820 2.981 3.106 3.208 3.295 3.370 3.437 3.497 3.600 3.728
12 2.560 2.779 2.934 3.055 3.153 3.236 3.308 3.371 3.428 3.527 3.649
13 2.533 2.746 2.896 3.012 3.107 3.187 3.256 3.318 3.372 3.467 3.584
14 2.510 2.718 2.864 2.977 3.069 3.146 3.214 3.273 3.326 3.417 3.530
15 2.490 2.694 2.837 2.947 3.036 3.112 3.177 3.235 3.286 3.375 3.484
16 2.473 2.673 2.813 2.921 3.008 3.082 3.146 3.202 3.252 3.339 3.444
17 2.458 2.655 2.793 2.898 2.984 3.056 3.119 3.173 3.222 3.307 3.410
18 2.445 2.639 2.775 2.878 2.963 3.034 3.095 3.149 3.197 3.279 3.380
19 2.433 2.625 2.759 2.861 2.944 3.014 3.074 3.127 3.174 3.255 3.354
20 2.423 2.613 2. 744 2.845 2. 927 2. 996 3.055 3.107 3. 153 3.233 3.331
..
568l___ Apéndices
e) Índice de error por familia, a = 0. 1, pruebas de dos colas (o a. = 0.05, pruebas de una
cola), gl de error= 1 a 30.
Número de contrastes
gl de error 2 3 4 5 6 7 8 9 10 12 15
12.706 19.081 25.452 31.821 38.189 44.557 50.922 57.290 63.656 76.392 95.489
2 4.303 5.339 6.205 6.965 7.649 8.277 8.860 9.408 9.925 10.886 12.186
3 3.182 3.740 4.177 4.541 4.857 5.138 5.392 5.625 5.841 6.232 6.741
4 2.776 3.186 3.495 3.747 3.961 4.148 4.315 4.466 4.604 4.851 5.167
5 2.571 2.912 3.163 3.365 3.534 3.681 3.810 3.926 4.032 4.219 4.456
6 2.447 2.749 2.969 3.143 3.287 3.412 3.521 3.619 3.707 3.863 4.058
7 2.365 2.642 2.841 2.998 3.128 3.238 3.335 3.422 3.499 3.636 3.806
8 2.306 2.566 2.752 2.896 3.016 3.117 3.206 3.285 3.355 3.479 3.632
9 2.262 2.510 2.685 2.821 2.933 3.028 3.111 3.184 3.250 3.364 3.505
-
10 2.228 2.466 2.634 2.764 2.870 2.960 3.038 3.107 3.169 3.277 3.409
11 2.201 2.431 2.593 2.718 2.820 2.906 2.981 3.047 3.106 3.208 3.334
J
12 2.179 2.403 2.560 2.681 2.779 2.863 2.934 2.998 3.055 3.153 3.273
13 2.160 2.380 2.533 2.650 2.746 2.827 2.896 2.957 3.012 3.107 3.223
14 2. 145 2.360 2.510 2.624 2.718 2. 796 2.864 2.924 2.977 3.069 3.181
15 2.131 2.343 2.490 2.602 2.694 2. 770 2.837 2.895 2. 947 3.036 3.146
16 2.120 2.328 2.473 2.583 2.673 2.748 2.813 2.870 2.921 3.008 3. 115
17 2.110 2.316 2.458 2.567 2.655 2.729 2.793 2.848 2.898 2.984 3.088
18 2.101 2.304 2.445 2.552 2.639 2.712 2.775 2.829 2.878 2.963 3.065
19 2.093 2.294 2.433 2.539 2.625 2.697 2.759 2.813 2.861 2. 944 3.045
20 2.086 2.285 2.423 2.528 2.613 2.683 2.744 2.798 2.845 2.927 3.026
21 2.080 2.278 2.414 2.518 2.601 2.671 2.732 2.784 2.831 2.912 3.010
22 2.074 2.270 2.405 2.508 2.591 2.661 2.720 2.772 2.819 2.899 2.995
23 2.069 2.264 2.398 2.500 2.582 2.651 2.710 2.761 2.807 2.886 2.982
24 2.064 2.258 2.391 2.492 2.574 2.642 2.700 2.751 2.797 2.875 2.970
25 2.060 2.252 2.385 2.485 2.566 2.634 2.692 2.742 2.787 2.865 2.959
26 2.056 2.247 2.379 2.479 2.559 2.626 2.684 2.734 2.779 2.856 2.949
27 2.052 2.243 2.373 2.473 2.552 2.619 2.676 2.726 2.771 2.847 2.939
28 2.048 2.238 2.368 2.467 2.546 2.613 2.669 2.719 2.763 2.839 2.930
29 2.045 2.234 2.364 2.462 2.541 2.607 2.663 2.713 2.756 2.832 2.922
30 2.042 2.231 2.360 2.457 2.536 2.601 2.657 2.706 2.750 2.825 2.915
.,._,.
1
5701 Apéndices
31 2.040 2.227 2.356 2.453 2.531 2.596 2.652 2.701 2.744 2.818 2.908
32 2.037 2.224 2.352 2.449 2.526 2.591 2.647 2.695 2.738 2.812 2.902
33 2.035 2.221 2.348 2.445 2.522 2.587 2.642 2.690 2.733 2.807 2.896
34 2.032 2.218 2.345 2.441 2.518 2.583 2.638 2.686 2.728 2.802 2.890
35 2.030 2.215 2.342 2.438 2.515 2.579 2.633 2.681 2.724 2.797 2.88S
36 2.028 2.213 2.339 2.434 2.511 2.57S 2.629 2.677 2.719 2.792 2.879
37 2.026 2.210 2.336 2.431 2.508 2.571 2.626 2.673 2.715 2.788 2.875
38 2.024 2.208 2.334 2.429 2.505 2.568 2.622 2.670 2.712 2.783 2.870
39 2.023 2.206 2.331 2.426 2.502 2.565 2.619 2.666 2.708 2.780 2.866
40 2.021 2.204 2.329 2.423 2.499 2.562 2.616 2.663 2.704 2.776 2.862
45 2.014 2.195 2.319 2.412 2.487 2.549 2.602 2.648 2.690 2.760 2.845
50 2.009 2. 188 2.311 2.403 2.477 2.S39 2.591 2.637 2.678 2.747 2.831
SS 2.004 2.183 2.304 2.396 2.469 2.S30 2.S83 2.628 2.668 2.737 2.820
60 2.000 2.178 2.299 2.390 2.463 2.S24 2.S7S 2.620 2.660 2.729 2.811
6S 1.997 2.174 2.295 2.385 2.458 2.518 2.569 2.614 2.654 2.721 2.803
70 1.994 2.171 2.291 2.381 2.453 2.S13 2.564 2.608 2.648 2.715 2.796
75 1. 992 2.168 2.287 2.377 2.449 2.S08 2.SS9 2.604 2.643 2.710 2.791
80 1. 990 2.16S 2.284 2.374 2.445 2.505 2.55S 2.600 2.639 2.70S 2. 786
8S 1.988 2.163 2.282 2.371 2.442 2.S01 2.552 2.S96 2.635 2.701 2.781
90 1. 987 2.161 2.280 2.368 2.440 2.499 2.549 2.593 2.632 2.698 2. 777
95 1.985 2.159 2.277 2.366 2.437 2.496 2.546 2.590 2.629 2.695 2.774
100 1.984 2.1 58 2.276 2.364 2.435 2.494 2.S44 2.S87 2.626 2.692 2.771
105 1.983 2.1S6 2.274 2.362 2.433 2.492 2.S41 2.585 2.623 2.689 2.768
110 1.982 2.1 SS 2.272 2.361 2.431 2.490 2.539 2.583 2.621 2.687 2.766
115 1.981 2.154 2.271 2.359 2.430 2.488 2.S38 2.581 2.619 2.685 2.763
120 1.980 2.153 2.270 2.358 2.428 2.486 2.536 2.579 2.617 2.683 2.761
_____________________________T<_a_
b_la_s_d_e~p_r_ob_a_b_il_id_a_d__________________~f'571
-
gl de error 3 4 5 6 7 8 9 10 11 12 13 16 21
5 3.03 3.29 3.48 3.62 3.73 3.82 3.90 3.97 4.03 4.09 4.14 4.26 4.42
6 2.86 3.10 3.26 3.39 3.49 3.57 3.64 3.71 3.76 3.81 3.86 3.97 4.11
7 2.75 2.97 3.12 3.24 3.33 3.41 3.47 3.53 3.58 3.63 3.67 3.78 3.91
8 2.67 2.88 3.02 3.13 3.22 3.29 3.35 3.41 3.46 3.50 3.54 3.64 3.76
9 2.61 2.81 2. 95 3.05 3.14 3.20 3.26 3.32 3.36 3.40 3.44 3.5.3 3.65
10 2.57 2.76 2.89 2.99 3.07 3.14 3.19 3.24 3.29 3.33 3.36 3.45 3.57
11 2.53 2.72 2.84 2.94 3.02 3.08 3.14 3.19 3.23 3.27 3.30 3.39 3.50
12 2.50 2.68 2.81 2. 90 2. 98 3.04 3.09 3.14 3.18 3.22 3.25 3.34 3.45
13 2.48 2.65 2.78 2.87 2.94 3.00 3.06 3.10 3.14 3.18 3.21 3.29 3.40
14 2.46 2.63 2.75 2.84 2.91 2.97 3.02 3.07 3.11 3.14 3.18 3.26 3.36
15 2.44 2.61 2. 73 2.82 2.89 2.95 3.00 3.04 3.08 3.12 3.15 3.23 3.33
16 2.42 2.59 2.71 2.80 2.87 2.92 2.97 3.02 3.06 3.09 3.12 3.20 3.30
17 2.41 2.58 2.69 2.78 2.85 2.90 2.95 3.00 3.03 3.07 3.10 3.18 3.27
18 2.40 2.56 2.68 2.76 2.83 2.89 2.9A 2.98 3.01 3.05 3.08 3.16 3.25
19 2.39 2.55 2.66 2.75 2.81 2.87 2.92 2.96 3.00 3.03 3.06 3.14 3.23
20 2.38 2.54 2.65 2.73 2.80 2.86 2.90 2.95 2.98 3.02 3.05 3.12 3.22
24 2.35 2.51 2.61 2.70 2.76 2.81 2.86 2.90 2.94 2.97 3.00 3.07 3.16
30 2.32 2.47 2.58 2.66 2.72 2.77 2.82 2.86 2.89 2.92 2.95 3.02 3.1 1
40 2.29 2.44 2.54 2.62 2.68 2. 73 2. 77 2.81 2.85 2.87 2.90 2. 97 3.06
60 2.27 2.41 2.51 2.58 2.64 2.69 2.73 2.77 2.80 2.83 2.86 2.92 3.00
120 2.24 2.38 2.47 2.55 2.60 2.65 2.69 2.73 2.76 2.79 2.81 2.87 2.95
(Adaptada, con autorización de Tbe lntemationa1 Biometrics Socicty, de C. W. Dunnctt, "Ncw tab1es for mu1tiple coro·
parisons with a control. Table Ir'. Biometrics. \ 'OI. 20, 1964, pp. 482-491.)
5721 Apéndices
26.98 32.82 37.08 40.41 43.12 45.40 47.36 49.07 50.59 51 .96 55.36
2 8.33 9.80 10.88 11.74 12.44 13.03 13.54 13.99 14.39 14.75 15.65
5.91 6.82 7.50 8.04 8.48 8.85 9.18 9.46 9.72 9.95 10.52
4 5.04 5.76 6.29 6.71 7.05 7.35 7.60 7.83 8.03 8.21 8.66
5 4.60 5.22 5.67 6.03 6.33 6.58 6.80 6.99 7.17 7.32 7.72
6 4.34 4.90 5.30 5.63 5.90 6.12 6.32 6.49 6.65 6.79 7.14
7 4.16 4.68 5.06 5.36 5.61 5.82 6.00 6.16 6.30 6.43 6.76
8 4.04 4.53 4.89 5.17 5.40 5.60 5.77 5.92 6.05 6.18 6.48
9 3.95 4.41 4.76 5.02 5.24 5.43 5.59 5.74 5.87 5.98 6.28
10 3.88 4.33 4.65 4.91 5.12 5.30 5. 46 5.60 5.72 5.83 6.11
11 3.82 4.26 4.57 4.82 5.03 5.20 5.35 5.49 5.61 5.71 5.98
12 3.77 4.20 4.51 4.75 4.95 5.12 5.27 5.39 5.51 5.61 5.88
13 3.73 4.1 5 4.45 4.69 4.88 5.05 5.1 9 5.32 5.43 5.53 5. 79
14 3.70 4.11 4.41 4.64 4.83 4.99 5. 13 5.25 5.36 5.46 5.71
15 3.67 4.08 4.37 4.59 4.78 4.94 5.08 5.20 5.31 5.40 5.65
16 3.65 4.05 4.33 4.56 4.74 4.90 5.03 5.15 5.26 5.35 5.59
17 3.63 4.02 4.30 4.52 4.70 4.86 4.99 5.11 5.21 5.31 5.54
18 3.61 4.00 4.28 4.49 4.67 4.82 4.96 5.07 5.1 7 5.27 5.50
19 3.59 3.98 4.25 4.47 4.65 4.79 4.92 5.04 5.14 5.23 5.46
20 3.58 3.96 4.23 4.45 4.62 4.77 4.90 5.01 5.11 5.20 5.43
24 3.53 3.90 4.17 4.37 4.54 4.68 4.81 4.92 5.01 5.10 5.32
30 3.49 3.85 4.10 4.30 4.46 4.60 4.72 4.82 4.92 5.00 5.21
40 3.44 3.79 4.04 4.23 4.39 4.52 4.63 4.73 4.82 4.90 5.11
60 3.40 3.74 3.98 4.16 4.31 4.44 4.55 4.65 4.73 4.81 5. 00
120 3.36 3.68 3.92 4.10 4. 24 4.36 4.47 4.56 4.64 4.71 4.90
(Adaptada, con autorización de los autores y de Edward Amold (eds.] Ltd., de E. S. Pearson y H. O. Hartley, Biometri-
ka Tables for Statisticians, 3a. ed. , Charles Griffin & Co. Ltd, Londres, 1970.)
574l Apéndices
gl de error 3 4 5 6 7 8 9 10 11 12 15
135.00 164.30 185.60 202.20 215.80 227.20 237.00 245.60 253.20 260.00 277.00
2 19.02 22.29 24.72 26.63 28.20 29.53 30.68 31.69 32.59 33.40 35.43
3 10.62 12.17 13.33 14.24 15.00 15.64 16.20 16.69 17.13 17.53 18.52
4 8.12 9.17 9.96 10.58 11.10 11 .55 11.93 12.27 12.57 12.84 13.53
5 6.98 7.80 8.42 8.91 9.32 9.67 9.97 10.24 10.48 10.70 11.24
6 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 9.48 9.95
7 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 8.71 9.12
8 5.64 6.20 6.62 6.96 7.24 7.47 7.68 7.86 8.03 8.18 8.55
9 5.43 5.96 6.35 6.66 6.91 7.13 7.33 7.49 7.65 7.78 8.13
10 5.27 5. 77 6.14 6.43 6.67 6.87 7.05 7.21 7.36 7.49 7.81
11 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 7.25 7.56
12 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6. 94 7.06 7.36
14 4.89 5.32 5.63 5.88 6.08 6.26 6.41 6.54 6.66 6.77 7.05
15 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.55 6.66. 6.93
16 4.79 5. 19 5.49 5.72 5.92 6.08 6.22 6.35 6.46 6.56 6.82
17 4.74 5. 14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 6.48 6.73
18 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6. 31 6.41 6.65
19 4.67 5.05 5.33 5.55 5.73 5.89 6.02 6.14 6.25 6.34 6.58
20 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 6.28 6.52
30 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 5.93 6.14
40 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 5.76 5.96
60 4.28 4.59 4.82 4. 99 5.13 5.25 5.36 5.45 5.53 5.60 5.78
120 4.20 4.50 4.71 4.87 5.01 5.12 5.21 5.30' 5.37 5.44 5.61
(Adaptada, con autorización de los autores y de Edward Arnold [eds.] Ltd., de E. S. Pearson y H. O. Hartley, Biometri-
ka Tables for Statisticians, 3a. ed., Charles Griffin & Co. Ltd., Londres, 1970.)
Tablas de probabilidad 1575
Tabla AXIV.13. Probabilidades de la distribución de r (coeficiente de correlación
producto momento de Pearson).
La probabilidad de un valor r también puede calcularse convirtiendo r en un valor t y usan-
do las tablas t (de la AXIV2).
Convertimos r en t con la ecuación siguiente:
rx ~n-2
F-?
donde n es el número de pares de puntuaciones en la correlación.
a) gl = 1 a 20.
Probabilidades de una cola
0.4 0.3 0.2 0. 1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas
gl = n- 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
0.3090 0.5878 0.8090 0.9511 0.9877 0.9969 0.9995 0.9999 1.0000 1.0000
2 0.2000 0.4000 0.6000 0.8000 0.9000 0.9500 0.9800 0.9900 0.9980 0.9990
3 0.1577 0.3197 0.4919 0.6870 0.8054 0.8783 0.9343 0.9587 0.9859 0.9911
4 0.1341 0.2735 0.4257 0.6084 0.7293 0.8114 0.8822 0.9172 0.9633 o. 9741
5 0.1186 0.2427 0.3803 0.5509 0.6694 0.7545 0.8329 0.8745 0.9350 0.9509
6 0.1075 0.2204 0.3468 0.5067 0.6215 0.7067 0.7887 0.8343 0.9049 0.9249
7 0.0990 0.2032 0.3208 0.4716 0.5822 0.6664 0.7498 0.7977 0.8751 0.8983
8 0.0922 0.1895 0.2998 0.4428 0.5494 0.6319 0.7155 0.7646 0.8467 0.8721
9 0.0867 0.1783 0.2825 0.4187 0.5214 0.6021 0.6851 0.7348 0.8199 0.8470
10 0.0820 0.1688 0.2678 0.3981 0.4973 0.5760 0.6581 0.7079 0.7950 0.8233
11 0.0780 0.1607 0.2552 0.3802 0.4762 0.5529 0.6339 0.6835 0.7717 0.8010
12 0.0746 0.1536
1
0.2443 0.3646 0.4575 0.5324 0.6120 0.6614 0.7501 0.7800
13 0.0715 0.1474 0.2346 0.3507 0.4409 0.5140 0.5923 0.6411 0.7301 0.7604
14 0.0688 0.1419 0.2260 0.3383 0.4259 0.4973 0.5742 0.6226 0.7114 0.7419
15 0.0664 0.1370 0.2183 0.3271 0.4124 0.4821 0.5577 0.6055 0.6940 0.7247
16 0.0643 0.1326 0.2113 0.3170 0.4000 0.4683 0.5425 0.5897 0.6777 0.7084
17 0.0623 0.1285 0.2049 0.3077 0.3887 0.4555 0.5285 0.5751 0.6624 0.6932
18 0.0605 0.1248 0.1991 0.2992 0.3783 0.4438 0.5155 0.5614 0.6481 0.6788
19 0.0588 0.1214 0.1938 0. 2914 0.3687 0.4329 0.5034 0.5487 0.6346 0.6652
20 0.0573 0.1 183 0.1888 0.2841 0.3598 0.4227 0.4921 0.5368 0.6219 0.6524
..
5761 Apéndices
b) gi = 21 a 120.
Probabilidades de una cola
0.4 0.3 0.2 0.1 0.05 0.025 0.01 0.005 0.001 0.0005
Probabilidades de dos colas
gl = n - 2 0.8 0.6 0.4 0.2 0.1 0.05 0.02 0.01 0.002 0.001
21 0.0559 0.1154 0.1843 0.2774 0.3515 0.4132 0.4815 0.5256 0.6099 0.6402
22 0.0546 0.1127 0.1800 0.2711 0.3438 0.4044 0.4716 0.5151 0.5986 0.6287
23 0.0534 0.1102 0.1760 0.2653 0.3365 0.3961 0.4622 0.5052 0.5879 0.6178
24 0.0522 0.1078 0.1723 0.2598 0.3297 0.3882 0.4534 0.4958 0.5776 0.6074
25 0.0511 0.1056 0.1688 0.2546 0.3233 0.3809 0.4451 0.4869 0.5679 0.5974
26 0.0501 0.1036 0.1655 0.2497 0.3172 0.3739 0.4372 0.4785 0.5587 0. 5880
27 0.0492 0.1016 0.1 624 0.2451 0.3115 0.3673 0.4297 0.4705 0.5499 0. 5789
28 0.0483 0.0997 0.1594 0.2407 0.3061 0.3610 0.4226 0.4629 0.5415 0. 5703
29 0.0474 0.0980 0.1567 0.2366 0.3009 0.3550 0.4158 0.4556 0.5334 0.5621
30 0.0466 0.0963 0.1540 0.2327 0.2960 0.3494 0.4093 0.4487 0.5257 0.5541
31 0.0458 0.0947 0.1515 0.2289 0.2913 0.3440 0.4032 0.4421 0.5184 0.5465
32 0.0451 0.0932 0.1491 0.2254 0.2869 0.3388 0.3972 0.4357 0.5113 0.5392
33 0.0444 0.0918 0.1468 0.2220 0.2826 0.3338 0.3916 0.4296 0.5045 0.5322
34 0.0437 0.0904 0.1446 0.2187 0.2785 0.3291 0.3862 0.4238 0.4979 0.5254
35 0.0431 0.0891 0.1425 0.2156 0.2746 0.3246 0.3810 0.4182 0.4916 0.5189
36 0.0425 0.0878 0.1405 0.2126 0.2709 0.3202 0.3760 0.4128 0.4856 0.5126
37 0.0419 0.0866 0.1386 0.2097 0.2673 0.3160 0.3712 0.4076 0.4797 0.5066
38 0.0414 0.0855 0.1368 0.2070 0.2638 0.3120 0.3665 0.4026 0.4741 0.5007
39 0.0408 0.0844 0.1350 0.2043 0.2605 0.3081 0.3621 0.3978 0.4686 0.4950
40 0.0403 0.0833 0.1333 0.2018 0.2573 0.3044 0.3578 0.3932 0.4634 0.4896
50 0.0360 0.0744 0.1192 0.1806 0.2306 0.2732 0.3218 0.3542 0.4188 0.4432
60 0.0328 0.0679 0.1088 0.1650 0.2108 0.2500 0.2948 0.3248 0.3850 0.4079
70 0.0304 0.0628 0.1007 0.1528 0.1954 0.2319 0.2737 0.3017 0.3583 0.3798
80 0.0284 0.0588 0.0942 0. 1430 0.1829 0.2172 0.2565 0.2830 0.3364 0.3568
90 0.0268 0.0554 0.0888 0.1 348 0.1726 0.2050 0.2422 0.2673 0.3181 0.3375
100 0.0254 0.0525 0.0842 0.1279 0.1638 0.1946 0.2301 0.2540 0.3025 0.3211
110 0.0242 0.0501 0.0803 0.1220 0.1562 0.1857 0.2196 0.2425 0.2890 0.3068 -
120 0.0232 0.0479 0.0769 0.1 168 0.1496 0. 1779 0.2104 0.2324 0.2771 0.2943
--~------------------------Ti_a_bl_a_s_de~p_ro_b_a_
bi_li_da_d__________________~~
Cuando el tamaño de la muestra es mayor que 100, usamos la ecuación 10.1 de la aproxi-
mación t o la AX.2 de la aproximación z del apéndice X.
a) n = 4 a 40.
....
Probabilidades de una cola
0.25 0.10 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
Probabilidades de dos cotas
n 0.50 0.20 0 .10 0.05 O.Q2 0.01 0.005 0.002 0.001
4 0.600 1.0CO 1.000
S 0.500 0.800 0.900 1.000 1.000
6 0.371 0.657 0.829 0.886 0.943 1.000 1.000
7 0.321 0.571 0.714 0.786 0.893 0.929 0.964 1.000 1.000
8 0.310 0.524 0.643 0.738 0.833 0.881 0.905 0.952 0.976
9 0.267 0.483 0.600 0.700 0.783 0.833 0.867 0.917 0.933
10 0.248 0.455 0.564 0.648 0.745 0.794 0.830 0.879 0.903
11 0.236 0.427 0.536 0.618 0.709 0.755 0.800 0.845 0.873
12 0.224 0.406 0.503 0.587 0.671 0.727 0.776 0.825 0.860
13 0.209 0.385 0.484 0.560 0.648 0.703 0.747 0.802 0.835
14 0.200 0.367 0.464 0.538 0.622 0.675 0.723 0.776 0.811
15 0.189 0. 354 0.443 0.521 0.604 0.654 0.700 0.754 0.786
16 0.182 0.341 0.429 0.503 0.582 0.635 0.679 0.732 0.765
17 0.176 0.328 0.414 0.485 0.566 0.615 0.662 0.713 0.748
18 0.170 0.317 0.401 0.472 0.550 0.600 0.643 0.695 0.728
19 0.165 0.309 0.391 0.460 0.535 0.584 0.628 0.677 0.712
20 0.161 0.299 0.380 0.447 0.520 0.570 0.612 0.662 0.696
21 0.156 0.292 0.370 0.435 0.508 0.556 0.599 0.648 0.681
22 0.152 0.284 0.361 0.425 0.496 0.544 0.586 0.634 0.667
23 0.148 0.278 0. 353 0.415 0.486 0.532 0.573 0.622 0.654
24 0.144 0.271 0.344 0.406 0.476 0.521 0.562 0.610 0.642
25 0.142 0.265 0.337 0.398 0.466 0.511 0.551 0.598 0.630
26 0.138 0.259 0.331 0.390 0.457 0.501 0.541 0.587 0.619
27 0.136 0.255 0.324 0.382 0.448 0.491 0.531 0.577 0.608
28 0.133 0.250 0.317 0.375 0.440 0.483 0.522 0.567 0.598
29 0.130 0.245 0.312 0.368 0.433 0.475 0.513 0.558 0.589
30 0.128 0.240 0.306 0.362 0.425 0.467 0.504 0.549 0.580
31 0.126 0.236 0.301 0.356 0.418 0.459 0.496 0.541 0 .571
32 0.124 0. 232 0.296 0.350 0.412 0.452 0.489 0.533 0.563
...... 33 0.121 0.229 0.291 0.345 0.405 0.446 0.482 0.525 0.554
34 0.120 0.225 0.287 0.340 0.399 0.439 0.475 0.517 0.547
35 0.1 18 0.222 0.283 0.335 0.394 0.433 0.468 0.510 0.539
36 0.116 0.219 0.279 0.330 0.388 0.427 0.462 0.504 0.533
37 0.114 0.216 0.275 0.325 0.383 0.421 0.456 0.497 0.526
38 0.113 0.212 0 .271 0.321 0. 378 0.415 0.450 0.491 0.519
39 0 .11 1 0.210 0.267 0.317 0.373 0.410 0.444 0.485 0.513
40 0.110 0.207 0.264 0.313 0.368 0.405 0.439 0.479 0.507
(Adaptada de J. H. Zar, "Significance testing of the Spearman rank correlation coefficicnt", la tabla l deJouriUll of the
American Statistical Association, vol. 76, 1972, pp. 578-580. Reimpresa con autorización de Journal ofthe American
Statistical Association, copyright 1972 por la American Statislical Association. Todos los derechos reservados.)
578l Apéndices
(Adaptada de J. H. Zar, "Sign ificance testing ofthc Speannan rank correlation coefficient", la tabla 1 de Jow·nal ofthe
American Statistical Association, vol. 76, 1972, pp. 578-580. Reimpresa con autorización de Joumal of the American
Statisrical Association. copyright 1972 por la American Statistical Association. Todos los derechos reservados.)
·+ Tablas de probabilidad 1579
Tabla AXIV.15. Valores críticos de la tau de Kendall.
Si la muestra es mayor que 1O, usamos la ecuación AX.3 de la aproximación z del apén-
dice X.
4 1.0000 1.0000
·• 4 1.0000
0.8000 1.0000 1.0000
(Adaptadas, con autorización del autor y de Edward Arnold [eds.] Ltd. , de M. G. Kendall, Rank Correlation Methods,
4a. ed., Charles Gri ffin & Co. Ltd., Londres, 1970.)
Tabla AXIV. 16. Probabilidades de la tau de Kendall como correlación parcial "xy·z·
En la tabla se aprecian las probabilidades de tau para tamaños de muestra de hasta 50.
Maghsoodloo y Palios (1985) observaron que, con tamaños superiores a ése, puede usarse
cierta aproximación normal a fin de calcular la probabilidad del coeficiente de correlación
parcial de Kendall:
Tabla AXIV. 16. Probabilidades de la tau de Kendall como correlación parcial 'xv·z·
(Adaptada, con au torización de Gordon and Breach Publishers, de las tablas U y V de S. Maghsoodloo, "Estimates of
the quantities ofKcndall 's partial rank corrclation coefficient", Joumal ofStatistical Computing and Simula/ion, vol. 4,
1975, pp. 155-164; y de las tablas I y II de S. Maghsoodloo y L. L. Palios, "Asymptotic behaviour ofKendall's partial
rank correlation cocfficicnt and additional quantilc estimates", Joumal ofStatistical Compuling and Simulation, vol. 13,
1981, pp. 41-48.)
------------------------~t~ab~la=s~d~e~p~ro~b~ab~il~id~a~d----------------~~
Tabla AXIV.17. Coeficiente de concordancia de Kendall (W).
k =3
n Probabilidad
... 8
0.05
0.3758
0.01
0.5219
9 0.3333 0.4685
10 0.3000 0.4255
12 0.2497 0.3594
14 0.2138 0.3110
15 0.1996 0.2911
16 0.1871 0.2738
18 0.1662 0.2448
20 0.1496 0.2213
k=4 k= 5 k= 6 k=7
Probabilidad Probabilldad Probabilidad Probabilidad
(Adaptada, con autorización del autor y de Edward Amold [eds.] Ltd., de M. G. Kendall , Rank Correlation Methods,
4a. ed., Charles Griffin & Co. Ltd. , Londres, 1970.)
582l~---------------------A~p_én_d_ic_es__________________________
Probabilidad
n 0.20 0.15 0.10 0.05 0.01
1 0.900 0.925 0.950 0.975 0.995
2 0.684 0.726 0.776 0.842 0.929
3 0.565 0.597 0.642 0.708 0.828
4 0.494 0.525 0.564 0.624 0.733
5 0.446 0.474 0.510 0.565 0.669
6 0.410 0.436 0.470 0.521 0.618
7 0.381 0.405 0.438 0.486 0.577
8 0.358 0.381 0.411 0.457 0.543
9 0.339 0.360 0.388 0.432 0.514
10 0.322 0.342 0.368 0.410 0.490
11 0.307 0.326 0.352 0.391 0.468
12 0.295 0.313 0.338 0.375 0.450
13 0.284 0.302 0.325 0.361 0.433
14 0.274 0.292 0.314 0.349 0.418
15 0.266 0.283 0.304 0.338 0.404
16 0.258 0.274 0.295 0.328 0.392
17 0.250 0.266 0.286 0.318 0.381
18 0.244 0.259 0.278 0.309 0.371
19 0.237 0.252 0.272 0.301 0.363
20 0.231 0.246 0.264 0.294 0.356
25 0.210 0.220 0.240 0.270 0.320
30 0.190 0.200 0.220 0.240 0.290
35 0.180 0.190 0.210 0.230 0.270
Más de 35 1.07 1.14 1.22 1.36 1.63
.[n .[n l;, ,In Fn
XV
Tablas de poder
Introducción
Hemos intentado simplificar el proceso del cálculo de poder sin sobrecargar el libro con
tablas de poder. Para ello, cedimos en algunos aspectos. En primer lugar, presentamos
sólo tablas para a= 0.05. En segundo, para pruebas como x 2 , ANOVA y regresión múlti-
ple, incorporamos tablas para un conjunto limitado de grados de libertad. En tercero, en el
caso del ANO VA, usamos -r¡ 2 como medida del tamaño del efecto. Además, es necesario
explicar brevemente cómo emplear tales tablas en diseños intrasujetos, en diseños entre su-
jetos con tamañ~s de muestras desiguales y para ANOVA entre sujetos con más de una VI,
así como para calcular el poder para tamaños de la muestra y gl cuando no se encuentren en
las tablas. Un asterisco(*) indica que el poder de la prueba es de más de 0.995.
....
1
Tamaño de la muestra ajustado para las tablas de poder
cuando se usan tamaños de muestras desiguales
Pruebas t entre sujetos. Cuando usamos muestras de tamaño desigual en una prueba t entre
sujetos, el poder se reduce con relación al que tendría en un diseño de muestras iguales. Para
interpretar las tablas de poder es necesario calcular un tamaño de muestra ajustado nh, usando
la media armónica de ambos tamaños de muestra.
=
"
n
583
584lL_________________________A~p~én_d~ic~e~s______________________________
donde nh es la media armónica
n 1 es el tamaño de una muestra
n2 es el tamaño de la otra
Por tanto, si n 1 = 10 y n 2 = 30,
2xl0x30
10+ 30
15
En este caso, el poder de la prueba será el mismo que el de un diseño con 15 personas en
cada grupo, aun cuando tengamos aquí un total de 40 participantes.
ANOVA entre sujetos. En el ANOVA entre sujetos utilizamos la media aritmética. Por tanto,
si tuviésemos tres grupos con 15, 20 y 30 participantes, respectivamente, el tamaño de la
muestra por grupo deberá tratarse como sigue:
15+20+30
n = = 2 1.67 o 21, redondeado al entero inferior siguiente
3
Interpolación
La técnica de la interpolación lineal descrita en el apéndice XIV para las tablas de proba-
bilidad permite calcular valores de poder y tamaños de muestra aproximados si no figuran
en las tablas del presente apéndice. Cohen (1988) proporciona una variedad mucho más
amplia de valores tabulados.
poder =
n real- n inferior
poder inferior + (poder superior - poder inferior) x ( n supenor
. ·- n m
. fienor
.
J
donde los poderes y "tamaños de muestra superiores e inferiores son los que se muestran en
las tablas.
Imaginemos que realizamos una prueba t de una cola entre sujetos con a= 0.05, con unta-
maño de muestra de 22 personas por grupo, y que hemos calculado un tamaño del efecto
(d) de 0.5.
= 0.492
l22-20J
- -
25-20
______________________________r._a_b_la_
s _d_
e~p_o_de_r____________________~~
Cálculo de poder de un tamaño del efecto (TE) intermedio. Para calcular el poder de un
tamaño del efecto intermedio, utilizaremos la ecuación siguiente:
Si realizamos una prueba t de una cola entre sujetos con datos que tienen un tamaño del
efecto de 0.56, con una muestra de 20 participantes por grupo y con a = 0.05, entonces:
0 56 0
poder= 0.46 +(0.58-0.46)x ( · - ·:)
0.6-0.:>
0.532
Cálculo del tamaño de la muestra para un nivel de poder intermedio. En el cálculo del
tamaño de la muestra para un nivel de poder intermedio, utilizaremos esta ecuación:
Si deseáramos obtener un poder de 0.8 en una prueba t de una vía y una cola entre sujetos
con un tamaño del efecto de 0.4, necesitaríamos el siguiente número de participantes por
grupo:
d' = d
,/2x(1-r)
586lL________________________A~p_én_d_ic~e~s_____________________________
Por tanto,
0.07
d' =
~2x{I-0.9883)
0.458 (lo cual, redondeado a dos decimales, coincide con la
cifra presentada anteriormente)
n' = ~+1
2+ 1
9
------------------------------Ti~a~b~la~s~d~e~p~od~e~r--------------------~~
Para el tipo de lista, n' es igual a 13.
Los tamaños (t') 2) de los tres efectos fueron 0.57 para el tipo de lista, 0.05 para el tipo
de estrategia nemotécnica y 0.11 para la interacción. En la tabla AXV.Sa se aprecia que el
poder de la prueba con r¡ 2 = 0.57, gl del tratamiento= 1 y n' = 13 es de más de 0.95. Según la
tabla AXV.Sb, el poder de la prueba con r¡ 2 = 0.05, gl del tratamiento = 2 y n' = 9 fue igual
a 0.16 y para r¡ 2 = 0.11, gl del tratamiento= 2 y n' = 9 fue ligeramente superior a 0.29.
~- 31.5
6
.. ...
8 0.09 0.1 4 0.21 0.30 0.41 0.52 0.63 0.73 0.82 0.88 0.93 0.96 0.98
9 0.09 0.15 0.23 0.33 0.44 0.56 0.68 0.77 0.85 0.91 0.95 0.97 0.99 0.99
10 0.09 0.1 6 0.24 0.35 0.47 0.60 0.72 0.81 0.89 0.94 0.97 0.98 0.99
.. ..
0.16 0.26 0.38 0.51 0.63 0.75 0.84 0.91 0.95 0.98 0.99
..
11 0.09
12 0.10 0.17 0.27 0.40 0.53 0.67 0.78 0.87 0.93 0.97 0.98 0.99
0.99
.. .. ..
13 0.10 0.18 0.29 0.42 0.56 0.70 0.81 0.89 0.95 0.98
...
14 0.10 0.18 0.30 0.44 0.59 0.73 0.84 0.91 0.96 0.98 0.99
.. ... .. ..
15 0. 10 0.19 0.31 0.46 0.61 0.75 0.86 0.93 0.97 0.99
16 0.11 0.20 0.33 0.48 0.64 0.77 0.88 0.94 0.97 0.99
... .. ..
17 0.1 1 0.21 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99
0.82 0.91 0.96 0.99
. .
18 0.1 1 0.21 0.35 0.52 0.68
.. ... ... .. .. .. ..
19 0.11 0.22 0.37 0.54 0.70 0.83 0.92 0.9?- 0.99
20 0.12 0.23 0.38 0.56 0.72 0.85 0.93 0.97 0.99
0.26 0.44 0.64 0.80 0.91 0.97 0.99
... ..
25 0.13
... ...
0.14 0.29 0.50 0.71 0.86 0.95 0.99
. .. .. ..
30
.
35 0.15 0.32 0.55 0.76 0.91 0.97 0.99
...
0.81 0.94 0.98
.. .. .. .. .. .. ... ...
40 0.16 0.35 0.60
45 0.17 0.38 0.64 0.85 0.96 0.99
so
.. ..
0.17 0.41 0.68 0.88 0.97
...
60
... ...
0.51 0.81 0.96 0.99
.. .. .. ..
70 0.21
0.23 0.56 0.85 0.97
... .. ...
80
.. .. .. .. ..
0.24 0.60 0.89 0.98
.. .. ...
90
100 0.26 0.64 0.91 0.99
..
...
0.29 0.71 0.95
.. ... .. ... ..
120
0.76 0.97
.. ... .
...
140 0.32
... ...
0.81 0.98
.. .. . ... ...
160 0.35
.. .. .. ..
180 0.38 0.85 0.99
.. .. .. ...
0.41 0.88
. .
200
0.97
.. .. ..
300 0.53
400 0.64
..
0.99
.. .. ... ... .. ... . ..
... ... ... ..
0.72
.. .. ..
500
... .. .. .. ... ..
600 0.79
700 0.84
800
900
0.88
0.91 .. . .. .. . . . . . . . . ..
1000 0.94
Tablas de poder
------------------------------------~----------------------~
f589
Tabla AXV. 1. Tablas de poder para la prueba z de un solo grupo.
b) Pruebas de dos colas.
Tamaño del efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
-
4 0.05 0.06 0.09 0.12 0.17 0.22 0.29 0.36 0.44 0.52 0.59 0.67 0.74 0.80
5 0.05 0.07 0.10 0.14 0.20 0.27 0.35 0.43 0.52 0.61 0.69 0.77 0.83 0.88
6 0.05 0.07 0.11 0.16 0.23 0.31 0.40 0.50 0.60 0.69 0.77 0.84 0.89 0.93
7 0.05 0.08 0.12 0.18 0.26 0.35 0.46 0.56 0.66 0.75 0.83 0.89 0.93 0.96
8 0.05 0.08 0.13 0.20 0.29 0.40 0.51 0.62 0.72 0.81 0.88 0.92 0.96 0.98
9 0.05 0.09 0.14 0.22 0.32 0.44 0.56 0.67 o. 77 0.85 o. 91 o. 95 0.97 0.99
10 0.05 0.09 0.16 0.24 0.35 0.48 0.60 0.72 0.81 0.89 0.94 0.97 0.98 0.99
11 0.05 0.10 0. 17 0.26 0.38 0.51 0.64 0.76 0.85 o. 91 o.95 o. 98 o.99
12 0.05 0.10 0.18 0.28 0.41 0.55 0.68 0.79 0.88 0.93 0.97 0.99 0.99
13 0.05 0.11 0.19 0.30 0.44 0.58 0.71 0.82 0.90 0.95 0.98 0.99
14 0.06 0.11 0.20 0.32 0.46 0.61 o. 75 0.85 0.92 0.96 0.98 0.99
15 0.06 0.12 0.21 0.34 0.49 0.64 o. 77 0.87 0.94 0.97 0.99
16 0.06 0.12 0.22 0.36 O. 52 0.67 0.80 0.89 0.95 0.98 0.99
17 0.06 0.13 0.23 0.38 0.54 0.70 0.82 0.91 0.96 0.98 0.99
18 0.06 0.13 0.25 0.40 0.56 0.72 0.84 0.92 0.97 0.99
19 0.06 0.14 0.26 0.41 0.59 0.74 0.86 0.94 0.98 0.99
20 0.07 o. 14 0.27 0.43 0.61 0.77 0.88 0.95 0.98 0.99
25 0.07 0.17 0.32 0.52 0.71 0.85 0.94 0.98 0.99
30 0.08 0.19 0.38 0.59 0.78 0.91 0.97 0.99
35 0.09 0.22 0.43 0.66 0.84 0.94 0.99
40 o.09 o.24 o.48 o.n 0.89 0.97 0.99
45 0.10 0.27 0.52 0.77 0.92 0.98
50 0.11 0.29 0.56 0.81 0.94 0.99
60 0.12 0.34 0.64 0.87 0.97
70 0.13 0.39 0.71 0.92 0.99
80 0.14 0.43 O. 77 O. 95 O. 99
90 0.16 0.48 0.81 0.97
100 0.17 0.52 0.85 0.98
120 0.19 0.59 0.91 0.99
140 0.22 0.66 0.94
160 0.24 0.72 0.97
180 0.27 0.77 0.98
200 0.29 0.81 o. 99
300 0.41 0.93
400 0.52 o. 98
500 0.61 0.99
600 0.69
700 0.75
800 0.81
900 0.85
-
1000 0.89
59Ql Apéndices
n 0.1 0.2 0.3 0.4 0.5 0.6 o.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
8 0.07 0.10 0.13 0.18 0.23 0.29 0.36 0.44 0.52 0.59 0.67 0.73 0.79 0.84
9 0.07 0.10 0.14 0.19 0.25 0.32 0.40 0.48 0.56 0.64 0.72 0.78 0.84 0.88
10 0.07 0.11 0.15 0. 21 0.27 0.35 0.43 0.52 0.61 0.69 0.76 0.82 0.87 0.91
11 0.08 0.11 0.16 0.22 0.29 0.38 0.47 0.56 0.65 0.73 0.80 0.86 0.90 0.93
12 0.08 0.12 0.17 0.23 0.31 0.40 0.50 0.59 0.68 0.76 0.83 0.88 0.92 0.95
13 0.08 0.12 0.18 0.25 0.33 0.43 0.53 0.63 0.72 0.80 0.86 0.90 0.94 0.96
14 0.08 0.13 0.19 0.26 0.35 0.45 0.56 0.66 0.75 0.82 0.88 0.92 0.95 0.97
15 0.08 0.13 0.19 0.27 0.37 0.48 0.58 0.69 0.77 0.85 0.90 0.94 0.96 0.98
16 0.08 0.13 0.20 0.29 0.39 0.50 0.61 0.71 0.80 0.87 0.92 0.95 0.97 0.98
17 0.09 0.14 0.21 0.30 0.41 0.52 0.63 0.74 0.82 0.88 0.93 0.96 0.98 0.99
18 0.09 0.14 0.22 0.31 0.42 0.54 0.66 0.76 0.84 0.90 0.94 0.97 0.98 0.99
19 0.09 0.15 0.23 0.33 0.44 0.56 0.68 0.78 0.86 0.91 0.95 0.97 0.99
.
0.99
20 0.09 0.15 0.23 0.34 0.46 0.58 0.70 0.80 0.87 0.93 0.96 0.98 0.99
. .
25 0.10 0.17 0.27 0.40 0.54 0.67 0.79 0.87 0.93 0.97 0.98
.
0.99
. .
30 0.10 0.19 0.31 0.45 0.60 0.74 0.85 0.92 0.96 0.98
. .
0.99
. .
. . .
... ...
35 0.11 0.20 0.34 0.50 0.66 0.80 0.89 0.95 0.98 0.99
40
45
0.11
0.12
0.22
0.24
0.37
0.41
0.55
0.59
0.72
0.76
0.84
0.88
0.93
0.95
0.97
0.98
0.99
0.99
.
.. . ..
50
60
0.12
0.13
0.26
0.29
0.44
0.49
0.63
0.70
0.80
0.86
0.91
0.95
0.97
0.98
. .
..
0.99
.. .. .. . .
. .
70
80
0. 14
0.1~
0.32
0.35
0.55
0.60
0.76
0.81
0.90
0.93
0.97
0.98 .. .. ..
0.99
. . .
. . .
. .
. .
90 0.16 0. 38 0.64 0.85 0.95 0.99
. . . . .. . . .
100 0.17 0.41 0.68 0.88 0.97
. . . .
0.99
. . . .
110 0.18 0.43 0.72 0.90 0.98
. . . . . . . . .
. . . . . .. .
.. ..
120 0.19 0.46 0.75 0.93 0.99
. . . .
... .. ...
130 0.20 0.48 0.78 0.94 0.99
. . . . .
... ...
140 0.21 0.51 0.80 0.95 0.99
150 0.22 0.53 0.83 0.96
. . . . .
. . . . .
... .. ...
160 0.23 0.56 0.85 0.97
.
170 0.23 0.58 0.87 0.98
. . . . .
. . . .
. .
. .
...
180 0.24 0.60 0.88 0.98
190 0.25 0.62 0.90 0.99
. . . . . . . . .
200 0.26 0.64 0.91
.
0.99
. . . . . . . . .
300 0.34 0.79
. .
0.98
. . . . . .. .. .. . .
400 0.41 0.88
. . . . . . . .
500 0.47 0.94
. . . . . . . . . . . .
600 0.53 0.97
. . . . . . . . . . . .
700 0.59 0.98
. . . . . . . . . . . .
800 0.64
.
0.99
. . . . . . . . . . .
900
1000
0.68
0.72 . . . . . . . . . . . . .
r ________________________________
Ta_b_la_s_d_e~po_d_e_r____________________ --Jf'591
Tabla AXV.2. Poder de una prueba t entre sujetos.
b) Pruebas de dos colas (n es el número de personas por grupo).
Tamaño del efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
8 0.05 0.05 0.07 0.10 0.14 0.18 0.23 0.30 0.37 0.44 0.52 0.60 0.67 0.74
9 0.05 0.05 0.08 0.1 1 0.15 0.20 0.27 0.34 0.42 0.50 0.58 0.66 0.73 0.80
10 0.05 0.06 0.08 0.12 0.17 0.23 0.30 0.38 0.47 0.55 0.64 0.72 0.78 0.84
11 0.05 0.06 0.09 0.13 0.19 0.25 0.33 0.42 0.51 0.60 0.69 0.76 0.83 0.88
12 0.05 0.06 0.10 0.14 0.20 0.28 0.36 0.46 0.55 0.64 0.73 0.80 0.86 0.91
13 0.05 0.07 0.10 0.15 0.22 0.30 0.39 0.49 0.59 0.68 0.77 0.84 0.89 0.93
14 0.05 0.07 0.11 0.16 0.24 0.32 0.42 0.52 0.63 0.72 0.80 0.86 0.91 0.94
15 0.05 0.07 0.12 0.17 0.25 0.34 0.45 0.56 0.66 0.75 0.83 0.89 0.93 0.96
16 0.05 0.08 0.12 0.18 0.27 0.37 0.48 0.59 0.69 0.78 0.85 0.91 0.94 0.97
17 0.05 0.08 0.13 0.20 0.28 0.39 0.50 0.62 0.72 0.81 0.87 0.92 0.96 0.98
18 0.05 0.08 0.13 0.21 0.30 0.41 0.53 0.64 0.75 0.83 0.89 0.94 0.96 0.98
19 0.05 0.08 0.14 0.22 0.31 0.43 0.55 0.67 0.77 0.85 0.91 0.95 0.97 0.99
20
25
0.05
0.05
0.09 0.14
0.10 0.17
0.23
0.28
0.33
0.40
0.45
0.54
0.57
0.68
0.69
0.79
0.79
0.88
0.87
0.93
0.92
0.97
0.96
0.98
. ..0.98
0.99
0.99
...
30 0.06 0.11 0.20 0.33 0.47 0.63 0.76 0.86 0.93 0.97 0.99
. . .
0.99
35 0.06 0.13 0.23 0.37 0.54 0.70 0.82 0.91 0.96 0.98
.
0.99
. .
40 0.06 0.14 0.26 0.42 0.60 0.75 0.87 0.94 0.98
.
0.99
. . . .
45 0.07 0.15 0.29 0.46 0.65 0.80 0.91 0.96 0.99
. . . . .
50
60
0.07
0.08
0.16 0.31
0.19 0.37
0.51
0.58
0.70
0.78
0.84
0.90
0.93
0.97
... ..
0.98
.
0.99
0.99
. .
. ... .
.
..
70 0.08 0.21 0.42 0.65 0.84 0.94 0.98
. . . .
80
90
0.09
0.10
0.24 0.47
0.26 0.52
0.71
0.76
0.88
0.92
0.96
0.98 .0.99
. .
. . . .
. .
. .
. .
.
.
.
.. ... ... ... ... . . . .
100 0.10 0.29 0.56 0.80 0.94 0.99
110 0.11 0.31 0.60 0.84 0.96 0.99
. . . .
120 0.12 0.34 0.64 0.87 0.97
. . . .
130
140
0.12
0.13
0.36 0.67
0.38 0.71
0.89
0.92
0.98
0.99 . . . . .
. . . . .
.
.
.
. . .
. .
150 0.14 0.41 0.74 0.93 0.99
. . . . . . . . .
160 0.14 0.43 . 0.76 0.95 0.99
. . . . . . . . .
. .
... . . . . . . .
170 0.15 0.45 0.79 0.96
. . . . . . .
... ...
180 0.15 0.47 0.81 0.97
190 0.16 0.49 0.83 0.97
. . . . .. .. .
200 0.17 0.51 0.85
.
0.98
. . . .
300 0.23 0.69 0.96
. . . . . . . . . . .
. .. ..
400 0.29 0.81 0.99
. . . . . . . . . .
500
600
0.35
0.41
0.88
0.93 .. .
.
.
.
. . .
.. .. .. ... . .
. . . . .
700
800
0.46
0.52
0.96
0.98 .. .
.
.
. . . . . .
. .
.
. . .
. . .
900
1000
0.56
0.61
0.99
0.99 . . . . . . . . . . . .
.....
5921 Apéndices
Tabla AXV.3. Poder de una prueba t intrasujetos o de una prueba t de un solo grupo.
a) Pruebas de una cola.
Tamaño del efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
5 0.06 0.08 0.11 0.14 0.18 0.24 0.30 0.37 0.46 0.54 0.62 0.69 0.76 0.81
6 0.07 0.09 0.13 0.17 0.23 0.30 0.39 0.48 0.57 0.66 0.74 0.80 0.85 0.89
7 0.07 0.10 0.15 0.21 0.28 0.37 0.47 0.57 0.66 0.75 0.81 0.87 0.91 0.94
8 0.08 0.11 0.17 0.24 0.32 0.42 0.53 0.64 0.73 0.81 0.87 0.91 0.94 0.96
9 0.08 0.12 0.18 0.26 0.36 0.48 0.59 0.70 0.79 0.86 0.91 0.94 0.96 0.98
10 0.08 0.13 0.20 0.29 0.40 0.52 0.64 0.75 0.83 0.89 0.93 0.96 0.98 0.99
11 0.08 0.14 0.22 0.32 0.44 0.57 0.69 0.79 0.87 0.92 0.95 0.97 0.98 0.99
12 0.09 0.15 0.23 0.34 0.48 0.61 0.73 0.82 0.89 0.94 0.97 0.98 0.99 0.99
13 0.09 0.15 0.25 0.37 0.49 0.65 0.76 0.85 0.92 0.95 0.98 0.99 0.99
14 0.09 0.16 0.26 0.39 0.54 0.68 0.79 0.88 0.93 0.96 0.98 0.99
15 0.10 0.17 0.28 0.42 0.57 0.71 0.82 0.90 0.95 0.97 0.99 0.99
16 0.10 0.18 0.29 0.44 0.60 0.74 0.84 0.92 0.96 0.98 0.99
17 0.10 0.19 0.31 0.46 0.62 0.76 0.86 0.93 0.97 0.98 0.99
18 0.10 0.19 0.32 0.48 0.65 0.78 0.88 0.94 0.97 0.99
19 0.11 0.20 0.34 0.50 0.67 0.81 0.90 0.95 0.98 0.99
20 0.11 0.21 0.35 0.52 0.69 0.82 0.91 0.96 0.98 0.99
25 0.12 0.24 0.42 0.61 0.78 0.90 0.96 0.98 0.99
30 0.13 0.28 0.48 0.69 0.85 0.94 0.98 0.99
35 0.14 0.31 0.53 0.75 0.89 0.96 0.99
40 0.15 0.34 0.58 0.80 0.93 0.98
45 0.16 0.37 0.63 0.84 0.95 0.99
50 0.17 0.40 0.67 0.87 0.97 0.99
60 0.19 0.45 0.74 0.92 0.98
70 0.20 0.50 0.80 0.95 0.99
80 0.22 0.55 0.84 0.97
90 0.24 0.59 0.88 0.98
100 0.26 0.63 0.91 0.99
110 0.27 0.67 0.93 0.99
120 0.29 0.70 0.95
130 0.30 0.73 0.96
140 0.32 0.76 0.97
150 0.33 0.79 0.98
160 0.35 0.81 o. 98
170 0.36 0.83 0.99
180 0.38 0.85 0.99
190 0.39 0.86 0.99
200 0.41 0.88 o. 99
300 0.53 0.96
400 0.64 0.99
500 0.72
600 0.79
700 0.84
800 0.88
900 0.91
1000 0.94
.... ____________________________Ti_ab_la_s_d_e~p_oo_e_r___________________J~
Tabla AXV.3. Poder de una prueba t intrasujetos o de una prueba t de un solo grupo.
b) Pruebas de dos colas.
Tamaño jel efecto (d)
n 0.1 0.2 0.3 0.4 0.5 0.6 o. 7 0.8 0.9 1.0 1.1 1.2 1.3 1.4
6 0.05 0.05 0.06 0.09 0.12 0.16 0.22 0.28 0.36 0.45 0.55 0.64 0.72 0.79
7 0.05 0.05 0.07 0.11 0.15 0.21 0.29 0.38 0.47 0.58 0.67 0.75 0.82 0.87
8 0.05 0.06 0.09 0.13 0.19 0.26 0.36 0.46 0.57 0.67 0.76 0.83 0.88 0.92
9 0.05 0.06 0.10 0.15 0.22 0.31 0.42 0.54 0.65 0.75 0.83 0.88 0.93 0.95
10 0.05 0.07 0.11 0.17 0.26 0.36 0.48 0.60 0.71 0.80 0.87 0.92 0.95 0.97
11 0.05 0.07 0.12 0.19 0.29 0.41 0.54 0.66 0.77 0.85 0.91 0.94 0.97 0.98
12 0.05 0.08 0.13 0.22 0.32 0.45 0.59 0.71 0.81 0.88 0.93 0.96 0.98 0.99
13 0.05 0.09 0.15 0.24 0.36 0.49 0.63 0.75 0.85 0.91 0.95 0.97 0.99 0.99
14 0.05 0.09 0.16 0.26 0.39 0. 53 0.67 0.79 0.88 0.93 0.96 0.98 0.99
15 0.05 0.10 0.17 0.28 0.42 0.57 0.71 0.82 0.90 0.95 0.97 0.99 0.99
16 o.o5 ·o,10 0.18 0.30 0.45 0.60 0.74 0.85 0.92 0.96 0.98 0.99
17 0.05 0.11 0.20 0.32 0.48 0.64 0.77 0.87 0.93 0.97 0.99 0.99
18 0.06 0.11 0.21 0.34 0.50 0.67 0.80 0.89 0.95 0.98 0.99
19 0.06 0.12 0.22 . 0.36 0.53 0.69 0.82 0.91 0.96 0.98 0.99
-
20 0.06 0.12 0.23 0.38 0.56 0.72 0.84 0.92 0.97 0.99 0.99
25 0.07 0.15 0.29 0.47 0.67 0.82 0.92 0.97 0.99
30 0.07 0.18 0.35 0.56 0.75 0.89 0.96 0.99
35 0.08 0.20 0.40 0.63 0.82 0.93 0.98 0.99
40 0.09 0.23 0.45 0.69 0.87 0.96 0.99
45 0.09 0.25 0.50 0.75 0.91 0.97 0.99
50 0.10 0.28 0.54 o. 79 o.93 o.98
60 0.11 0.33 0.63 0.86 0.97 0.99
70 0.13 0.37 0.70 0.91 0.98
80 0.14 0.42 0.75 0.94 0.99
90 0.15 0.46 0.80 0.96
100 0.16 0.51 0.84 0.98
110 0.18 0.55 0.88 0.99
120 0.19 0.58 0.90 0.99
130 0.20 0.62 0.92 0.99
140 0.21 0.65 o. 94
150 0.23 0.68 o. 95
160 0.24 o. 71 o. 96
170 0.25 o. 74 o. 97
180 0.26 o. 76 o. 98
190 0.28 0.78 0.98
200 0.29 0.80 o. 99
300 0.41 o. 93
400 0.51 o. 98
500 0.61 o. 99
600 0.69
700 0.75
800 0.81
900 0.85
1000 0.88
594lL--------------------~A~p~é_nd_ic~e~
s _________________________
900 0.77 • • • •
1000 0.82 • . • • • .. .. .
5961 Apéndices
.
* *
*
* .• *
*
170 <0.20 0.58 0.92 * * * • *
180 <0.20 0.60 0.94 * * * *
.•
* *
190 <0.20 0.63 0.95 * * • • *
200 0.20 0.65 0.96 * * * * *
250
300
0.23
0.27
0.76
0.84
0.99
*
•
.•
*
*
*
* ..
* *
*
*
*
350
400
0.32
0.36
0.90
0.93
* * *
.
* *
*
.•
* * * * *
450 0.40 0.96 * * * * * •
500 0.44 0.98 •
.
* * * * *
• •
600 0.52 0.98
.. *
..
*
..
* * *
700 0.59
.. .. * *
.. ..
* *
800 0.65 • * • • * •
900
1000
:Q.71
'0.76
*
*
*
*
·•
. .
* *
*
*
•
1100 0.81 • * • * * * * *
------------------------~Ti~ab~la~s~d~e~po~d~e~r----------------~~
Tabla AXV.4. Poder de una prueba x2.
d) gi = 4.
Tamaño del efecto (w)
n 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.26 0.40 0.55 0.71 0.83 0.91
22 <0.20 <0.20 <0.20 0.29 0.43 0.60 0.75 0.87 0.94
24 <0.20 <0.20 <0.20 0.31 0.47 0.64 0.80 0.90 0.96
26 <0.20 <0.20 0.20 0.33 0.50 0.69 0.83 0.92 0.97
28 <0.20 <0.20 0.21 0.36 0.54 0.72 0.86 0.94 0.99
30 <0.20 <0.20 0.23 0.38 0.57 0.76 0.88 0.96 0.99
35 <0.20 <0.20 0.26 0.44 0.65 0.82 0.93 0.98 *
40 <0.20 <0.20 0.29 0.50 0.72 0.88 0.96 0.99 *
45 <0.20 <0.20 0.33 0.55 0.77 0.91 0.98 * •
50 <0.20 <0.20 0.36 0.61 0.82 0.94 0.99 * *
55 <0.20 <0.20 0.39 0.65 0.86 0.96 * • *
60 <0.20 0.20 0.42 0.70 0.89 0.98 * • •
65 <0.20 0.22 0.46 0.74 0.91 0.99 • • •
70 <0.20 0.23 0.49 0.77 0.93 0.99 • * *
75 <0.20 0.25 0.52 0.80 0.95 * • * •
80 <0.20 0.26 0.55 0.83 0.96 • * •
.. .• .
*
85 <0.20 0.28 0.58 0.86 0.98 * • •
90 <0.20 0.29 0.61 0.88 0.98 *
95 <0.20 0.31 0.64 0.89 0.99 • • •
100 <0.20 0.32 0.67 0.91 0.99 * • * •
110 <0.20 0.35 0.71 0.94 * * * • *
120 <0.20 0.38 0.76 0.96 * • * • *
130 <0.20 0.41 0.79 0.97 • • • • •
140
150
<0.20
<0.20
0.44
0.47
0.82
0.85
0.98
0.99
•
•
•
•
•
.
•
•
* .*
..
* *
350 0.28 0.87 • • • • •
.
* *
400 0.32 0.91 • • • • • •
450 0.36 0.94 • • * • •
0.40 0.96 • • •
.
500 * * * *
600 0.47 0.99 • • • • • •
..
*
700 0.54 • • • • •
.•
* *
800 0.61 • * * • • •
900 0.67 • • •
.
* * *
1000 0.72 * * * • * * * *
1100 0.76 • * • * * * *
1200 0.80 * • • * * • • *
598l~-----------------------A~pe_·n_d_ic_e_s___________________________
...
28 0.33 0.68
30 <0.20 <0.20 0.20 0.35 0.53 0.72 0.86 0.94 0.98
<0.20 <0.20
..
35 0.23 0.40 0.61 0.79 0.91 0.97
<0.20 <0.20
..
40 0.26 0.46 0.68 0.85 0.95 0.99
..
45 <0.20 <0.20 0.29 0.51 0.74 0.89 0.97
..
50 <0.20 <0.20 0.33 0.56 0.79 0.93 0.98
<0.20
.•• .
55 <0.20 0.36 0.61 0.83 0.95 0.99
...
60 <0.20 <0.20 0.39 0.66 0.87 0.96
.
..
65 <0.20 <0.20 0.42 0.70 0.90 0.98
<0.20 0.21 0.45 0.73 0.92 0.98
..
70
75 <0.20
<0.20
0.22
0.24
0.48
0.51
0.77
0.80
0.94
0.95
0.99
..• ..
.. .•• ..
80
<0.20 0.25 0.54 0.83 0.96
...
85
<0.20 0.26 0.57 0.85 0.97
.. ..
90
95 <0.20 0.28 0.60 0.87 0.98
<0.20 0.29 0.62 0.89 0.98 •
.. .. ..•
100
<0.20 0.32 0.67 0.92 0.99 •
...
110
<0.20 0.35 0.72 0.94 • •
..
120
<0.20 0.76 0.96 •
.•• ..
130 0.38
<0.20 0.97 •
...
140 0.40 0.79
<0.20 •
..• .
150 0.43 0.82 0.98
<0.20 •
.. .•
160 0.46 0.85 0.99
<0.20 • •
...
170 0.49 0.87 0.99
<0.20 • •
.. .• ..• .•
180 0.51 0.89
...
190 <0.20 0.54 0.91 • •
<0.20
.. .. .•
200 0.56 0.93
250 <0.20 0.68 0.97
•
.• ..
.. ..
300 0.22 0.77 0.99
350 0.26 0.84 •
• ..
•
.• .•
.. ..
400 0.29 0.89
• •
..• .. ..•
450 0.33 0.93
..
•
..
• •
..•
...
500 0.36 0.95
..
600 0.43 0.98
700 0.50 0.99
..• .. . .. ..• ...
.. ..
0.56
.
800
..• .
900 0.62
.. ... .. ...
0.68
..
1000
1100 0.73
1200
1300
0.77
0.84 . • .• . .•
------------------~------~Ti~ab~l~as~d~e~p~o~de~r------------------~~
Tabla AXV.4. Poder de una prueba xz.
j) gl = 6.
Tamaño del efect o (w)
n 0.1 0.2 0.3 0.4 0 .5 0.6 0.7 0.8 0.9
20 <0.20 <0.20 <0.20 0.22 0.34 0.48 0.63 0.77 0.87
22 <0.20 <0.20 <0.20 0.24 0.37 0.52 0.68 0.81 0.91
24 <0.20 <0.20 <0.20 0.26 0.40 0.57 0.73 0.85 0.93
26 <0.20 <0.20 <0.20 0.28 0.43 0.61 0.77 0.88 0.95
28 <0.20 <0.20 <0.20 0.30 0.47 0 .65 0.80 0.91 0.96
..
30 <0.20 <0.20 <0.20 0.32 0.50 0.68 0.83 0.93 0.98
35 <0.20 <0.20 0.22 0.38 0.57 0 .76 0.89 0.96 0.99
.. ..•
40 <0.20 <0.20 0.25 0.43 0.64 0 .82 0.93 0.98
45 <0.20 <0.20 0.27 0.48 0.70 0 .87 0.96 0.99
50 <0.20 <0.20 0.30 0.53 0 .76 0.91 0.98
55 <0.20 <0.20 0.33 0 .58 0.80 0 .94
..
0.99
.. .•
..
60 <0.20 <0.20 0.36 0.62 0 .84 0 .96 0.99
<0.20 <0.20
..
65 0.39 0.66 0.87 0 .97
...
70 <0.20
.
0.20 0.42 0.70 0.90 0 .98
<0.20
... ..
75 0.21 0.45 0.74 0.92 0 .99
... ..
80 <0.20 0.22 0.48 0.77 0.94 0.99
..
85 <0.20 0.23 0.51 0.80 0.95
. .
90 <0.20 0.25 0.53 0.82 0.96
...
95 <0.20 0.26 0.56 0.85 0.97
.. .•
100 <0.20 0.27 0.59 0.87 0.98
• •
..
110 <0.20 0.30 0.64 0.90 0.99
• •
.. ..
120 <0.20 0.32 0.68 0.93
• • •
.•
130 <0.20 0.35 0.72 0.95
140
150
<0.20
<0.20
0.38
0.40
0.76
0.79
0.96
0.97
..
•
•
•
. ..
160 <0.20 0.43 0.82 0.98 •
..
• • .• ..
. .•
170 <0.20 0.45 0.85 0.99
180 <0.20 0.48 0.87 0.99
• . • •
.. ..
400 0.27 0.87 *
... ..
450 0.30 0.91
... .. . ..• ..
500 0.34 0.94
600 0.40 0.97
... .. .. .•• ..
700 0.47 0.99
•
.. ..
800 0.53
900 •
.. .. .. .• ..
0.59
•
.. .•• ..
1000 0.64
. . . .
1100 0.69
1200 0.74
1300 0.81 •
600l~------------------------A~p_én_d_ic_e_s______________________________
...
35 <0.20 <0.20 0.20 0.35 0.55 0.74 0.88 0.96 0.99
40 <0.20 <0.20 0.23 0.40 0.62 0.80 0.92 0.98
... ..
45 <0.20 <0.20 0.26 0.45 0.68 0.85 0.95 0.99
50 <0.20 <0.20 0.28 0.50 0.73 0.89 0.97
.. ..
55 <0.20 <0.20 0.31 0.55 0.78 0.92 0.99
60
65
<0.20
<0.20
<0.20
<0.20
0.34
0.37
0.59
0.64
0.82
0.86
0.95
0.97
0.99
..
70
75
<0.20
<0.20
<0.20
<0.20
0.40
0.43
0.68
0.71
0.88
0.91
0.98
0.99 .. ... ...
80 <0.20 0.20 0.45 0.75 0.93 0.99
..
... .. ... .
..
85 <0.20 0.22 0.48 0.78 0.94 0.99
90 <0.20 0.23 0.51 0.80 0.96
.. ..
95 <0.20 0.24 0.53 0.83 0.97
100 <0.20 0.25 0.56 0.85 0.98
.. ..
.. ..
110 <0.20 0.28 0.61 0.89 0.99
120 <0.20 0.30 0.66 0.92
0.94
0.99
.. ... .
.. .
130 <0.20 0.33 0.70
... ..•
<0.20
.. ...
140 0.35 0.74 0.96
...
150 <0.20 0.38 0.77 0.97
160 <0.20 0.40 0.80 0.98
..
... .. ... ..
170 <0.20 0.43 0.83 0.99
..
180 <0.20 0.45 0.85 0.99
. .. ...
190 <0.20 0.48 0.88 0.99
.. ... .. ..
200 <0.20 0.50 0.89
.. .•
250 <0.20 0.62 0.96
. .
... ... .
300 <0.20 0.71 0.99
.. ... ..
350 0.22 0.79
... .
400 0.25 0.85
450
500
0.28
0.32
0.89
0.93
.. .. . .. .. ..•
600 0.38 0.97
... .. ...
... ... ... .. ..
700 0.44 0.99
.. ... . ..
800 0.50
.. ... ..
900 0.56
1000 0.62
.. ... . .. ... ...
1100 0.67
.. . ..
1200 0.71
1300
1400
0.79
0.82 . . .•
________________________________
Ta_b_la_s_d_e~po_d_e_r____________________~¡-&01
...
40 <0.20 <0.20 0.22 0.38 0.59 0.78 0.91 0.97 0.99
45 <0.20 <0.20 0.24 0.43 0.65 0.84 0.94 0.99
50 <0.20 <0.20 0.27 0.47 0.71 0.88 0.96 0.99
..
...
55 <0.20 <0.20 0.30 0.52 0.76 0.91 0.98
60
65
<0.20
<0.20
<0.20
<0.20
0. 32
0.35
0.56
0.61
0.80
0.84
0.94
0.96
0.99
0.99 ..
70
75
<0.20
<0.20
<0.20
<0.20
0.37
0.40
0.65
0.68
0.87
0.89
0.97
0.98 ..
0.99
.. ..
80 <0.20 <0.20 0.43 0.72 0.92 0.99
.. .
... ..
85 <0.20 0.20 0.45 0.75 0.93 0.99 *
90 <0.20 0.22 0.48 0.78 0.95 0.99
..
95
100
<0.20
<0.20
0.23
0.24
0.51
0. 53
0.81
0.83
0.96
0.97 ..
0.99
. . ..
110
120
<0.20
<0.20
0.26
0.29
0.58
0.63
0.87
0.90
0.98
0.99 . * * ..
... ...
130 <0.20 0.31 0.67 0.93 0.99 * * *
... ..
140 <0.20 0.33 0.71 0.95 * * *
150
160
<0.20
<0.20
0.36
0.38
0.75
0.78
0.96
0.97
..
*
.. .. ..
170 <0.20 0.40 0.81 0.98
.. .. .
... .
180 <0.20 0.43 0.84 0.99
190
200
<0.20 0.45
0.47
0.86
0.88
0.99
..
0.99 .. *
*
...
.. ... .
<O. Í O
...
250 <0.20 0.59 0.95 * *
300 <0.20 0.68 0.98
..
... ... ... ..
350 0.21 0.77 0.99 * *
.. .. ...
400 0.24 0.83
450 0.27 0.88
.. .
.. ... .. ..
500 0.30 0.92
600 0.36 0.96
. . .. .. *
... .
700 0.42 0.98 *
...
800 0.47 0.99
900
1000
0. 53
0.59 .
* *
. *
*
. .. *
. ..
*
*
... ..
1100 0.64 * * * *
1200
1300
0.68
0.77
*
.
* ..
*
..
* *
.
*
. .. ..
*
1400 0.80
,~
6o2l Apéndices
50
55
<0.20
<0.20
<0.20
<0.20
0.24
0.27
0.44
0.48
0.66
0.71
0.85
0.88
0.95
0.97
0.99
.. ..
60 <0.20 <0.20 0.29 0.52 0.76 0.91 0.99
.. ...
...
65 <0.20 <0.20 0.32 0.56 0.80 0.94 0.99
70 <0.20 <0.20 0.34 0.60 0.83 0.96
..
...
75 <0.20 <0.20 0.37 0.64 0.86 0.97
80
85
<0.20
<0.20
<0.20
<0.20
0.39
0.42
0.68
0.71
0.89
0.91
0.98
0.99 .. ...
90
95
<0.20
<0.20
<0.20
0.21
0.44
0.47
0.74
0.77
0.93
0.94
0.99
.. .. .. ...
... ..
100 <0.20 0.22 0.49 0.79 0.96
110
120
<0.20
<0.20
0.24
0.26
0.54
0.58
0.84
0.87
0.98
0.99
.. ·•
.. ..
... ... ..
130 <0.20 0.28 0.63 0.90 0.99
140 <0.20 0.30 0.67 0.93
.. ...
.. ...
150 <0.20 0.32 0.70 0.95
160 <0.20 0.35 0.74 0.96
.. ... ...
170 <0.20 0.37 0.77 0.97
180 <0.20 0.39 0.80 0.98
.. . ..
... ..
190 <0.20 0.41 0.82 0.99
200
250
<0.20
<0.20
0.44
0.54
0.85
0.93
0.99
.. ... .. .. ...
300 <0.20 0.64 0.97
.. .. ... .. .. ..
...
350 <0.20 0.72 0.99
400 0.22 0.79
.. .. ..
... .. ..
450 0.24 0.85
500 0.27 0.89
.. .. .. ..
... ...
600 0.32 0.95
700
800
0.38
0.44
0.98
..
0.99
... .. .. .. ..
... ... ... ... ...
900 0.49
1000 0.54
.
.. . ...
...
1100 0.59
1200 0.64
.. .. ... .. ...
... ..
1300 0.72
1400
1500
0.76
0.79
. . .. .. . . .. .
1700 0.82
____________________________T<_ __
ab_la_s_d_e~~de_r__________________~~
·-
3 0.06 0.08 0.08 0.11 0.13 0.13 0.17 0.20 0.24 0.29
4 0.06 0.09 0.09 0.13 0.16 0.17 0.23 0.28 0.35 0.42
5 0.06 0.10 0.11 0.15 0.20 0.22 0.29 0.37 0.45 0.54
6 0.06 0.11 0.12 0.18 0.24 0.26 0.35 0.45 0.54 0.64
7 0.06 0.12 0.14 0.21 0.28 0.31 0.41 0.52 0.62 0.72
8 0.06 0.13 0.15 0.24 0.32 0.35 0.47 0.58 0.69 0.79
9 0.06 0.15 0.17 0.27 0.36 0.39 0.52 0.64 0.75 0.84
10 0.06 0.16 0.18 0.30 0.40 0.44 0.57 0.69 0.80 0.88
11 0.07 0.17 0.20 0.32 0.44 0.47 0.62 0.74 0.84 0.91
12 0.07 0.19 0.22 0.35 0.47 0.51 0.66 0.78 0.87 0.93
13 0.07 0.20 0.23 0.38 0.51 0.55 0.70 0.81 0.90 0.95
14 0.07 0.21 0.25 0.40 0.54 0.58 0.73 0.84 0.92 0.96
15 0.07 0.23 0.26 0.43 0.57 0.61 0.76 0.87 0.94 0.97
16 0.08 0.24 0.28 0.46 0.60 0.64 0.79 0.89 0.95 0.98
17 0.08 0.26 0.30 0.48 0.63 0.67 0.82 0.91 0.96 0.99
18 0.08 0.27 0.31 0.50 0.66 0.70 0.84 0.92 0.97 0.99
..•
19 0.08 0.28 0.33 0.53 0.68 0.72 0.86 0.94 0.98
..
0.99
20 0.09 0.30 0.34 0.55 0.70 0.75 0.88 0.95 0.98
25 0.10 0.36 0.42 0.65 0.80 0.84 0.94 0.98
30
35
0.11
0.12
0.42
0.48
0.49
0.55
0.73
0.79
0.87
0.92
0.90
0.94
0.97
0.99
0.99
• .. .•
40
45
0.14
0.15
0.54
0.59
0.61
0.66
0.85
0.89
0.95
0.97
0.96
0.98
0.99
..• .
•
... .•
50
60
0.16
0.19
0.63
0.71
0.71
0.79
0.92
0.96
0.98
0.99
0.99
.. .•• .. ...
70 0.22 0.78 0.85 0.98 •
. .•
.• ...
80 0.24 0.83 0.89 0.99 • •
90
100
0.27
0.30
0.87
0.90
0.92
0.95
0.99
. •
. .•• •
•
•
.•
....
120
140
0.35
0.40
0.95
0.97
0.97
0.99
..•
•
.• .. •
.. .. .• ..
160
180
0.44
0.49
0.98
0.99
.•
0.99
.• .. ..• . .. .• .. ..• .•
200 0.53
.. .•• .. . .. .
... ..• ..
300 0.70
400 0.82
.. .• .• .. ..•
.. .. ..•
500 0.89
600 0.94
.. ..• .. ..
.. ... ... ...
700 0.97
800
900
0.98
0.99
. . ..• .• .. ..
1000 0.99 •
••
6o4l Apéndices
17
18
0.08
0.09
0.28
0.30
0.33
0.35
0.54
0.57
0.71
0.73
0.75
0.78
0.89
0.90
0.96
0.97
0.99
0.99 .
*
..
* * * *
70
80
0.24
0.27
0.85
0.90
0.91
0.94
0.99
..• ..•
•
. ..• .• *
.
90
100
0.30
0.33
0.93
0.95
0.97
0.98 . .. ..• .. ..• ..•
120
140
0.39
0.44
0.98
..
0.99 ..
0.99
..• .•
•
.. ... .. ... ..
160
180
0.50
0.55
.. .. ..• ..• . .. .. ..
200
300
0.60
0.78
.. .. . . ..• .• . ..
400
500
0.89
0.95 .. ..• • .. ..• .• ..• ..
600
700
0.98
0.99 ..
*
. . ..
*
.. . .• .• .•
800 • •
___________________________r._ab_la_s_d_e~p_od_e_r__________________~~
,_
Tamaño del efecto (1')2)
n o 01 o 05 o 059 o 1o o 138 o 15 o 20 o 25 o 30 o 35
3 0.06 0.08 0.08 0.11 0.14 0.15 0.19 0.24 0.30 0.36
4 0.06 0.09 0.10 0.14 0.18 0.20 0.27 0.35 0.44 0.54
5 0.06 0.10 0.12 0.17 0.24 0.26 0.36 0.46 0.57 0.68
6 0.06 0.12 0.13 0.21 0.29 0.32 0.44 0.57 0.69 0.79
7 0.06 0.13 0.15 0.25 0.35 0.38 0.52 0.65 0.77 0.87
8 0.06 0.15 0.17 0.29 0.40 0.44 0.59 0.73 0.84 0.92
9 0.07 0.17 0.19 0.33 0.46 0.50 0.66 0.79 0.89 0.95
10 0.07 0.19 0.22 0.36 0.51 0.55 0.71 0.84 0.93 0.97
11 0.07 0.20 0.24 0.40 0.55 0.60 0.76 0.88 0.95 0.98
12 0.07 0.22 0.26 0.44 0.60 0.65 0.81 0.91 0.97 0.99
13
14
0.08
0.08
0.24
0.26
0.28
0.30
0.47
0.51
0.64
0.68
0.69
0.73
0.84
0.87
0.93
0.95
0.98
0.99
0.99
..
..
15 0.08 0.27 0.32 0.54 0.71 0.76 0.90 0.97 0.99
16
17
0.08
0.09
0.29
0.31
0.34
0.37
0.57
0.60
0.75
0.78
0.79
0.82
0.92
0.94
0.98
0.98
0.99
.
18 0.09 0.33 0.39 0.63 0.80 0.84 0.95 0.99 * •
19 0.09 0.35 0.41 0.66 0.83 0.87 0.96 0.99 *
.. *
.
..
20 0.10 0.37 0.43 0.69 0.85 0.88 0.97 0.99
25
30
0.11
0.13
0.45
0.53
0.53
0.62
0.80
0.87
0.93
0.97
0.95
0.98
0.99
. .. .•
35
40
0.14
0.16
0.61
0.67
0.69
0.76
0.92
0.95
0.98
0.99
.. ..
0.99
.• ..• . *
..•
45
50
0.18
0.19
0.73
0.78
0.81
0.85
0.97
0.98
. . *
*
. ..•
*
..
60
70
0.23
0.26
0.86
0.91
0.92
0.95
.•
•
* .• ..• . *
*
80 0.30 0.94 0.97
..
*
.* * *
..
*
... . ..•
90 0.33 0.97 0.99 * * *
100
120
0.37
0.43
0.98
..
0.99 . ..
0.99
.*
..
*
*
. .. .•
140 0.50
.. ..• ..
*
.. ... ..• .
...
160 0.56 * *
180
zao
0.61
0.66 . . . *
*
.•
300
400
0.85
0.94 .. .• .• ..• .*
.* *
* *
•
.
*
500 0.98
. *
. *
.• .. .* *
. . .•
• *
..
600 0.99 * *
700 * * * • * *
,
6o6l Apéndices
.• .
16 0.09 0.32 0.38 0.63 0.81 0.85 0.95 0.99 *
17
18
0.09
0.09
0.34
0.36
0.41
0.43
0.66
0.69
0.83
0.86
0.87
0.89
0.96
0.97
0.99
. •
• . • *
.
*
19 0.10 0.38 0.45 0.72 0.88 0.91 0.98
20
25
0.10
0.12
0.40
0.50
0.48
0.58
0.75
0.85
0.90
0.96
0.93
0.97
0.99
.. ..• .•• ..•
30
35
0.13
0.15
0.59
0.67
0.68
0.75
0.92
0.95
0.98
0.99
..
0.99
.• • .. • •
40
45
0.17
0.19
0.73
0.79
0.81
0.86
0.98
0.99
.. •
*
.. .. ..
* *
.
... ..• ... .. ...
50 0.21 0.84 0.90 0.99 •
60 0.25 0.90 0.95 •
..• .
~
... .
90 0.37 0.98 0.99 • *
100
120
0.40
0.48
0.99
.. ..
*
•
•
•
.. . .• ..•
140
160
0.55
0.61 .. .. ... ..
•
.
•
.• .• . ..
180
200
0.67
0.72 .. .. .. .•
*
400
500
0.98
•
•
• • .• .• •
• .• •
6081 Apéndices
10
9 0.07
0.07
0.21
0.23
0.24
0.27
0.43
0.48
0.60
0.66
0.65
0.71
0.82
0.87
0.92
0.95
0.98
0.99 .
0.99
11
12
0.08
0.08
0.26
0.28
0.30
0. 33
0.53
0.57
0.71
0.76
0.76
0.80
0.90
0.93
0.97
0.98
0.99
* .•
13 0.08 0.31 0.36 0.62 0.80 0.84 0.95 0.99 * *
14
15
0.09
0.09
0.33
0.36
0.39
0.42
0.66
0.70
0.83
0.86
0.87
0.90
0.97
0.98
0.99
. •
*
•
*
..
16 0.09 0.38 0.45 0.73 0.89 0.92 0.98 * •
17
18
0 ..10
0.10
0.41
0.43
0.48
0.51
0.76
0.79
0.91
0.93
0.94
0.95
0.99
0.99 .• *
.
* *
..
19
20
0.11
0.11
0.45
0.48
0.53
0. 56
0.82
0.84
0.94
0.95
0.96
0.97
*
*
*
.. .
*
.
25
30
0.13
0.15
0.59
0.69
0.68
0.77
0.92
0.97
0.99
• .
0.99
..
*
. * *
.
... . .
35 0.17 0.76 0.84 0.99 * * * •
40 0.19 0.83 0.90 0.99 * * *
45
50
0.22
0.24
0.88
0.91
0.93
0.96
*
.. •
.
* .• ..• *
.. ..•
60
70
0.29
0.34
0.96
0.98
0.98
0.99 .. .
* .• *
•
.. ..• ..• ..•
80
90
0.38
0.43 .
0.99
..
*
. *
*
.
.. . .. .•
100 0.48 * * * * • * •
120
140
0.56
0.64
*
* .• * .• .
•
*
.. .
•
160
180
0.71
0.77 ..
* *
.. .• ..
*
..• •
* *
•
.
•
.
*
200 0.82 * * *
300
400
0.95
0.99
.
•
* .• .• •
.
* .• ..• .• ..• •
.
*
500 * • • • *
r Tablas de poder l6o9
Tabla AXV.5. Poder de una razón F en el análisis de varianza.
Ul g) gl del tratamiento = 7 (n es el número de personas en cada condición para un diseño
entre sujetos).
Tamaño del efecto (r¡ 2 )
n 0.01 0.05 0.059 0.10 0.138 0.1.5 0.20 0.25 0.30 0.35
3 0.06 0.09 0.09 0.13 0.17 0.19 0.26 0.34 0.44 0.54
4 0.06 0.10 0.12 0.18 0.25 0.27 0.39 0.51 0.64 0.76
5 0.06 0.12 0.14 0.23 0.33 0.37 0.51 0.66 0.79 0.88
6 0.06 0. 15 0. 17 0.29 0.41 0.46 0.63 0.77 0.88 0.95
7 0.07 0. 17 0.20 0.35 0.49 0.54 0.72 0.85 0.94 0.98
8 0.07 0.19 0.23 0.40 0.57 0.62 0.80 0.91 0.97 0.99
9 0.07 0.22 0.26 0.46 0.64 0.69 0.85 0.95 0.99
10 0.08 0.25 0.29 0.51 0.70 0.75 0.90 0.97 0.99
11 0.08 0.27 0.32 0.56 0.75 0.80 0.93 0.98
12 0.08 0.30 0.36 0.6 1 0.80 0.84 0.95 0.99
13 0.09 0.33 0.39 0.66 0.84 0.88 0.97 0.99
14 0.09 0.35 0.42 0.70 0.87 0.90 0.98
15 0.09 0.38 0.45 0.74 0.90 0.93 0.99
16 0.1 0 0.41 0.48 0.77 0.92 0.94 0.99
17 0. 10 0.43 0. 51 0.80 0.94 0.96 0.99
18 0.11 0.46 0.54 0.83 0.95 0.97
19 0.1 1 0.49 0.57 0.85 0.96 0.98
20 0.1 1 0.51 0.60 0.87 0.97 0.98
25 0.1 3 0.63 0.72 0.95 0.99
30 0.1 6 0.73 0.81 0.98
35 0.1 8 0.80 0.88 0.99
40 0.20 0.86 0.92
45 0.23 0.91 0.95
50 0.26 0.94 0.97
60 0.31 0.97 0.99
70 0.36 0.99
80 0.41
90 0.46
100 0. 51
120 0.60
140 0.68
160 0.75
180 0.81
200 0.85
300 0.97
400 0.99
500
6101 Apéndices
-
n 0.01 0.05 0.059 0.10 0.138 0.15 0.20 0.25 0.30 0.35
3 0.06 0.09 0.10 0.15 0.20 0.22 0.31 0.42 0.53 0.65
4 0.06 0.11 0.13 0.21 0.30 0.33 0.47 0.61 0.75 0.86
5 0.06 0.14 0.16 0.27 0.40 0.44 0.61 0.76 0.88 0.95
6 0.07 0.17 0.19 0.34 0.50 0.54 0.73 0.87 0.95 0.98
7 0.07 0.19 0.23 0.41 0.59 0.64 0.82 0.93 0.98
8 0.07 0.22 0.27 0.48 0.67 0.72 0.88 0.96 0.99
9 0.08 0.26 0.31 0.55 0.74 0.79 0.93 0.98
10 0.08 0.29 0.35 0.61 0.80 0.84 0.96 0.99
11 0.08 0.32 0.39 0.66 0.85 0.88 0.97
12 0.09 0.35 0.42 0.71 0.88 0.92 0.98
13 0.09 0.39 0.46 0.76 0.91 0.94 0.99
14 0.10 0.42 0.50 0.80 0.94 0.96
15 0.10 0.45 0.54 0.83 0.95 0.97
16 0.11 0.48 0.57 0.86 0.97 0.98
17 0.11 0.52 0.61 0.89 0.98 0.99 *
18 0.12 0.55 0.64 0.91 0.98 0.99 * *
19 0.12 0.57 0.67 0.92 0.99 0.99
20 0.13 0.60 0.70 0.94 0.99 *
25 0.15 0.73 0.81 0.98 * *
30 0.18 0.82 0.89 0.99 *
35 0.21 0.89 0.94 *
40 0.24 0.93 0.97 *
45 0.27 0.96 0.98
50 0.30 0.98 0.99
60 0.36 0.99 *
70 0.43 *
80 0.49
90 0.55
100 0.60
120 0.70
140 0.78 *
160 0.84 *
180 0.89
200 0.92
300 0.99
400
6121 Apéndices
.
5 0.06 0.08 0.11 0.15 0.20 0.26 0.36 0.49 0.70 0.85 0.99
0.06 0.09 0.13 0.18 0.24 0.33 0.46 0.62 0.83 0.95
~10.07 0.10 0.14 0.21 0.29 0.40 0.55 0.73 0.91 0.98
1
'
____________________________Th_b_la_s_d_e~p_o_de_r__________________~~
..
4 0.05 0.05 0.05 0.07 0.09 0.12 0.16 0.22 0.36 0.50 0.79
5 0.05 0.05 0.05 0.08 0.11 0.16 0.23 0.35 0.56 0.75 0.97
..
.•
~
6 0.05 0.05 0.07 0.10 0.14 0.21 0.32 0.48 0.73 0.89
~ 7 0.05 0.05 0.08 0.12 0.18 0.27 0.40 0.59 0.84 0.96
.. ..
8 0. 05 0.06 0.09 0. 14 0.22 0.33 0.49 0.69 0.91 0.98
9 0.05 0.06 0.10 0. 17 0.26 0.39 0.56 0.77 0.95 0.99
. ..
10 0.05 0.07 0.12 0.19 0.30 0.44 0.63 0.83 0.98
11 0.05 0.07 0.13 0.21 0.33 0.50 0.69 0.88 0.99
. ..
12 0.05 0.08 0.14 0.24 0.37 0.55 0.74 0.91 0.99
13 0.05 0.08 0.15 0.26 0.41 0.59 0.79 0.94 * *
.
..
14 0.05 0.09 0.17 0.28 0.44 0.63 0.82 0.96
... ...
15 0.05 0.10 0.18 0.30 0.47 0.67 . 0.86 0.97 * *
16 0.05 0.10 0.19 0.33 0.51 0.71 0.88 0.98
...
17 0.05 0.11 0.20 0.35 0.54 0.74 0.90 0.99
18 0.05 0.1 1 0.22 0.37 0.57 0.77 0.92 0.99
.. .. ..
..
19 0.05 0.12 0.23 0.39 0.59 0.79 0.94 0.99 *
. ...
20 0.06 0.12 0.24 0.41 0.62 0.82 0.95
. ... .. ...
25 0.06 0.15 0.30 0.51 0.73 0.90 0.98
..
30 0.07 0.1 8 0.36 0.60 0.82 0.95 0.99
.. ... .
35 0.08 0.20 0.41 0.67 0.88 0.98
... ..
40 0.09 0.23 0.47 0.73 0.92 0.99 *
45 0.09 0.26 0.52 0.79 0.95 0.99
.. .. ..
.. ..
50 0.10 0.28 0.56 0.83 0.97
..
*
... . ..
60 0.11 0.33 0.65 0.89 0.99
... .. .. .
70 0.13 0.38 0.72 0.94 0.99
. .
80 0.14 0.43 0.78 0.96
..
90 0.15 0.47 0.82 0.98 *
100 0.16 0.51 0.86
..
0.99
.
..
.
.. .. .. ..
*
...
..
110 0.18 0.55 0.89 0.99 * * * *
.. . .. ... ..
120 0.19 0.59 0.92
.. . ..
130 0.20 0.63 0.94
... ..
140 0.21 0.66 0.95 *
... .. .. .. ...
150 0.23 0.69 0.96
. ...
160 0.24 0.72 0.97 *
170 0.25 0.75 0.98
.. .. ... .
..
.. .. . . .
180 0.27 0.77 0.98
190 0.79 0.99
...
0.28 *
..
*
. .
200 0.29 0.81 0.99
... . .
*
300 0.41 0.94 * * * * * *
.. ..
400 0.52 0.98
.• . ..
600 0.69
700 0.75
. . ..
*
.. . .
. .. . . . .
800 0.81
900 0.85 *
. *
.
*
...
1000 0.89 •
,
6141 Apéndices
..
0.98
0.98
..
• .
0.99
.
..•
100 0.13 0.22 0.52 0.85 0.94 0.97
. . ..
... .•
120 0.15 0.26 0.60 0.91 0.97 0.99
150 0.18 0.32 0.71 0.96 0.99
.. ..• ..• ..
... ..•
200 0.23 0.42 0.84 0.99
250
500
0.28
0.51
0.51
0.82 ..
0.91
..• . ..
750
1000
0.70
0.82
0.95
0.99 . . .• .• .• .• .
- _____________________________Ti_a_bl_as_d_e~po_d_e_r__________________~~
...
80 0.10 0.15 0.37 0.69 0.82 0.88 0.97 0.99
100
120
0.11
0.13
0.19
0.22
0.45
0.53
0.80
0.87
0.91
0.95
0.95
0.98 ..
0.99
.. ..
150
200
0.15
0.19
0.27
0.36
0.64
0.78
0.94
0.98
.. ..
0.98
...
0.99
.. ... .. ...
.. .. .. ..
-
250 0.24 0.44 0.87
500 0.45 0.76
.. ... ... ...
.. .. .. ..
750 0.63 0.92
1000
1250
0.77
0.86
0.97
0.99 .
Cuatro variables predictoras
Tamaño del efecto (R2)
n 0.01 0.0196 0.05 0.10 0.13 0.15 0.20 0.25 0.26 0.30
15 0.06 0.06 0.08 0.11 0.14 0.16 0.20 0.26 0.28 0.33
20 0.06 0.07 0.09 0.15 0.19 0.22 0.30 0.39 0.41 0.50
30 0.06 0.07 0.13 0.23 0.30 0.36 0.49 0.63 0.65 0.75
40 0.07 0.09 0.16 0.32 0.42 0.49 0.65 0.79 0.82 0.89
50 0.07 0.10 0.20 0.40 0.53 0.61 0.78 0.89 0.91 0.96
60 0.08 0.11 0.24 0.49 0.62 0.71 0.86 0.95 0.96
..
0.98
...
80 0.09 0.14 0.32 0.63 0.78 0.85 0.95 0.99 0.99
100
120
0.10
0.11
0.17
0.20
0.40
0.48
0.75
0.83
0.87
0.93
0.93
0.97 ..
0.99
..• ..
150
200
0.13
0.17
0.24
0.32
0.59
0.73
0.92
0.98 ..
0.98
..
0.99
.. .. ... ..
.. ... .. .. .. ..
250 0.21 0.40 0.84 0.99
500
750.
0.40
0.58
0.72
0.89 ..
0.99
.. .. .. .. ... ..
1000
1250
0.72
0.83
0.96
0.99 . .
6161 Apéndices
·- 20
30
40
0.05
0.05
0.06
0.06
0.06
0.07
0.07
0.08
0.10
0.09
0.13
0.18
0.10
0.16
0.24
0.11
0.19
0.29
0.14
0.26
0.41
0.18
0.35
0.55
0.18
0.37
0.57
0.22
0.45
0.68
50 0.06 0.07 0.13 0.24 0.33 0.39 0.55 0.70 0.73 0.83
60 0.06 0.08 0.15 0.30 0.41 0.49 0.67 0.81 0.84 0.91
80 0.07 0.10 0.20 0.43 0.57 0.66 0.84 0.94
..
0.95
..
0.98
..
100 0.08 0.11 0.26 0.55 0.71 0.79 0.93 0.98 0.99
120 0.08 0.13 0.32 0.66 0.81 0.88 0.97
..
... ... ...
150 0.10 0.16 0.41 0.78 0.91 0.95 0.99
..
... ..
200 0.12 0.21 0.55 0.91 0.98 0.99
250 0.14 0.26 0.67 0.97
.. ..
..
... .. .
-
500 0.27 0.54 0.96
750
1000
0.41
0.55
0.76
0.89
. .. .. .. •
.. ..
•
...
1250
1500
0.67
0.77
0.95
0.98 .. .. . .. . . . .
1750 0.84 0.99 •
..
0.98
0.97
..
...
120 0.08 0.12 0.29 0.61 0.77 0.85 0.96 0.99
150 0.09 0.14 0.37 0.74 0.88 0.94
..
0.99
..• .
... ..
200 0.11 0.19 0.51 0.89 0.97 0.99
250
500
0.13
0.25
0.24
0.50
0.63
..
0.95 ..
0.96
...
0.99
Para usar las tablas es necesario decidir un número inicial eligiendo una fila y una colum-
na; por ejemplo, la 7 y la 1O, en ese orden. Se seleccionan a continuación los números de
la magnitud adecuada. Por tanto, si éstos se hallan entre O y 99, ios primeros tres serían 66,
74 y 13. Considérese 03 como si fuera 3.
Columna
Fila 1 2 3 4 5 6 7 8 9 10 11 1213 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 11
1 2 4 1 3 o 3 6 3 7 8 o 3 S 7 2 3 5 3 6 5 7 4 2 8 7 S 8 1 5 o
2 4 3 1 3 8 2 7 7 6 1 4 8 2 4 4 5 7 3 5 8 6 3 5 5 2 o 7 4 5 4
3 7 1 6 4 7 3 5 6 7 2 2 1 3 o 2 4 6 5 4 4 o o 8 2 5 2 8 o 8 6
4 6 2 o 5 3 o 3 o 5 4 8 6 5 8 6 1 6 7 8 3 5 o 1 8 6 4 8 1 o 4
5 1 3 8 3 7 1 2 5 5 6 3 4 o 4 5 5 1 o 2 4 8 3 5 7 6 6 2 3 6 3
6 8 4 S 2 4 7 2 4 7 5 4 5 o 2 3 6 6 4 4 2 7 5 3 2 o 8 1 2 5 o
7 1 7 o o 5 6 3 4 5 6 6 7 4 1 3 4 6 4 8 5 1 6 o 8 3 o o 8 7 7
8 1 8 o 3 1 2 8 6 6 o 6 1 6 4 6 1 3 8 6 1 5 3 4 1 6 2 o 4 5 5
9 1 4 8 6 2 4 2 2 4 o 7 7 7 6 1 8 7 o 1 o 4 1 1 2 o 7 1 1 o 3
10 6 2 o 3 5 2 2 7 o 3 8 8 7 3 8 6 5 2 7 3 1 8 3 2 7 2 1 2 2 o
11 8 1 6 1 7 2 1 o o o 2 4 8 o o 7 1 3 o 1 2 7 2 1 3 4 8 5 4 5
12 o 1 7 o 7 5 8 2 3 o 3 7 5 1 4 6 6 8 1 3 5 4 7 5 1 5 7 S 4 8
13 1 5 5 o 6 o 8 5 2 4 7 2 5 7 2 4 6 1 6 8 7 o 2 o 2 8 4 4 4 7
14 2 4 2 1 1 1 2 7 8 4 1 2 2 5 7 7 2 6 1 5 5 7 6 5 2 7 1 4 5 6
1S 5 3 8 4 5 4 1 o 4 o 1 6 1 4 3 o 4 o 2 1 7 S o 1 5 7 S S 2 S
16 o 7 1 7 3 5 2 o 7 3 7 2 2 6 8 7 4 7 1 2 4 2 o 2 o 4 2 4 6 1
17 7 8 o 7 4 4 4 5 o 7 2 1 7 1 1 1 7 2 2 2 3 4 7 4 3 4 7 5 o 6
18 2 6 6 7 4 3 6 1 6 2 2 5 3 4 o 7 3 3 o 7 5 4 2 4 4 5 4 7 o 7
19 4 3 5 o 6 6 8 5 8 4 o 8 6 7 o 4 o 3 7 1 5 8 3 8 1 2 6 4 6 8
20 1 2 5 3 2 o o 2 1 o 1 5 2 8 7 7 2 5 7 6 8 3 1 5 3 o 8 8 o 3
21 o 4 4 5 5 1 o 3 3 4 2 o 6 7 6 7 3 1 2 3 5 6 8 5 8 2 o S 6 2
22 2 7 8 7 o o 5 6 1 6 8 3 8 3 6 2 8 7 5 3 2 5 5 6 6 o 4 7 4 1
23 4 o 8 3 o o 5 4 3 6 6 4 1 8 6 2 7 4 3 3 2 1 4 1 6 o 4 8 1 7
24 4 2 6 1 2 4 2 o 2 5 2 6 7 7 6 3 7 3 4 4 6 2 7 8 1 2 8 o 2 6
2S 1 2 8 2 2 6 6 8 4 o 2 1 6 6 2 2 4 2 o 8 6 8 o 8 o 1 4 6 6 6
26 4 3 3 3 2 8 6 o o 3 2 o o 3 8 4 4 4 o 4 6 o o 7 7 3 8 3 7 6
27 6 2 7 6 1 1 4 5 2 2 5 8 6 o 1 6 5 6 o S 3 2 6 2 6 6 3 8 2 6
28 o 4 6 3 o 2 6 2 4 4 8 8 6 5 o 6 o 6 3 o 4 4 8 o 5 4 o 8 o o
618
-
r ________________________________Tó_
ab_l_a_
s_d_iv_e_~_a_
s __________ ~
Columna
Fila 1 2 3 4 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 16 17 28 29 30
29 1 8 4 7 7 8 6 o o 3 7 8 1 4 5 4 3 3 o 7 8 o o 8 6 o 6 1 4 2
30 7 2 8 8 6 o 3 4 7 4 7 8 7 6 6 5 6 4 5 7 8 4 4 6 1 2 6 3 1 6
31 1 3 1 o 8 4 8 4 5 8 7 4 5 6 5 8 7 5 1 2 2 5 6 8 3 7 7 1 6 2
32 o 5 4 5 6 1 o 8 4 o 3 7 2 5 3 3 5 3 o 2 7 4 7 4 o 3 7 5 2 4
33 6 1 1 1 o 8 8 3 6 5 7 2 1 6 8 4 1 2 6 5 6 2 4 4 3 2 4 6 1 2
34 1 4 6 5 4 6 2 3 4 7 8 2 4 6 7 4 2 6 6 8 6 4 1 1 o 8 6 o 3 5
35 2 2 1 8 5 1 6 1 3 8 8 8 3 7 4 8 5 2 2 5 3 1 3 6 o 3 6 2 o 4
)6 o 4 4 5 7 8 7 4 o o 6 5 2 1 7 2 o 4 o 7 8 7 3 7 4 2 6 7 3 8
37 5 7 8 4 2 5 8 6 3 o 5 1 7 1 1 8 8 6 6 4 7 o 5 1 6 5 7 1 7 8
38 5 o 6 7 4 o 4 6 2 ) 6 5 7 3 8 o 2 4 3 4 o 4 5 1 1 5 2 o o 2
39 o 2 3 o 3 4 4 8 4 2 8 1 3 7 8 4 7 1 8 7 5 1 3 6 o 8 5 5 4 1
~ 5 3 o 1 4 1 7 6 4 1 8 8 4 2 3 4 8 7 2 8 o 2 1 3 8 4 2 1 o o
41 o 6 7 1 5 6 3 3 1 8 o 6 1 1 6 7 5 o 7 5 3 3 3 3 1 2 8 5 2
.,
4
42 6 1 8 6 1 5 6 7 2 5 3 6 4 3 o 2 4 4 5 8 2 3 5 8 2 1 2 3 o 3
43 o 4 1 8 7 6 2 7 3 5 6 8 1 1 5 6 4 4 3 7 3 o 1 7 7 3 8 5 7
44 o 1 1 7 6 7 5 2 1 7 3 6 8 3 o o 5 3 4 4 6 3 2 6 5 4 3 2 6 2
45 2 2 o 4 7 1 5 6 7 4 7 5 1 8 6 7 3 5 2 o o 7 1 7 3 o 6 8 6 6
46 8 2 7 5 2 5 2 6 4 1 5 4 o o 3 4 4 4 8 5 2 4 1 2 1 8 5 3 4 2
47 2 o 4 1 4 8 4 5 3 8 6 2 7 3 2 2 3 8 1 2 3 7 1 1 2 6 5 o 2 4
48 2 o 7 8 3 5 o 6 8 2 4 4 5 8 o 6 5 8 8 o 7 2 8 8 1 6 2 3 o 3
49 o 7 5 5 7 7 8 o 1 3 2 8 o 8 o 3 6 6 5 5 3 3 4 8 2 8 4 o 1 1
50 1 7 4 7 3 6 8 3 o 5 6 2 8 6 8 1 4 3 7 o 5 2 2 6 8 1 8 2 5 5
51 7 1 3 3 4 2 1 8 o 5 4 3 2 2 3 3 7 6 1 o 8 3 1 1 5 o 8 8 o 6
52 5 4 7 6 6 6 4 o 2 4 4 2 2 o 6 8 1 1 6 3 4 2 o 2 1 7 6 o 4 2
53 7 4 6 o 7 4 5 o 1 6 7 1 1 o 1 3 2 4 1 2 2 6 6 4 3
-
8 8 3 8 8
54 3 o 7 2 3 8 6 4 6 4 1 8 o 6 4 3 o 6 2 6 5 4 3 7 2 2 5 o 1 4
55 o 1 o 2 o 7 1 6 5 3 2 o 1 4 4 5 8 5 7 o 4 8 4 7 5 5 6 4 8 7
56 8 3 6 4 7 2 8 6 1 8 5 7 6 8 o 2 6 7 6 7 5 7 6 2 7 7 o 3 4 7
57 2 8 7 o 4 6 3 8 8 3 2 5 2 5 3 6 3 2 7 7 2 8 8 3 6 1 3 2 8 8
58 6 5 o 4 6 o 7 4 8 6 6 3 2 1 7 1 o 2 o 1 o 7 6 8 7 4 2 1 3 6
59 3 7 2 3 4 3 3 6 5 5 o 8 1 2 1 5 3 5 2 2 3 3 7 3 7 4 2 8 5 2
60 8 5 6 7 3 5 3 4 3 4 6 3 o 6 2 3 1 o 8 3 1 6 2 2 o 2 o 3 o 4
61 7 1 8 4 7 6 o 8 1 1 1 5 2 6 6 7 7 8 4 1 o 1 8 3 1 5 2 1 7 o
62 o 5 4 3 3 3 4 7 1 6 7 5 2 8 7 1 8 3 1 o 2 1 6 6 5 7 7 5 5 7
63 5 2 5 o 3 1 8 5 6 5 5 7 1 3 7 6 4 5 o 8 5 8 6 8 8 8 o o 2 8
6<1 4 2 2 2 o 1 3 o 3 6 1 o o 7 5 8 2 6 1 1 4 8 1 1 1 2 4 4 4 4
65 5 5 2 3 8 3 o 1 6 6 5 8 8 o 5 4 5 7 6 1 3 3 7 2 6 6 4 6 6 8
66 6 3 1 8 3 1 7 2 2 3 7 5 8 7 1 4a 36 2 6 1 1 5 3 8 4 5 2 3
67 7 2 2 7 2 4 7 2 7 5 7 8 4 5 5 o 2 6 6 6 8 6 5 8 1 7 6 5 o 4
68 3 1 1 6 3 4 7 1 1 5 o 5 6 6 o 5 3 a o 6 5 6 5 5 4 2 2 8 6 3
69 1 2 3 5 6 o 1 6 1 3 3 8 7 6 6 6 7 5 o 2 o 5 o 4 1 7 6 4 8 8
70 7 o 2 3 6 3 4 7 4 2 4 8 1 4 o 8 7 8 5 2 1 o 7 7 7 o 4 1 7 3
71 1 3 2 1 8 1 5 6 6 2 5 5 4 3 1 o 8 3 o 7 4 2 7 5 5 2 8 o 5 2
n 5 6 1 6 2 2 7 o o 3 8 1 3 3 1 o o 2 4 1 2 6 7 4 8 3 4 3 7 5
73 6 o 5 1 1 3 6 1 7 o 5 7 3 3 8 6 6 1 a 6 4 3 6 1 7 8 1 2 o 2
H 8 7 6 o o 8 5 4 o 3 2 6 7 5 1 6 4 5 8 8 1 2 4 8 4 2 4 1 8 1
75 1 3 7 2 2 o 1 3 2 7 5 1 8 5 3 6 6 1 7 3 4 6 4 2 6 4 4 8 2 1
76 8 6 7 3 8 1 3 7 o 4 8 7 3 3 8 7 3 o 5 o 8 6 3 4 6 6 2 3 o 2
77 o 4 6 8 1 2 8 6 2 8 o 1 8 3 3 8 5 8 6 4 2 1 5 2 8 5 1 4 7 3
78 6 8 8 7 4 3 5 8 4 2 8 4 4 6 2 4 7 o 2 o 5 4 4 7 2 o o o 1 o
79 6 3 4 5 4 4 6 3 8 8 o o 5 6 8 7 6 o o 7 o 3 3 5 6 5 5 7 8 1
80 3 o 1 3 2 2 8 1 o 6 1 5 7 8 8 3 1 6 o 8 7 4 5 2 1 8 5 4 4 3
81 7 1 4 6 4 1 3 2 o o 7 4 2 o 5 2 8 6 4 2 5 6 6 3 o 2 6 4 5 7
82 8 3 8 4 8 3 6 o 5 8 1 5 5 3 8 3 8 4 8 4 o 5 1 3 o 8 5 4 4 6
83 6 3 6 7 2 5 1 3 6 7 8 7 5 8 6 6 5 6 6 2 o 8 8 7 8 7 5 5 7 5
84 6 8 5 5 2 3 4 1 5 6 5 3 3 6 8 1 o 2 6 5 3 8 5 5 3 6 8 7 o 8
85 2 7 3 4 4 o 2 6 5 4 4 4 1 5 8 3 6 2 4 6 2 2 2 5 4 8 1 1 1 o
86 1 8 7 1 3 4 1 7 5 5 o 2 8 2 8 6 8 4 o 7 2 2 6 2 1 7 2 2 5 6
87 3 o 8 1 1 5 1 1 5 8 6 7 1 1 7 5 3 3 8 4 1 6 8 7 6 8 3 4 8 7
88 2 5 5 4 4 2 1 8 o 2 1 6 4 4 2 7 7 1 2 5 2 o 3 2 5 o 4 o 1 6
89 7 3 7 4 4 5 2 1 2 1 2 1 8 2 7 o 7 5 2 6 8 4 5 4 1 3 4 6 3 6
90 o 5 o o 1 7 3 6 7 2 8 3 7 8 7 4 3 o 2 4 5 1 5 3 o 7 5 1 5 6
91 1 6 4 2 7 2 6 1 7 8 6 3 4 o 6 6 o 4 3 8 4 2 6 5 5 o 2 5 o 4
92 7 4 6 4 5 7 3 5 4 7 o o 3 7 1 o 1 8 1 4 o 2 5 o 1 4 o 4 2 1
93 8 6 6 1 7 1 3 8 o 7 5 1 3 4 5 1 3 8 3 6 6 4 o 6 5 8 2 6 5 1
94 3 3 7 7 2 4 8 3 1 1 2 6 7 7 7 7 1 1 5 2 4 3 3 1 7 4 3 5 1 4
95 5 8 6 8 3 3 o 5 o 6 3 8 5 5 o 8 5 3 4 8 8 4 4 2 1 6 8 2 4 1
96 1 3 3 1 8 7 8 8 3 3 o 6 8 6 5 3 4 7 2 8 6 4 1 6 3 4 2 6 1 7
97 7 7 6 2 4 4 3 1 7 5 1 1 5 4 1 6 o 3 8 o 6 3 4 5 8 3 8 o 7 4
98 3 6 4 5 1 7 6 1 6 1 5 3 8 4 7 6 3 5 3 5 5 o 8 2 1 8 6 o 3 4
99 o 8 3 5 6 1 4 1 8 7 2 6 2 3 5 2 4 o a 3 7 5 6 6 8 8 o 4 8 3
100 4 3 6 4 4 8 1 8 o 8 2 5 2 2 3 4 4 6 a 3 4 8 4 o 5 2 2 1 1 3
620lL------------------------~A~p~én~d~ic=e=s______________________________
Ec. AXVI.l
y
2:(c) = O Ec.AXVL2
donde a es un ,·alor algebraico (una constante) que nos sir\'e para calcular cada cj
j es el nivel de la VI
cj es el coeficiente de laj media
C¡ - a+ 1
c2 = a+2
e, = a+3
.)
3a + 6 = O
Por tanto,
a= - 2
lo cual significa que C¡ = -2 + 1 =
c.,= - 2 1-2 =o
e,=
_, 2+ 3= 1
______________________________l_a_b_la_s_d_iv_e_rs_a_s____________________~~
-
donde X es el \·alor del nivelj-ésimo de la VI
y la ecuactón AX\'I.2 se toma en
Ec. AXVI.4
't a-+5
e~ - a+ 12
- y de la AXVI.4
c 3 = a -r 20
l:.n consecuencia,
SO x a+ 730 =O
27
c3 -
5
Para simpliticar los cálculos de la prueba de tendencia lineal. podemos multiplicar cada
coetkiente por 5 para com ertirlos en números enteros.
62:ZlL________________________~A~p~én~d~ic~e~s______________________________
Con intervalos desiguales y tamaños de muestra iguales. De haber intervalos desiguales
y tamaños de muestra iguales, podemos usar las ecuaciones AXVI.3 y AXVI.2. Por tanto,
si en el ejemplo anterior esos tamaños hubiesen sido iguales, tendríamos que, a partir de la
primera de dichas ecuaciones:
e 1 =a+ 5
e2 = a + 12
e3 =a + 20
y de la segunda:
3 x a + 37 = O
en cuyo caso:
-37
a= -
3
Por ende, a partir de la ecuación AX.VI.3:
. -22
3
-1
e = -
2 3
23
e = -
3 3
Con intervalos iguales y tamaños de muestra desiguales. En caso de tener intervalos igua-
les y tamaños de muestra desiguales, necesitamos las ecuaciones AXVI.l y AXVI.4. De ahí,
e 1 = a+ 1
c2 = a+ 2
c3 = a + 3
10 x (a + 1) + 15 x (a + 2) + 25 x (a+ 3) = O
lo cual significa que:
50 x a+ 115 =O
· Por consiguiente,
-115 -23
a= so 0
lO
_______________________________
Ta_b_la_s_d_iv_e_~_a_s____________________~~
En tal caso:
-13
el =w
-3
c2 = 10
7
c3 = 10
Podemos multiplicar cada coeficiente por 1O para simplificar los cálculos de la prueba de
tendencia.
30 x a + 55= O
y
-55 - 11
a= -o-
30 6
6 lineal -5 -3 1 1 3 5 70
cuadrática 5 -1 -4 -4 1 5 84
cúbica -5 7 4 4 7 5 180
7 lineal 3 -2 -1 o 1 2 3 28
cuadrática 5 o -3 -4 3 o 5 84
cúbica 1 1 1 o 1 1 1 6
8 lineal -7 5 - 3 -1 1 3 5 7 168
cuadrática 7 1 -3 -5 5 -3 1 7 168
cúbica -7 5 7 3 3 -7 -5 7 264
9 lineal -4 - 3 -2 1 o 1 2 3 4 o 60
cuadrática 28 7 - 8 17 20 - 17 - 8 7 28 2772
cúbica 14 7 13 9 o -9-13 -7 14 990
10 lineal -9 -7 -5 -3 1 1 3 5 7 9 330
cuadrática 6 2 -1 3 -4 -4 - 3 - 1 2 6 132
cúbica -42 14 35 31 12 12 - 31 35 14 42 8580
Ello significa calcular el valor de ( ~ ~:), calcular el logaritmo de la base e del resultado (el
logaritmo natural que suele aparecer como LN o ln en las calculadoras) y multiplicar el re-
sultado por 0.5.
Por ejemplo, sir= 0.7, entonces:
1 07
r' = 0.5 x lo ( + · )
ge 1-0.7
Conversión de r' en r
e(2xr')_
1
r
e
(2 x r') + 1
e(2x08673) _
1
r
(2 X 0.8673)
e +1
e(i7346) _
1
e(i7346) +
1
5.6667 -1
5.6667+1
4.6667
6.6667
= 0.7
6261 Apéndices
0.000 0.000 0.200 0.203 0.400 0.424 0.600 0.693 0.800 1.099
0.005 0.005 0.205 0.208 0.405 0.430 0.605 0.701 0.805 1.113
0.010 0.010 0.210 0.213 0.410 0.436 0.610 0.709 0.810 1.127
0.015 0.015 0.215 0.218 0.415 0.442 0.615 0.717 0.815 1.142
0.020 O.D20 0.220 0.224 0.420 0.448 0.620 0.725 0.820 1.157
0.025 0.025 0.225 0.229 0.425 0.454 0.625 0.733 0.825 1.172
0.030 0.030 0.230 0.234 0.430 0.460 0.630 0.741 0.830 1.188
0.035 0.035 0.235 . 0.239 0.435 0.466 0.635 0.750 0.835 1.204
0.040 0.040 0.240 0.245 0.440 0.472 0.640 0.758 0.840 1.221
0.045 0.045 0.245 0.250 0.445 0.478 0.645 0.767 0.845 1.238
0.050 0.050 0.250 0.255 0.450 0.485 0.650 0.775 0.850 1.256
0.055 0.055 0.255 0.261 0.455 0.491 0.655 0.784 0.855 1.274
0.060 0.060 0.260 0.266 0.460 0.497 0.660 0.793 0.860 1.293
0.065 0.065 0.265 0.271 0.465 0.504 0.665 0.802 0.865 1.313
0.070 0.070 0.270 0.277 0.470 0.510 0.670 0.811 0.870 1.333
0.075 0.075 0.275 0.282 0.475 0.517 0.675 0.820 0.875 1.354
0.080 0.080 0.280 0.288 0.480 0.523 0.680 0.829 0.880 1.376
0.085 0.085 0.285 0.293 0.485 0.530 0.685 0.838 0.885 1.398
0.090 0.090 0.290 0.299 0.490 0.536 0.690 0.848 0.890 1.422
0.095 0.095 0.295 0.304 0.495 0.543 0.695 0.858 0.895 1.447
0.100 0.100 0.300 0.310 0.500 0.549 0.700 0.867 0.900 1.472
0.105 0.105 0.305 0.315 0.505 0.556 0.705 0.877 0.905 1.499
0.110 0.110 0.310 0.321 0.510 0.563 Q.710 0.887 0.910 1.528
0.115 0.116 0.315 0.326 0.515 0.570 0.115 0.897 0.915 1.557
0.120 0.121 0.320 0.332 0.520 0.576 0.720 0.908 0.920 1.589
0.125 0.126 0.325 0.337 0.525 0.583 0.725 0.918 0.925 1.623
0.130 0.131 0.330 0.343 0.530 0.590 0.730 0.929 0.930 1.658
0. 135 0.136 0.335 0.348 0.535 0.597 0.735 0.940 0.935 1.697
0.140 0.141 0.340 0.354 0.540 0.604 0.740 0.950 0.940 1.738
0.145 0.146 0.345 0.360 0.545 0.611 0.745 0.962 0.945 1.783
0.150 0.151 0.350 0.365 o.5:;o 0.618 0.750 0.973 0.950 1.832
0.155 0.156 0.355 0.371 0.555 0.626 0.755 0.984 0.955 1.886
0.160 0.161 0.360 0.377 0.560 0.633 0.760 0. 996 0.960 1.946
0.165 0.167 0.365 0.383 0.565 0.640 0.765 1.008 0.965 2.014
0.170 0.172 0.370 0.388 0. 570 0.648 0.770 1.020 0.970 2.092
0.175 0.177 0.375 0.394 0. 575 0.655 0.775 1.033 0.975 2.185
0.180 0.182 0.380 0.400 0.580 0.662 0.780 1.045 0.980 2.298
0.185 0.187 0.385 0.406 0.585 0.670 0.785 1.058 0.985 2.443
0.190 0.192 0.390 0.412 0.590 0.678 0.790 1.071 0.990 2.647
0.195 0.198 0.395 0.418 0.595 0.685 0.795 1.085 0.995 2.994
0.999 3.800
•
-
Bibliografía
Abelson, R. P., Statistics as Principled Argument, Lawrence Erlbaum Associates, Hillsdale, Nueva
Jersey, 1995.
Agresti, A., Categorical Data Analysis, Wiley, Nueva York, 1990.
_ , An Introduction to Categorical Data Analysis, Wiley, Nueva York, 1996.
American Psychological Association, "Ethical principies of psy<..:hologists and code of conduct",
American Psychologist, núm. 47, PI?· 1597-1611, 1992.
Atkinson, R. C. y R. M. Shiffiin, "The control of short-term memory", en Scientific American, núm. 225,
pp. 82-90, 1971.
Bales, R. F., "A set of categories for analysis of small group interaction", American Sociological Re-
view, núm. i5, pp. 257-263, 1950.
Boden, M. A., Artificial Intelligence and Natural Man, 2a. ed. revisada, The MIT Press, Londres,
1987.
Bonge, D. R., W. J. Scbuldt y Y. Y. Harper, "Tbe experimenter-as-fixed-effect fallacy", The Journal
of Psychology, núm. 126 (5), pp. 477-486, 1992.
British Psycbological Society, Code of Conduct, Ethical Principies & Guidelines, The British Psy-
chological Society, Leicester, 1993.
Clark-Carter, D., "The account taken of statistical power in research published in the British Jour-
nal ofPsychology", British Journal ofPsychology, núm. 88, pp. 71 -83, 1997.
Cleveland, W. S., The Elements ofGraphing Data, Wadsworth, Monterey, California, 1985.
Cochran, W. G. y G. M. Cox, Experimental Designs, 2a. ed., Wiley, Londres, 1957.
Cohen, J., "The satistical power of abnormal-social psycho1ogical research: a review", Journal of
Abnormal and Social Psychology, núm. 65, pp. 145-153, 1962.
__, Satistical Power Analysis for the Behavioral Sciences, 2a. ed., Lawrence Erlbaum Associates,
Hillsdale, Nueva Jersey, 1988.
-
Danziger, K., Constructing the Subject, Cambridge University Press, Cambridge, 1990.
-----------------------------~~-----~16:U
~L_ __ __ _ _ _ _ _ _ __ __ _ _ __ _ _ _ _ _ _ _ og~r_a_fí_a_______________________________
B_ib_li_
Dixon, W. J. y F. J. Massey Jr., lntroduction to Statistical Analysis, 4a. ed., McGraw-Hill, Londres,
1983.
Ericsson, K. A. y H. A. Simon, "Verbal reports as data", Psychological Review, núm. 87, pp. 215-
251 , 1980.
Estes, W. K., "Mathematical models in psychology", en G. Keren y C. Lewis (eds.), A Handbookfor
Data Analysis in the Behavioral Sciences: Methodologicallssues, Lawrence Erlbaum Associa-
tes, Hillsdale, Nueva Jersey, 1993.
Eysenck, H. J. y L. Kamin, lntelligence: The Battle for Mind, Macmillan, Londres, 198 1.
Gregg, V. H., Introduction 10 Human Memory, Routledge, Londres, !986.
Hammersley, M. y P. Atkinson, Etlmography: Principies in Praclice, Tavistock Publications, Lon-
dres, 1983.
Harré, R., "The ethogcnic approach: theory and practice", en L. Berkowitz (ed.), Advances in Expe-
rimental Social Psychology, Academic Press, Londres, 1977. ·
Hewstone, M., W. Stroebe y G. M. Stcphcnsoo (eds.), Introduction lo Social Psychology, 2a. ed.,
Blackwell, Oxford, 1996.
Howell, D. C., Statistical Methodsfor Psychology, 4a. ed., Duxbury, Boston, 1997.
Huberty, C. J., Applied Discriminan! Analysis, Wiley, Nueva York, 1994.
Humphreys, G. y J. M. Riddoch, To See but notto Be Seen: A Case Study of Visual Agnosia, Law-
rence Erlbaum Associates, Hove, Reino Unido, 1987.
Kelly, G., The Psychology of Personal Constructs, Norton, Nueva York, 1955.
Kerlinger, F. N ., Foundations of Behavioral Research, 2a. ed., Holt, Rinehart & Winston, Londres,
1973.
Kline, P., The Handbook of Psychological Testing, Routledgc, Londres, 1993.
Luria, A. R., The Mind ofa Mnemonist, Penguin, Harmondsworth, 1975a.
_ , The Man with a Shattered World, Pcnguín. Harmondswonh, 1975b.
Maghsoodloo, S. y L. L. Palios, "Asymptotic behaviour ofKendall's partía! rank corrclatioo coeffi-
cient and additional quantile estimates", Joumal ofStafistical Computing and Simulation, vol. 13,
pp. 41 -48, 1981.
Manstead, A. S. R. y C. McCulloch, "Scx-role stereotyping in british te1evision advertisements", British
Journal of Psychology, núm. 20, pp. 171-180, 1981.
Marsh, P., E. Rosser y R. Harré, The Rules of Disorder, Routledge, Londres, 1978.
McGowan, L., D. C1ark-Carter y M. Pitts, "Chronic pe1vic pain: a meta-ana1ytic review", Psycho-
logy and health (en prensa).
Meddis, R., Statistics Using Ranks: A Unified Approach, Blackwell, Oxford, 1984.
M ilgram, S., Obedience to Authority. Tavistock Publications, Londres, 1974.
Miller, G. A., "Trends and debates in cognitive psychology", en A. M. Aitkenhead y J. M. Slack
(eds.), lssues in Cognitive Modelling. Lawrence Erlbaum Associates, Hove, Reino Unido, 1985.
Myers, J. L. y A. D. Well, Research Design and Statistical Analysis, HarperCollins, Nueva York,
1991.
Neave, H. R., Statistics Tables: For Mathematicians. Engheers, Economists and the Behavioral and
Management Sciences, Unwin Hyman, Londres, 1978.
_ , y P. L. Worthington, Distribution-Free Tests, Routledge, Londres, 1988.
Newell, A. y H. A. Simon, Human Problem Solving, Prenticc-Hall, Englewood C1iffs, Nueva Jersey,
1972.
___________________________________B_ib_li_o~g_ra_f_ía________________________~~
Nisbett, R. E. y T. D. Wilson, "Telling more than we can know: verbal reports on mental processes",
Psychological Review, núm. 84, pp. 231-259, 1977.
Ome, M . T., "On tbe social psychology ofthe psychological experiment: with particular reference to
demand cbaracteristics and their implications", American Psychologist, núm. 17 ( 11 ), pp. 776-
783, 1962.
Osgood, C. E., G. J. Suci y P. H. Tannenbaum, The Measurement of Mean.ing, University of lllinois
Press, Urbana, Illinois, 1957.
Pedbazur, E. J. y L. P. Schmelkin, Measuremen.t, Design. an.d An.alysis: An. Integrated Approach,
Lawrence Erlbaum Associates, Hillsdale, Nueva Jersey, 1991.
Pfungst, 0., Clever Hans: The Horse ofMr. Von Osten (traducido por C. L. Rahn), Holt, Rinebart &
Winston, Nueva York, 1911, 1965.
Pitts, M. y H. Jackson, "AJDS and the press: an analysis of tbe coverage of AIDS by Zimbabwe
oewspapers", AIDS Care, núm. 1 (l), 77-83, 1989.
Popper, K. R., The Logic of Scientific Discovery, 5a. reimpresión revisada, Hutcbinson, Londres,
1972.
_ , Conjectures and Refutations: The Growth of Scientific Knowledge, 5a. ed., Routledge, Londres,
1974.
Potter, J. y M . Wetberell, Discourse and Social Psychology, Sage, Londres, 1987.
Putnam, H., 'The 'corroboration' oftheories", en T. Honderich y M. Bumyeat (eds.), Philosophy as
it is, Penguin, Harmondsworth, 1979.
Robson, C., Real World Research: A Resource for Social Scientists and Practitioner-Researchers,
Blackwell, Oxford, 1993.
Rogers, C. R., Client-Centred Therapy, Constable, Londres, 1951.
_ , On Becoming a Person: A Therapist ~ View of Psychotheraphy, Constable, Londres, 1961.
Rosenthal, R., Meta-analytic Proceduresfor Social Research, Sage, Londres, 1991.
Rosnow, R. L. y R. Rosenthal, "Statistical procedures and the justification of knowledge in psycho-
logical science", American Psychologist, núm. 44 (1 0), pp. 1276- 1284, 1989.
Schlenker, B. R., "On the ethogenic approacb : etiquette and revolution", en L. Berkowitz (ed.), Ad-
vances in Experimental Social Psychology, Academic Press, Londres, 1977.
Sears, D. 0., "College sophomores in the laboratory: influences of a narrow data base on psycho-
logy's view ofhuman nature", Journal ofPersonality and Social Psychology, núm. 51, pp. 513-
530, 1986.
Schumacker, R. E. y R. G. Lomax, A Beginner ~ Guide to Structural Equation Modelling, Lawrence
ErlbaumAssociates, Mahwah, Nueva Jersey, 1996.
Sedlmeier, P. y G. Gigerenzer, "Do studies ofstatistical power have an effect on the power ofstudies?",
Psychological Bulletin, pp. 309-316, 1989.
Shaughnessy, J. J. y E. B. Zechmeister, Research Methods in Psychology, 3a. ed., McGraw-Hill, Lon-
dres, 1994.
Siegel, S. y N. J. Castellan, Nonparametric Statisticsfor the Behavioral Sciences, 2a. ed., McGraw-
Hill, Nueva York, 1988.
Soyland, A. J., Psychology as Metaph01; Sage, Londres, 1994.
Steiger, J. H., "Tests for comparing elements of a correlation matrix", Psychological Bulletin, núm.
87 (2), pp. 245-251' 1980.
Stenner, P. y H. Marshall, "A Q methodological study of rebelliousness", European Journal of So-
cial Psychology, núm. 25, pp. 621 -636, 1995.
~L__________________________ · b_li_og~r_a_fí_a_______________________________
Bl_
Stephenson, W., The Study of Behavior: Q-Technique and its Methodology, University of Chicago
Press, Chicago, 1953.
Stevens, J., Applied Multivariate Statistics jor the Social Sciences, 3a. ed., Lawrence Erlbaum Asso-
ciates, Mahwah, Nueva Jersey, 1996.
Sudman, S., Applied Sampling, Academic Press, Londres, 1976.
Suedfeld, P., Restricted Environmental Stimulation: Research and Clínica/ Applications, Wiley, Nueva
York, 1980.
Tabacbnick, B. G. y L. S. Fidell, Using Multivariate Statistics, 3a. ed., HarperCollins, Nueva York,
1996.
Valentine, E. R., Conceptual Issues in Psychology, 2a. ed., Routledge, Londres, 1992.
Winer, B. J., D. R. Brown y K. M . Michels, Statistical Principies in Experimental Design, 3a. ed., Mc-
Graw-H i11, Londres, 199 J.
Winter, D. A., Personal Construct Psychology in Clínica! Practice: Theory, Research and Applications,
Routledge, Londres, 1992.
Wright, P., "Writing and reading technical information", en J. Nicholson y B. Foss (eds.), Psycho-
logy Survey No. 4, British Psycbological Society, Leicester, 1983.
Zimmerman, D. W. y B. D. Zumbo, "The relative power ofparametric and non-parametric statistics",
en G. Keren y C. Lewis (eds.), A Handbook for Data Analysis in the Behavioral Sciences:
Methodological Issues, Lawrence Erlbaum Associates, Hillsdale, Nueva Jersey, 1993.
Índice onomástico
------------------------------------------------------~ 631
~L_______________________í~n~d~~·c~e~o~n~o~m~á~st~ic~o_____________________________
--
análisis
del componente principal (ACP), 359,
confirmatorio, 357, 360, 362
362
de conglomerados, 356, 362 del discurso, 11
de contenido, 99, 103-106 del proceso de interacción (API). Véase
definición, 8 observación
de covarianza. Véase ANCOVA discriminante, 354-355, 362
de covarianza multivariado. Véase descriptivo (ADD), 354-355
MANCOVA predictivo (ADP), 355
--------------------------------------------------------~ 633
6J4l~ _______________________ í_nd_i_ce
__an_a_ll_'t¡_·c_o____________________________
_...,
6}6l~_______________________Í_n d_i_c e__
a n_a_ll_'
t ¡_·c_o____________________________
-
modo, 117 definición, 5
desventajas, 118 definición, 2
promedio, 116 elección, 23
metaanálisis, 363-371, 535-547 experimental, 5
cálculo de un tamaño del efecto común, defmición, 3
536-538 observación. Véase observación
cálculo de una estadística de probabilidad definición, 4
común, 538-540 preguntas. Véase planteamiento de
clas ificación de estudios, 366 preguntas
combinación de probabilidades, 367, 544- definición, 3-4
545 razonamiento, 2
-
combinación de tamaños del efecto, 367, metodología Q, 94-96
543-544 métodos cualitativos, 2
comparación centrada, 369 definición, 2
definición, 8 ejemplos, 9-11
elección de la hipótesis por comprobar, métodos cuantitativos, 2
364 definición, 2
heterogeneidad de la probabilidad, 368, ejemplos, 3-9
542-543 mínima. Véase medidas de dispersión
heterogeneidad del tamaño del efecto, moda. Véase medidas de tendencia central
368, 540-542 modelación, 4, 360-362
homogeneidad de los estudios, 368 de ecuación estructural (MEE), 360-362
identificación de la investigación, 364 log-lineal, 351-352, 362
informe de resultados, 370-371, 383-384, modelo lineal general, 348
547 muestra
informes deficientes de estudios, 365, elección, 30-31, 80, 158-163, 408-409,
536 418-419
intervalo de confianza para el tamaño del muestras de probabi lidad. Véase muestreo
efecto, 369, 545 aleatorio
medición estándar de la probabilidad, 367 muestreo
medición estándar del tamaño del efecto, aleatorio. Véase muestreo aleatorio
367 no aleatorio. Véase muestreo no aleatorio
N fracaso-éxito, 369, 546-547 personas que no respondieron, 162
-
~~------------------------~~·n~d~~·c~e~a~n~a~lít~ic~o~----------------------------
muestreo aleatorio, I 59· I62 estructurada, 7-8, 101, 105-106
encuestas telefónicas, 160 etnografía, 1O, 1O1
estratificado, 161 etología, 1O1
desproporcionado, 161 infOimal, 101
proporcionado, 161 métodos de grabación, 102- 103
sistemático, 160-161 muestreo
muestreo de conglomerados, 161-162 continuo en tiempo real, 105
personas que no respondieron, 162 temporal de intervalo, 105
simple, 159 temporal de punto, 105
ventajas, 163 observador completo, 100
muestreo intencional. Véase muestreo no participante completo, l 00
aleatorio sistemática, 1Ol
muestreo no aleatorio, 162- 163 observación formal. Véase observación:
bola de nieve, 163 sistemática
dimensional, 163 observación participante. Véase observación:
muestra de cuota, 162- 163 etnografía
oportunidad, 162 ortogonalidad, 274-276, 492-493
prepositivo, 163
muestreo no probabilístico. Véase muestreo parámetros
no aleatorio definición, 157
multicolinealidad. Véase regresión estimación, 158, 195
multimodal, 118 pareado, 51
multivariable, 48, 350 igualación de precisión, 50
igualación de rango, 50
partición de tablas de contingencia, 497-500
niveles de las variables, 35
participantes
normal bivariable, 308-309
asignación, 49-54
normas, 169
elección, 30-31 , 39, 80-81, 158-163
números aleatorios
tratamiento, 14-16
tabla, 618-619
PCA. Véase análisis: del componente
principal
observación, 7-9, 100-106 placebo, 2
Análisis del Proceso d~ Interacción planteamiento de preguntas, 5-6
(API), 7, 106 ambientes, 74-80
casual, 101 anonimato de los encuestados, 76
ecológica, 1O1 confiabilidad de la medición, 87-88
el observador como participante, 100 control sobre el orden, 79-80
el participante como observador, 100 costo, 77-78
ít_ic_o____________________~j645
______________________________l_'n_dl_·c_e_a_na_l_
-
diferencial semántico, 96-97 tasa de respuesta, 75-76
dimensiones, 88-89 población, 158-159
diseño del cuestionario, 84-85 poder
duración de la entrevista, 77 ANOVA, 246-247, 271, 584,586-588,
efectos del entrevistador, 76-77 603-611
elección de Friedman, 250, 464
de los participantes, 80-81 de K.ruskal-Wallis, 249
del ambiente, 80 de una vía, 246
encuestas, 72-85 intrasujetos, 246-247, 587-588
por correo, 75-76 multifactorial, 586-587
telefónicas, 75, 160 x , 201 -202, 221 , 594-602
2